سلام:
برای تعیین تعداد لایه های پنهان و تعداد نرون های لایه های پنهان روش خاصی هیج جا ذکر نشده این کار با آزمون و خطا انجام می شه. یعنی از یک لایه پنهان با مثلا 10 نرون استفاده کنید و میزان خطای مدل رو استخراج کنید و در مرحله بعد تعداد نرون ها رو کمتر یا بیشتر کنید و به این ترتیب بهترین شبکه رو پیدا کنید.
درباره activation function بهترین تابع sigmoid هستش چون همه رفتارهای خطی و غیر خطی رو پوشش می ده.
برای انتخاب نرخ یادگیری یا learning rate و مومنتم (مفهوم لحظه ای) و وزن ها هم باید گفت انتخاب اینها کاملا تجربی است اما در منابع اشاره ای به این مقادیر شده و همه نرم افزارهای داده کاوی هم مقادیر اولیه ای برای این پارامترها دارند که پیشنهاد من به استفاده از این مقادیر ابتدایی هست.
__________________
همه چیز آخرش به او ختم می شود
|