جواب سوالاتتون:
1- در
اینجا فرق بین calassification و clustering را توضیج داده ام.
3-ما کلا سه روش یادگیری داریم: باناظر-بدون ناظر و تقویتی
یادگیری supervised یا باناظر روشی است که در آن داده های نمونه که برای آموزش از آنها استفاده می کنیم، مقدار خروجی یا نوع خروجیشان مشخص است. و اصطلاحا میگیم که داده ها برچسب دارند. سیستم از طریق پیدا کردن ارتباط بین ورودی و خروجی های مرحله آموزش، یاد می گیرد که در آینده اگر داده های مشابه را دریافت کرد چه خروجیی به آنها اختصاص دهد.
ولی در یادگیری بدون ناظر مقدار خروجی داده های آموزش مشخص نیست.
4- روش هایی برای استخراج کلمات و عبارات از متن هستند.
5- ما همیشه برای مدل کردن مسئله از یک سری مشخصه هایی (Features ) استفاده می کنیم.
تعداد و نوع این مشخصه ها می تواند متفاوت باشد بستگی به این دارد که طراح چه مشخصه هایی را انتخاب می کند.
اگر تعداد این مشخصه ها زیاد باشد قطعا حجم عملیات بالا خواهد رفت ولی مدل بهتر مشخص می شود و اگر هم تعداد مشخصه ها کم باشند حجم محاسبات کم است ولی در عوض مدل زیاد دقیقی را نباید انتظار داشته باشیم.
روش هایی وجود دارد که بهترین ها را طوری انتخاب کنیم که هم تعدادشان زیاد نباشد و هم به خوبی مشخص کننده داده ها باشند که به این روش ها feature selection می گویند.
البته برای این کار از feature extraction هم استفاده می شود.
بقیه سوالهایتان هم باید کل مقاله را بخونم تا جوابتونو بدم.