نمايش پست تنها
قديمي ۱۱-۶-۱۳۹۱, ۱۲:۱۴ بعد از ظهر   #2 (لینک دائم)
raha_hakhamanesh Male
Super Moderator
 
آواتار raha_hakhamanesh
 
تاريخ عضويت: خرداد ۱۳۸۷
محل سكونت: دنیا
پست ها: 281
تشكرها: 28
253 تشكر در 147 پست
My Mood: Zodranj
پيش فرض

با سلام
سوالتان کمی گنگ است من با زمینه فکری خودم پاسخ می دم.
تا جاییکه من اطلاع دارم متلب دستور خاصی برای دسته بندی ندارد (این فرآیند استاندارد نیست) بلکه ابزارهایی را فراهم کرده که در پروسه دسته بندی بسیار مفید هستند.

بطور کلی شما باید کارهای زیر رو انجام بدید:
1- داده های آموزشی (Train) را در قالب ساختاری مشخص و صریح تبدیل کنید مثلا فرض کنیم هر آیتم شما دارای 200 ویژگی می باشد و شما 10000 آیتم دارید پس بهتر است با دستوراتی که در متلب وجود دارد یا بوسیله کد اختصاصی خودتان آنها را به یک ماتریس 200*10000 تبدیل کنید. یعنی 10000 رکورد داشته باشید که هر رکورد مربوط به یک آیتم است و می دانیم هر آیتم مثلا 200 ویژگی دارد.

2- از یک الگوریتم یادگیرنده برای آموزش استفاده کنیم؛ معمولا تنوع این الگوریتم ها باعث می شود نتوان فقط یک راه حل را پیشنهاد داد و کاملا وابسته به هدف مسئله و نوع پروژه دارد (توجه داشته باشید که مسئله دسته بندی در کاربردها و علوم متنوعی استفاده می شود از زیر گرایش های هوش بگیرید تا رشته هایی همچون کشاورزی و ...، که من مقالاتی را در آنها دیده ام) - از جمله می توان به شبکه عصبی، svm، بوستینگ؛ Naive Bayesian و مواردی از این قبیل اشاره کرد.

3- حالا یادگیرنده می داند مثلا شی x دارای رکوردی به فرم مثلا y می باشد

4- باید یک (چند) نمونه آزمایشی (Test) تهیه و دقیقا به فرک داده های آموزشی تبدیل کنید یعنی هر رکورد دارای 200 ویژگی که در یک ردیف از یک ماتریس 200*1 ذخیره شده است، آن را به الگوریام یادگیرنده بدهید و بهترین پاسخ را دریافت کنید.

ملاحضات»
* مسلم است که ممکنه پاسخ غلط باشد به همین علت معمولا در مرحله آزمایش تعداد قابل توجهی نمونه را تست می کنیم تا بتوانیم اطلاعات آماری از میزان عملکرد الگوریتم مان بدست آوریم (مثلا بر حسب درصد) البته توجه داشته باشید در این خصوص متریک های استانداری همچون نمودار ROC موجود است که فرم علمی ارائه گزارش در این خصوص می باشد.

* معمولا وقتی میخواهیم داده ها را به دو بخش آموزش و آزمایش تقسیم کنیم پیشنهاد می شود حدود 60% کل داده ها را برای آموزش و 40% را برای آزمایش جدا کنیم و این بدیهی است که نباید داده ها با یکدیگر همپوشانی داشته باشند (یعنی هم در آموزش و هم در آزمایش استفاده شوند)

موفق باشید
__________________
.
.
.
برای تشکر دکمه مخصوص وجود دارد لطفا پست هرز ایجاد نکنید
.
.
اینقدر از دسترسی نداشتن به مقاله شیون نکنید

مقالات انگلیسی: ایران سای (ISI, IEEE, ACM)
مقالات فارسی: سیویلیکا (کنفرانس داخلی)
مقالات فارسی: مگ ایران (ژورنالهای داخلی)

ويرايش شده توسط raha_hakhamanesh; ۱۱-۶-۱۳۹۱ در ساعت ۱۲:۱۹ بعد از ظهر دليل: غلط املایی
raha_hakhamanesh آفلاين است   پاسخ با نقل قول
از raha_hakhamanesh تشكر كرده اند:
EhsanPardaz (۰۴-۲۳-۱۳۹۳), mary92 (۱۱-۱۲-۱۳۹۲), Milandini (۱۱-۶-۱۳۹۱), roozgard (۰۳-۱۷-۱۳۹۴)