رشتتون و سطح تحصیلاتتون رو می تونم بپرسم؟
اگر منظورتون از داده های UCI همون داده های دانشگاه کالیفرنیا هستش باید بگم که از این داده ها خیلی توی مقالات استفاده شده. برای مقالاتی که Casestudy هستند شاید به اگر برای مجلات معتبر بفرستید از داده هاتون ایراد بگیرند. اما خوبیه این پایگاه اینه که هر سال چند تا مجموعه داده جدید اضافه می کنه. البته سایت های دیگری نیز در این زمینه هستند.
نرم افزار weka یه مشکل اصلی داره اونم اینه که یکم الکی زیادی از رم کامپیوتر استفاده می کنه و بدتر از اون با داده هایی که خوب پاکسازی نشده اند کلا مشکل داره. اما از لحاظ تعداد الگوریتم ها و روش های داده کاوی تقریبا از همشون ساپورت می کنه.
پیشنهاد من برای شروع کار Clementine هستش. اینتر فیس این نرم افزار خیلی user friendly هستش و با داده های پاکسازی نشده و تبدیل نشده و ازدست رفته خیلی مشکل نداره ولی ضعف اصلیش اینه که تعداد الگوریتم هایی که ساپورت می کنه کمتره. البته اگر توی کلمنتین خبره بشید کار با بقیه برنامه ها خیلی آسون تر می شه. اگر از نرم افزارهای اپن سورس می خواهید استفاده کنید rapid miner هم خیلی بهتر از weka هستش. البته وکا هنوز توی open source ها جز بهترین هاست.
در خصوص پروژه عملی پیشنهاد می کنم خودت از امروز برو دنبالش. توی ایران فعلا مدیرانمون معنی میانگین رو نمی دونند چه برسه بتونند نتایج داده کاوی رو هضم کنند.
من خودم امروز بعد یه سال معلوم شد که یه پروژه خیلی خوب داده کاویم تصویب شده.
__________________
همه چیز آخرش به او ختم می شود
|