![]() |
ذخیره ی داده برای وکا
سلام دوستان من برای پایان نامه ام دسته بندی متن از ig برای انتخاب ویژگی استفاده کرده ام که تو سی شارپ پیادش کرده ام حال میخوام برای دسته بندی ا ز وکا استفاده کنم و لی نمیدونم داده هام را به چه صورت تهیه کنم تا به عنوان ورودی به وکابدم اگه امکان داره راهنماییم کنین. با تشکر
|
سلام
توی این لینک در مورد Dataset های مربوط به وکا توضیح داده شده. امیدوارم به درد بخوره. Attribute-Relation File Format (ARFF) موفق باشی |
نقل قول:
@RELATION اینو همشون باید داشته باشن. ولی ویژگی هایی که با IG بدست آوردمو هرکدومو همراه با @attribute مینویسم و آخرین attribute هم کلاسهام هستند.بعد Data هارو می نویسم که مقدارشون TF خواهد بود یا IG؟یه سوال دیگه هم که داشتم اینه که داده های تستی رو کجا وچطور وارد میکنیم؟ممنون میشم سوالامو پاسخ بدین |
نقل قول:
سلام دوست عزیز @RELATION مربوط به معرفی داده مورد نظر میباشد. @attribute برای معرفی خصوصیت های مجموعه داده هستن. اما لزوما آخرین ویژگی کلاس رو مشخص نمیکنه. @Data : بعد از این تگ داده ها قرار میگیرند. ابعاد ویژگی در هر رکورد باید مطابق با ویژگی هایی باشد که در بخش Relation تعریف شده است. جداسازی داده های تست و آموزشی وابسته به استراتژی شما هستن. برای مثال اگر از روش Cross validation برای ارزیابی استفاده میکنید لینک زیر رو نگاه کنید. http://weka.wikispaces.com/Generatin...Java+approach) یکسری اطلاعات دیگه در مورد وارد کردن داده ها در وکا توی این لینک توضیح داده شده. حتما ببینید. http://weka.wikispaces.com/Text+cate...tion+with+WEKA موفق باشید |
سلام دوستان من داده های زیر رو دارم
weka دانلود ● آپلود سنتر قدرتمند | " صفر آپ دات آی آر " | آپلود | آپلود عکس | آپلود با لینک مستقیم | آپلود با حجم بالا | آپلود نامحدود | آپلود آهن و وقتی با rename به arff تبدیل می کنم و در وکا میخوام باز کنم صفحه زیر رو میاره http://0up.ir/do.php?imgf=136721418985361.jpg و وقتی اوکی میکنم اروره زیر رو میده میشه راهنماییم کنین؟ با تشکر http://0up.ir/do.php?imgf=136721418987662.jpg |
نقل قول:
سلام دوست من اول از همه این که در برنامه notepad برای ذخیره کردن داده های UTF8 یک کاراکتر خاصی اول فایل قرار میده که همین باعث میشه وکا نتونه فایل رو بخونه. برای همین بهتره از کاراکتر های فارسی در این فایل استفاده نکنی یا از برنامه notpad++ استفاده کنی. در ضمن در خط پنجم فایلت یه کاراکتر space در نام ویژگی وجود داره که باعث خطا میشه. كد:
@ATTRIBUTE word_freq_ شا Real موفق باشید |
نقل قول:
|
زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۰۹:۵۱ قبل از ظهر ميباشد. |
Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.