Artificial Intelligence - هوش مصنوعی

Artificial Intelligence - هوش مصنوعی (http://artificial.ir/intelligence/)
-   دسته بندي (Classification) (http://artificial.ir/intelligence/forum112.html)
-   -   ذخیره ی داده برای وکا (http://artificial.ir/intelligence/thread11575.html)

talalo ۰۱-۲۴-۱۳۹۲ ۱۱:۱۸ قبل از ظهر

ذخیره ی داده برای وکا
 
سلام دوستان من برای پایان نامه ام دسته بندی متن از ig برای انتخاب ویژگی استفاده کرده ام که تو سی شارپ پیادش کرده ام حال میخوام برای دسته بندی ا ز وکا استفاده کنم و لی نمیدونم داده هام را به چه صورت تهیه کنم تا به عنوان ورودی به وکابدم اگه امکان داره راهنماییم کنین. با تشکر

babak_1234 ۰۱-۲۴-۱۳۹۲ ۰۴:۵۲ بعد از ظهر

سلام

توی این لینک در مورد Dataset های مربوط به وکا توضیح داده شده. امیدوارم به درد بخوره.

Attribute-Relation File Format (ARFF)

موفق باشی

talalo ۰۱-۲۵-۱۳۹۲ ۰۹:۳۲ قبل از ظهر

نقل قول:

نوشته اصلي بوسيله babak_1234 (پست 28273)
سلام

توی این لینک در مورد Dataset های مربوط به وکا توضیح داده شده. امیدوارم به درد بخوره.

Attribute-Relation File Format (ARFF)

موفق باشی

ممنونم از راهنمایی که کردین من از چیزایی که فهمیدم توضیح میدم بیزحمت درست یا اشتباه بودنشو بفرمایین.
@RELATION اینو همشون باید داشته باشن.
ولی ویژگی هایی که با IG بدست آوردمو هرکدومو همراه با @attribute مینویسم و آخرین attribute هم کلاسهام هستند.بعد Data هارو می نویسم که مقدارشون TF خواهد بود یا IG؟یه سوال دیگه هم که داشتم اینه که داده های تستی رو کجا وچطور وارد میکنیم؟ممنون میشم سوالامو پاسخ بدین

babak_1234 ۰۱-۲۵-۱۳۹۲ ۱۰:۳۳ قبل از ظهر

نقل قول:

نوشته اصلي بوسيله talalo (پست 28289)
ممنونم از راهنمایی که کردین من از چیزایی که فهمیدم توضیح میدم بیزحمت درست یا اشتباه بودنشو بفرمایین.
@RELATION اینو همشون باید داشته باشن.
ولی ویژگی هایی که با IG بدست آوردمو هرکدومو همراه با @attribute مینویسم و آخرین attribute هم کلاسهام هستند.بعد Data هارو می نویسم که مقدارشون TF خواهد بود یا IG؟یه سوال دیگه هم که داشتم اینه که داده های تستی رو کجا وچطور وارد میکنیم؟ممنون میشم سوالامو پاسخ بدین


سلام دوست عزیز

@RELATION مربوط به معرفی داده مورد نظر میباشد.
@attribute برای معرفی خصوصیت های مجموعه داده هستن. اما لزوما آخرین ویژگی کلاس رو مشخص نمیکنه.
@Data : بعد از این تگ داده ها قرار میگیرند. ابعاد ویژگی در هر رکورد باید مطابق با ویژگی هایی باشد که در بخش Relation تعریف شده است.

جداسازی داده های تست و
آموزشی وابسته به استراتژی شما هستن. برای مثال اگر از روش Cross validation برای ارزیابی استفاده میکنید لینک زیر رو نگاه کنید.
http://weka.wikispaces.com/Generatin...Java+approach)

یکسری اطلاعات دیگه در مورد وارد کردن داده ها در وکا توی این لینک توضیح داده شده. حتما ببینید.
http://weka.wikispaces.com/Text+cate...tion+with+WEKA

موفق باشید

talalo ۰۲-۹-۱۳۹۲ ۰۹:۱۴ قبل از ظهر

سلام دوستان من داده های زیر رو دارم
weka دانلود ● آپلود سنتر قدرتمند | " صفر آپ دات آی آر " | آپلود | آپلود عکس | آپلود با لینک مستقیم | آپلود با حجم بالا | آپلود نامحدود | آپلود آهن
و وقتی با rename به arff تبدیل می کنم و در وکا میخوام باز کنم صفحه زیر رو میاره
http://0up.ir/do.php?imgf=136721418985361.jpg
و وقتی اوکی میکنم اروره زیر رو میده میشه راهنماییم کنین؟
با تشکر
http://0up.ir/do.php?imgf=136721418987662.jpg

babak_1234 ۰۲-۹-۱۳۹۲ ۱۱:۰۲ قبل از ظهر

نقل قول:

نوشته اصلي بوسيله talalo (پست 28553)
سلام دوستان من داده های زیر رو دارم
weka دانلود ● آپلود سنتر قدرتمند | " صفر آپ دات آی آر " | آپلود | آپلود عکس | آپلود با لینک مستقیم | آپلود با حجم بالا | آپلود نامحدود | آپلود آهن
و وقتی با rename به arff تبدیل می کنم و در وکا میخوام باز کنم صفحه زیر رو میاره
http://0up.ir/do.php?imgf=136721418985361.jpg
و وقتی اوکی میکنم اروره زیر رو میده میشه راهنماییم کنین؟
با تشکر
http://0up.ir/do.php?imgf=136721418987662.jpg


سلام دوست من

اول از همه این که در برنامه notepad برای ذخیره کردن داده های UTF8 یک کاراکتر خاصی اول فایل قرار میده که همین باعث میشه وکا نتونه فایل رو بخونه. برای همین بهتره از کاراکتر های فارسی در این فایل استفاده نکنی یا از برنامه notpad++ استفاده کنی.

در ضمن در خط پنجم فایلت یه کاراکتر space در نام ویژگی وجود داره که باعث خطا میشه.

كد:

@ATTRIBUTE word_freq_ شا Real
این مشکلات رو رفع کن و بعد از داده ها استفاده کن.

موفق باشید

talalo ۰۲-۱۰-۱۳۹۲ ۰۸:۱۶ قبل از ظهر

نقل قول:

نوشته اصلي بوسيله babak_1234 (پست 28556)
سلام دوست من

اول از همه این که در برنامه notepad برای ذخیره کردن داده های UTF8 یک کاراکتر خاصی اول فایل قرار میده که همین باعث میشه وکا نتونه فایل رو بخونه. برای همین بهتره از کاراکتر های فارسی در این فایل استفاده نکنی یا از برنامه notpad++ استفاده کنی.

در ضمن در خط پنجم فایلت یه کاراکتر space در نام ویژگی وجود داره که باعث خطا میشه.

كد:

@ATTRIBUTE word_freq_ شا Real
این مشکلات رو رفع کن و بعد از داده ها استفاده کن.

موفق باشید

آقای babak_1234 بینهایت از راهنماییهاتون سپاسگذارم.مشکلم حل شد.


زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۰۹:۵۱ قبل از ظهر ميباشد.

Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.