نمايش پست تنها
قديمي ۰۴-۳۰-۱۳۹۲, ۱۰:۵۰ قبل از ظهر   #3 (لینک دائم)
kamran_kenzo Male
عضو فوق فعال
 
آواتار kamran_kenzo
 
تاريخ عضويت: تير ۱۳۸۹
محل سكونت: Tehran
پست ها: 190
تشكرها: 4
91 تشكر در 74 پست
پيش فرض

نقل قول:
نوشته اصلي بوسيله parmin نمايش پست
سلام. طاعاتتون قبول. من یکسری دیتاست دارم که نمیدونم پسوندشون چی هست و چطوری در وکا آنها را باز و باهاشون کار کنم! یک دیتاست که از سایت UCI گرفتم با نام 20_newsgrup که خودش درای چند پوشه و در هر پوشه کلی فایل با پسوند نامشخص وجود دارد!
دیتاست دیگه فایل های با پسوند tf دارد.
و دیتاست بعدی هم که از سایت UCI گرفتم با نام Reuters دارای فایل های با پسوند Sgm می باشد. چون حجم دیتاست ها بالاست نتونستم آنها را در ضمیمه قرار بدم!
ممنون میشم کسی لطف کنه و کمک کنه.
در گزینه هام ضمیمه وجودندارد که نمونه فایل ها رو بگذارم ممنون میشم راهنماییکنید تا حداقل یکی از فایل ها را برای نمونه در سایت قرار بدهم!
سلام دوست عزیز

ببینید sgm یکی از فرمت هایی که مشابه xml است. اگر نمی توانید این فایل را در وکا بارگذاری کنید بهترین راه تغییر پسوند از sgm به arff یا xml است.
اگه این راه جواب نداد راه دیگه اینه که فایل sgm رو با یه نرم افزار پردازش متن مثل notpad++ یا xmlwf باز کنید بعد تگ های xml رو حذف کنید و با پسوند arff ذخیره کنید. اگه باز موفق نشدید پیغام بدید و مشکل رو مطرح کنید.

موفق باشید
kamran_kenzo آفلاين است   پاسخ با نقل قول
از kamran_kenzo تشكر كرده است:
parmin (۰۴-۳۱-۱۳۹۲)