نقل قول:
نوشته اصلي بوسيله parmin
سلام. طاعاتتون قبول. من یکسری دیتاست دارم که نمیدونم پسوندشون چی هست و چطوری در وکا آنها را باز و باهاشون کار کنم! یک دیتاست که از سایت UCI گرفتم با نام 20_newsgrup که خودش درای چند پوشه و در هر پوشه کلی فایل با پسوند نامشخص وجود دارد!
دیتاست دیگه فایل های با پسوند tf دارد.
و دیتاست بعدی هم که از سایت UCI گرفتم با نام Reuters دارای فایل های با پسوند Sgm می باشد. چون حجم دیتاست ها بالاست نتونستم آنها را در ضمیمه قرار بدم!
ممنون میشم کسی لطف کنه و کمک کنه.
در گزینه هام ضمیمه وجودندارد که نمونه فایل ها رو بگذارم ممنون میشم راهنماییکنید تا حداقل یکی از فایل ها را برای نمونه در سایت قرار بدهم!
|
سلام دوست عزیز
ببینید sgm یکی از فرمت هایی که مشابه xml است. اگر نمی توانید این فایل را در وکا بارگذاری کنید بهترین راه تغییر پسوند از sgm به arff یا xml است.
اگه این راه جواب نداد راه دیگه اینه که فایل sgm رو با یه نرم افزار پردازش متن مثل notpad++ یا xmlwf باز کنید بعد تگ های xml رو حذف کنید و با پسوند arff ذخیره کنید. اگه باز موفق نشدید پیغام بدید و مشکل رو مطرح کنید.
موفق باشید