Conversation Between hony and fkarimi_61
Showing Visitor Messages 1 to 1 of 1
-
سلام و وقتتون بخیر
من در مورد داده کاوی با دو مسئله روبرو شدم می خواستم از شما مشورت بگیرم
در داده های من فیلدی هست به نام قند خون دو ساعته
این فیلد فقط برای افرادی که دیابت انها تشخیص داده نشده پر شده است.در بین نمونه ها ما افراد دیابتی و سالم داریم.برای نمونه هایی که این فیلد خالی است این خالی بودن معنا دار است.نمی دونم که در داده کاوی ایا الگوریتم (درخت تصمیم و بیزین و svm )این را معنی دار در نظر می گیرد یا به عنوان داده از دست رفته؟
به نظر شما من باید با این فیلد چه کنم. در ضمن نرم افزار من وکا است.
مشکل دیگری که دارم این است که در داده کاوی حساسیت 0.3 و ویژگی 0.75 است برای درخت تصمیم و بیز. تعداد مریض من نصف تعداد سالم هست. موضوع من یادگیری ماشین هست ایا در یادگیری ماشین مجاز هستیم نمونه ها را کپی کنیم یا بطور تصادفی حذف کنیم تا تعداد افراد دو. کلاس مساوی شود یا خیر. با این کار حساسیت به 0.57 افزایش پیدا میکند.
ممنون از راهنمایی شما