نقل قول:
نوشته اصلي بوسيله mahdiii
منابع خیلی خوب توضیح دادن و من هم بالا ریز کارو توضیح دادم. فکر نکنم بیشتراز این بشه تو تاپیک توضیح داد.
شما گفتین میخواین از روش تصادفی یا اکتشافی تو انتخاب زیرمجموعه ویژگیها استفاده کنین. خوب روش تصادفی که کاملا واضحه شما داده هایی دارین که 100 تا ویژگی داره خوب مثلا 20 تا ویژگی تصادفی داده ها رو انتخاب میکنین . برای قسمت ارزیابیشم توضیح دادم که میتونین از نرخ دسته بندی برای داده های آموزشی استفاده کنین. یعنی داده های تستو با همون 20 ویژگی به دسته بند میدین (بعد آموزش دسته بند توسط داده های اموزشی)و میبینین که چند درصدشون درست دسته بندی شدن. این میشه معیار اینکه اگه این 20 ویزگی داده ها انتخاب بشند دسته بند ما انقدر دقت داره، بعد میاین با یه مجموعه ویژگی تصادفی دیگه این کارو می کنین مثلا 15 تا ویژگی. باز همون کارو میکنین و نرخ دسته بندیو به دست میارین. باز این میشه معیار ارزیابی شما که آیا این مجموعه ویزگی بهتر بودن یا قبلی!
همین روالو باید تکرار کنین.
این توضیحی که دادم بر اساس روش wrapper هست همونی که شما میخواین.
در مورد متلبم خوب باید بلد باشین چجوری باهاش کار کنین موفق باشین
|
سلام برای داده هایی که آموزش و تست ندارند چه باید کرد؟ البته من تونستم با fda یک کارهایی بکنم و چند ویژگی انتخاب کنم. مثلا از 5000 ویژگی داده ژنی سرطانی با fda تونستم مرتب کنم و ویژگی های برتر رو به ترتیب مرتب کنم . ایا این روش که انجام دادم درسته ؟