سلام
ممنون میشم اگه مقالات زیر را که در رابطه با مسائل imabalanced data classification است واسم دانلود کنین. این مقالات IEEE هستن و من واسه پایان نامم بهشون احتیاج دارم.
در این مسائل کلاس های داده به صورت نامتعادلند یعنی تعداد داده های مربوط به یک کلاس بسیار کمتر از کلاس دیگر است و عموما کلاسی که داده های کمتری دارد از اهمیت بیشتری برخوردار است. در این مسائل به دلیل این که یک کلاس داده های زیادی دارد بنابراین بایاس به سمت این کلاس می باشد و درصورتی که از روش های کلاسیفیکیشن معمول استفاده کنیم نمیتوان به نتایج اعتماد کرد برای مثال ممکن است نسبت کلاس منفی (اکثریت) به کلاس مثبت(کلاس داده های اقلیت) 9 به 1 باشد و کلاسیفیکیشن دقتی برابر 90% بدهد حتی اگر هیچ نمونه مثبتی را درست پیش بینی نکرده باشد. پس در این مسائل دقت نمی تواند معیار مناسبی باشد.
لینک مقالات:
IEEE Xplore - Learning from imbalanced data using methods of sample selection
IEEE Xplore - A synthesized sampling approach for improving the prediction of imbalanced classification
IEEE Xplore - Nearest Neighbor Distributions for imbalanced classification
IEEE Xplore - Effect of Feature Selection, SMOTE and under Sampling on Class Imbalance Classification