ایده انتخاب-ترکیب برای دسته بندی مجموعه داده های با مقادیر نامعلوم
ایده انتخاب-ترکیب برای دسته بندی مجموعه داده های با مقادیر نامعلوم
این مقاله دیدگاهی جدید مبتنی بر کشف الگو های مقدار نامعلوم برای دسته بندی داده های ناقص ارائه می کند. این دیدگاه به ویژه برای دسته بندی مجموعه داده های با تعداد رکورد های کم و با درصد بالایی از مقادیر نامعلوم طراحی شده است. دیدگاه ارائه شده، زیرمجموعه هایی از رکورد ها را مبتنی بر الگوی مقادیر نامعلوم پیدا کرده و یک دسته بند را برای هر زیرمجموعه آموزش می دهد. سپس خروجی های تمام دسته بند ها با هم ترکیب می شوند. همواره بایستی بین پیچیدگی محاسباتی و دقت خروجی نهایی مصالحه ای برقرار باشد که برای این منظور یک معیار عددی برای محاسبه کارایی خروجی نهایی در نظر گرفته شده است. روش ارائه شده برای چهار مجموعه داده مختلف اجرا شده است. نتایج نشان می دهند که دقت دسته بندی روش ارائه شده نسبت به الگوریتم های قبلی بسیار بهتر خواهد بود. همچنین این نتایج نشان می دهند که میزان دقت به الگو و درصد مقادیر نامشخص وابسته است.
كليد واژه- انتساب های چندگانه، دسته بند های گروهی، زیرمجموعه، مدیریت مقادیر نامعلوم
|