دسته بند سریع نزدیکترین k همسایه برای داده های مخلوط
دسته بند سریع نزدیکترین K همسایه برای داده های مخلوط
چکیده – در این مقاله یک روش دسته بندی سریع Knn که با داده های مخلوط Mixed data سازگار باشد ارائه شده است. در این روش مانند اغلب Knn های سریع ابتدا درختی از داده ها تشکیل می دهیم تا عمل جستجو نزدیکترین K همسایه در آن با تعداد کمتری مقایسه قابل انجام باشد. برای این منظور از الگوریتم C-Means کمک استفاده می کنیم. الگوریتم C-Means را کمی تغییر می دهیم تا توانایی کلاستر کردن داده های مخلوط را داشته باشد. این تغییر به تفسیر بیان شده است. سپس با استفاده از C-Means تغییر یافته داده ها را به صورت سلسله مراتبی تجریه می کنیم، و درخت را تشکیل می دهیم. در انتها با جستجو محلی عمق اول درخت را پیمایش کرده و نزدیکترین K همسایه را بدست می آوریم.
كليد واژه-Fast Knn, Mixed data, C-Means
|