مهمترین نکته در خوشه بندی OPTICS این هستش که داده های باید دارای چگالی مناسبی باشند که وقتی سیستم داده ها رو به لیست مرتب تبدیل می کنه مبنا قرار می گیره.
(البته کاربران نرم افزارهایی مثل وکا این موضوع رو نمی بینند و فقط به نتیجه اجرا الگوریتم دسترسی دارند)
اگر چگالی داده های شما خیلی زیاد یا خیلی کم باشند به نحوی که داده ها دارای همبستگی خیلی زیاد یا خیلی کمی باشند در خوشه بندی به مشکل می خورید.
در مورد فرمایش شما درباره دیتاست های UCI باید عرض کنم، خب این ها داده هستند و ممکنه در همون حالتی که قرار دارند (بدون اعمال فیلتر یا انتقال و نرمال سازی) دارای همبستگی باشند یا با اعمال انواع مختلف عملیات همبستگی داده های نهایی که به الگوریتم وارد کردید شدیدا بالا یا شدیدا پایین رفته باشه!؟!
امیدوارم دیتاستی مناسبی انتخاب کرده باشید:دی
در مورد ورژن 3.6 باید عرض کنم الگوریتم خوشه بندی OPTICS قدیمی تر از این حرفها هستش که در نرم افزار معروفی مثل وکا که بسیاری از انواع الگوریتم ها رو پشتیبانی میکنه، پیاده نشده باشه! البته دقیقا اطلاع ندارم از چه ورژنی این خوشه بندی درش درج شده.
اما نکته ای که به نظرم از همه توضیحات بالا مهمتره اینه که در وکا اگر خروجی OPTICS نمایشی مرتب شده از داده ها بود به شکلی که شما عبارت r_dist:UNDEFINED رو در حداقل یکی از نمونه هاتون دیدید به سربرگ پیشپردازش برید و ستون های (یا همون ویژگی های) مورد نظرتون رو تیک دارد کنید. نتیجه در مواقعی شدیدا تفاوت خواهد کرد.
__________________
یک روز یک ماشین برای انتخابات ریاست جمهوری ثبت نام می کند
چه بخواهیم چه نخواهیم این اتفاق می افتد.
ويرايش شده توسط masood; ۱۲-۴-۱۳۹۲ در ساعت ۱۰:۰۸ قبل از ظهر
دليل: اشتباه تایپی!
|