سلام وقت بخیر ...
شاید یکی از مهمترین مباحثی که در خوشه بندی مطرح است، ارزیابی مدل خوشه بندی تولید شده (صرف نظر از نوع نرم افزار مدل ساز) می باشد که متأسفانه در عمل توجه زیادی به آن نمی شود.
اکثر پروژه های داده کاوی که بنده ملاحظه کرده ام، صرفاً شامل مدل خوشه بندی بوده است و تأکید بر آن بوده است که هر خوشه تولید شده نسبت به سایر خوشه ها داده های خیلی کمی نداشته باشد. بر این اساس تعداد خوشه ها را تعیین می کنند.
سؤال من مشخصاً این است که چگونه مدل خوشه بندی خود را بر اساس پارامترهای ریاضی ارزیابی کنیم که از میزان صحت و دقت آن اطمینان داشته باشیم؟
با تشکر
|