نقل قول:
نوشته اصلي بوسيله BahramHedayati
سلام وقت بخیر ...
شاید یکی از مهمترین مباحثی که در خوشه بندی مطرح است، ارزیابی مدل خوشه بندی تولید شده (صرف نظر از نوع نرم افزار مدل ساز) می باشد که متأسفانه در عمل توجه زیادی به آن نمی شود.
اکثر پروژه های داده کاوی که بنده ملاحظه کرده ام، صرفاً شامل مدل خوشه بندی بوده است و تأکید بر آن بوده است که هر خوشه تولید شده نسبت به سایر خوشه ها داده های خیلی کمی نداشته باشد. بر این اساس تعداد خوشه ها را تعیین می کنند.
سؤال من مشخصاً این است که چگونه مدل خوشه بندی خود را بر اساس پارامترهای ریاضی ارزیابی کنیم که از میزان صحت و دقت آن اطمینان داشته باشیم؟
با تشکر
|
سلام دوست من
به نظر من ارزیابی مدل خوشه بندی به صورت صرفا ریاضی بسیار مشکل است.
۱- روش های مختلف خوشه بندی ممکن است نتایج مختلفی را در بر داشته باشد.
۲- استفاده از Similarity Measure های مختلف در تولید خوشه ها، ممکن است نتایج مختلفی در بر داشته باشد.
۳- تولید خوشه های تهی لزوما به معنی بد عمل کردن الگوریتم خوشه بندی نمیباشد.
۴- همیشه امکان تعیین تعداد خوشه ها به صورت ثابت وجود ندارد. همچنین تعیین تعداد واقعی این خوشه ها یک مساله بسیار مشکل میباشد.
عموما برای ارزیابی مدل خوشه بندی باید نتایج بدست آمده را مورد ارزیابی قرار بدهید. در ارزیابی این نتایج یک پارامتر بسیار مهم Similarity Measure میباشد. روش های مختلفی برای این کار وجود دارد که با توجه به کاربرد تعریف میشود.
موفق باشید