نمايش پست تنها
قديمي ۰۷-۱۱-۱۳۹۲, ۰۸:۱۶ بعد از ظهر   #14 (لینک دائم)
babak_1234 Male
Moderator
 
آواتار babak_1234
 
تاريخ عضويت: شهريور ۱۳۸۸
محل سكونت: تهران
پست ها: 252
تشكرها: 1
140 تشكر در 108 پست
My Mood: Khonsard
پيش فرض

نقل قول:
نوشته اصلي بوسيله BahramHedayati نمايش پست
سلام وقت بخیر ...
شاید یکی از مهمترین مباحثی که در خوشه بندی مطرح است، ارزیابی مدل خوشه بندی تولید شده (صرف نظر از نوع نرم افزار مدل ساز) می باشد که متأسفانه در عمل توجه زیادی به آن نمی شود.

اکثر پروژه های داده کاوی که بنده ملاحظه کرده ام، صرفاً شامل مدل خوشه بندی بوده است و تأکید بر آن بوده است که هر خوشه تولید شده نسبت به سایر خوشه ها داده های خیلی کمی نداشته باشد. بر این اساس تعداد خوشه ها را تعیین می کنند.

سؤال من مشخصاً این است که چگونه مدل خوشه بندی خود را بر اساس پارامترهای ریاضی ارزیابی کنیم که از میزان صحت و دقت آن اطمینان داشته باشیم؟

با تشکر
سلام دوست من

به نظر من ارزیابی مدل خوشه بندی به صورت صرفا ریاضی بسیار مشکل است.

۱- روش های مختلف خوشه بندی ممکن است نتایج مختلفی را در بر داشته باشد.
۲- استفاده از Similarity Measure های مختلف در تولید خوشه ها، ممکن است نتایج مختلفی در بر داشته باشد.
۳- تولید خوشه های تهی لزوما به معنی بد عمل کردن الگوریتم خوشه بندی نمیباشد.
۴- همیشه امکان تعیین تعداد خوشه ها به صورت ثابت وجود ندارد. همچنین تعیین تعداد واقعی این خوشه ها یک مساله بسیار مشکل میباشد.

عموما برای ارزیابی مدل خوشه بندی باید نتایج بدست آمده را مورد ارزیابی قرار بدهید. در ارزیابی این نتایج یک پارامتر بسیار مهم Similarity Measure میباشد. روش های مختلفی برای این کار وجود دارد که با توجه به کاربرد تعریف میشود.

موفق باشید
babak_1234 آفلاين است   پاسخ با نقل قول
از babak_1234 تشكر كرده است:
ehsan_teimouri (۰۷-۱۳-۱۳۹۲)