اعتبار سنجی الگوریتم خوشه بندی K-Means توسط روش Silhouette Coefficient(SC)
روش SC یکی از متداولترین و بهترین روش های اعتبار سنجی الگوریتم خوشه بندی K-Means می باشد.که اولین بار توسط کافمن و روسیو در سال 1990 پیشنهاد شد.
که در این رابطه همبستگی a(x) متوسط فاصله (x) نسبت به بردار های دیگر در همان خوشه است، شاخص تفکیک b(x)متوسط فاصله (x) نسبت به سایر خوشه ها را نشان می دهد.S(x) نمایش اندازه گیری میزان نزدیکی هر نقطه در یک خوشه است، که امتیاز آن ها نسبت به خوشه های مجاورش سنجیده می شود. محدوده امتیاز دهی آن بین 0 و1+ است. به این صورت که اگر این اندازه گیری در محدوده1+ باشد نشان دهنده این است که خوشه مورد نظر نسب به خوشه مجاورش بسیار دور است. و حالت صفر نشان می دهد که هیچ گونه تفکیکی بین خوشه مورد نظر و خوشه های همسایه وجود ندارد. و بالاخره حالت 1- نشان دهنده احتمالات اختصاص خوشه مورد نظر به صورت غلط است.
|