1-2- آزمايش ومقايسه کارايي شاخصهاي اعتبار سنجي
در اينجا با آزمايش سعي ميشود کارايي 4 شاخص از شاخصهاي خوشهبندي بالا با هم مقايسه شوند. براي اين منطور از سه دسته داده با ويژگيهاي متفاوت استفاده ميشود.
º خوشههاي کاملا جدا: دادههاي متعلق به هر خوشه در کاملا به هم نزديک هستند. شکل 19.a
º خوشههاي حلقهاي شکل: خوشهاي که خوشهاي ديگر درون آن قرار دارد. شکل 19.b
º خوشههاي با شکل دلخواه: دو خوشه با شکلي دلخواه. شکل 19.c
a
b
c
شکل 19: مجموعه دادههاي بکار رفته براي مقايسة کارايي شاخصهاي اعتبارسنجي خوشهها
در آزمايش اول از الگوريتم K-Means استفاده شده به گونهاي که يک بار نتيجه درست و بار ديکر نتيجة نادرستي از آن حاصل شده است. سپس نتايج با 4 شاخص دون، ديويس بلودين، SD و D_Dbw اعتبارسنجي شدهاند که در مقادير مربوطه در شکل 20 نشان داده شدهاند
شکل20: مقادير مربوط به شاخصهاي اعتبار بر روي نتايج حاصل از خوشهبندي دادهها کاملا مجزا
در آزمايش دوم نتايج حاصل از خوشهبندي مجموعه دادههاي حلقوي شکل که يک بار با روش K-Means به صورت نادرستي خوشهبندي شدهاند و بار ديگر با روش DBSCAN به درستي خوشهبندي شدهاند، با هم مقايسه شدهاند. مقادير محاسبه شده براي شاخصها در شکل 21 نشان داده شده است.
شکل 21: مقادير مربوط به شاخصهاي اعتبار بر روي نتايج حاصل از خوشهبندي دادهها حلقوي
نتايج نشان ميدهند که شاخص دون و S_Dbw مقادير صحيحي ولي دو شاخص ديگر مقادير اشتباهي را بدست آوردهند.
در آزمايش آخر دادههاي با شکل دلخواه به صورتي که در شکل 22 مشاهده ميشوند خوشهبندي شدهاند که مقادير حاصل از شاخصها بر روي آنها در شکل 23 مشاهده ميشود.
شکل 22: دو حالت خوشهبندي درست و نادرست دادههاي با شکل دلخواه
شکل 23: مقادير مربوط به شاخصهاي اعتبار بر روي نتايج حاصل از خوشهبندي دادهها با شکل دلخواه
نتايج اين آزمايش نشان ميدهد که تنها شاخص دون مقادير صحيحي را محاسبه کرده است.