ديگر روشهاي خوشه بندي سلسله مراتبي
*خوشهبندي با روش Group Average Link: اين روش همانند Single-Link جزء روشهاي خوشهبندي سلسله مراتبي و انحصاري محسوب ميشود. [Webb] به اين روش Centriod Distance نيز گفته ميشود. در اين روش براي محاسبة شباهت بين دو خوشة A و B از معيار زير استفاده ميشود:
که Xi يک نمونه داده متعلق به خوشة A، Xj يک نمونه دادة متعلق به خوشة B، NA تعداد اعضاء خوشةA و NB تعداد اعضاء خوشة B است. در واقع در اين روش، شباهت بين دو خوشه فاصلة بين بردار ميانگينِ تمام اعضاء يکي با بردارِ ميانگينِ تمام اعضاء ديگري است. در شکل F4 اين مفهوم بهتر نشان داده شده است.
*
خوشهبندي با روش Median Distance: اين روش نيز همانند Single-Link جزء روشهاي خوشهبندي سلسله مراتبي و انحصاري محسوب ميشود. در روش Group Average Link اگر يم خوشة کوچک با يک خوشة بزرگ ترکيب شود نقطة ميانگين خوشة حاصل نقطهاي نزديک ميانگين خوشة بزرگتر خواهد بود که در بعضي از کاربردها چندان مطلوب نيست. بدين منظور اين روش خوشهبندي پيشنهاد شده است که مشکل مذکور را ندارد. در اين روش از ميانة نقاط يک خوشه به عنوان مرکز ثقل آن خوشه استفاده ميشود.
شکل 10: شباهت بين دو خوشه در روش Group Average Link برابر است با فاصله بين ميانگين نقاط دو خوشه
*
خوشهبندي با روش Ward:
اين روش نيز همانند Single-Link جزء روشهاي خوشهبندي سلسله مراتبي و انحصاري محسوب ميشود. در اين روش خوشهبندي براي کاهش تلفات ناشي دادههاي دور افتاده (Outlier) از معياري جديد براي محاسبة عدمشباهت بين خوشهها استفاده ميکند. در روش Ward's از مجموع مربعات تفاضل هر داده از يک خوشه با بردار ميانگين آن خوشه به عنوان معياري براي سنجش يک خوشة استفاده ميشود. الگوريتم زير را ميتوان براي روش Ward در نظر گرفت.
1.
ابتدا هر داده به عنوان يک خوشه در نظر گرفته ميشود.
2.
به ازاء تمام جفت خوشههاي ممکن از مجموعة خوشهها آن دو خوشهاي که مجموع مربعات تفاضل دادههاي خوشة حاصل از اجتماع آنها با بردار ميانگين خوشة حاصل کمينه باشد، انتخاب ميشوند.
3.
دو خوشة انتخاب شده با هم ترکيب ميشوند.
4.
تا زماني که تعداد خوشهها به تعداد مورد نظر نرسيده است، مراحل ii، iii و iv تکرار ميشوند