مسائل درگير با روشهاي خوشهبندي موجود
متأسفانه چندين مسئاله در خصوص روشهاي خوشهبندي مطرح است که هنوز به شکل کامل پاسخ داده نشدهاند. و همچنان تلاشهاي بسياري به منظور حل آنها انجام ميگيرد.
· روشهاي خوشهبندي قادر نيستند تمامي نيازهاي مسائل را به طور همزمان برآوردهکنند.
· به دليل پيچيدگي محاسباتي زياد در برخورد با مجموعه دادههاي بزرگ با تعداد داده زياد و تعداد ويژگيهاي زياد براي هر داده عملي نيستند.
· به دليل وابستگي شديد به تعريف معيار شباهت بين دادهها در مسائلي که تعريف معيار شباهت مشکل باشد نتايج مطلوبي توليد نميکنند.(در دادهها با تعداد ويژگي زياد)
· براي نتايج آنها ميتوان تفسيرهاي مختلفي بيان کرد.
خوشهبندي در مقابل چنديسازي برداري
همانگونه که بحث شد، خوشهبندي نوعي سازماندهي دادهها است، بر اساس شباهتي که بين آنها تعريف ميشود به گونهاي که شباهت بين دادههايي که درون يک خوشه قرار ميگيرند، نسبت به دادههايي که درون خوشههاي متفاوت قرار ميگيرند، بيشتر باشد.
در کاربردهاي ارتباطي و فشردهسازي دادهها از روشهايي به نام چنديسازي برداري استفاده ميشود که از بعضي جنبهها ميتوان آنها را معادل خوشهبندي در نظر گرفت. در چنديسازي برداري نيز دادهها بر اساس ميزان شباهت بين آنها به دستههايي تقسيم مي شوند و هر دسته بوسيله يک بردار که به آن کلمه کد (CodeWord) گفته ميشود جايگزين ميگردد. به مجموعة اين کلماتِ کد اصطلاحأ کتابِ کد(CodeBook) گفته ميشود.
دربعضي از بخثهاي علمي بين خوشهبندي و چنديسازي برداري تفاوتهايي قائل ميشوند. زيرا خوشهبندي را يک رهيافت بدون نظارت براي تحليل دادهها در نظر ميگيرند ولي چنديسازي برداري را روشي براي کشف خوشهها نميشناسند بلکه آن را راهي براي نمايش دادهها با تعداد عناصر کمتر به گونهاي که اطلاعات از دست رفته حداقل شود، ميشناسند. عليرغم تفاوت بيان شده ميتوان روشهاي بکار رفته در هر يک آنها را در ديگر نيز بکار برد در اينجا بين خوشهبندي و چنديسازي برداري تفاوتي قائل نميشويم.
|