برای شروع توی k-means باید مرکز کلاستر ها رو انتخاب کرد. انتخاب اولیه این مرکز تاثیر مهمی توی جواب نهایی داره و اگه به صورت تصادفی این مرکز ها رو انتخاب کنیم، جواب نهایی میتونی خیلی از جواب بهینه متفاوت باشه
توی ++k-means یه روش ارایه میشه که این مرکز ها رو انتخاب کنیم. جز معدود روشهایی هست که توش میشه گارانتی کرد که نتیجه کلاسترینگ خیلی از جواب بهینه دور نیست (اختلاف در مرتبه log k)
ایده اصلیش هم اینه که مرکز های اولیه رو تا حد امکان دور از هم دیگه انتخاب کنیم
|