دوست عزیز
classification یک روش دسته بندی با ناظر است یعنی ما یک سری داده اولیه به عنوان داده های training داریم که این داده ها برچسب گذاری شده اند یعنی مشخص شده که هر داده مربوط به کدام کلاس است واز روی این نمونه ها ما کلاس بندی را انجام می دهیم به طوری که این کلاس بندی برای داده های مرحله تست هم اعمال می شود.
در واقع می توان گفت که در کلاس بندی ما از اول می دانیم که هر داده به کدام کلاس تعلق دارد
ولی clustering یک روش آموزش بدون ناظر است یعنی داده های ما هیچ برچسبی ندارند و ناظری در کار نیست و داده ها بر اساس معیار شباهتی که با هم دارند دسته بندی می شوند
مثل فاصله اقلیدسی، هر چه داده ها فاصله کمتری با هم داشته باشند احتمال اینکه در دسته های مشابه قرار بگیرند بیشتر است.
مهمترین الگوریتم Clusterig هم الگوریتم K-means است.
|