نزديکترين همسايه يک الگوريتم تعليم با سرپرستي است. در حالت کلي از اين الگوريتم به دو منظور استفاده ميشود: براي تخمين تابع چگالي توزيع دادههاي تعليم و براي طبقه بندي دادههاي تست بر اساس الگوهاي تعليم.
تخمين چگالي توزيع دادهها با استفاده از الگوريتم Kn نزديکترين همسايه
براي تخمين p(x) از روي n نمونهي تعليم توسط الگوريتم k نزديکترين همسايه ميتوانيم يک سلول به مرکزيت x ايجاد کرده و اجازه دهيم اين شعاع اين سلول تا حدي گسترش پيدا کند که kn نمونهي تعليم را در بر گيرد. اين نمونه ها kn نزديکترين همسايه هاي x هستند.
در حالت کلي k را به صورت kn در نظر ميگيريم که kn تابعي تعريف شده از n است. منبع
فرض: مجموعه داده های ورودی: X= x1, x2,…,xn
کلاس مربوط به نمونه های ورودی: C= c1,c2,…,cn
--------
- برای تعیین کلاس بردار نامعلوم x، فاصله (مانند فاصله اقلیدسی) x، از تک تک نمونه های آموزشی بدون در نظر گرفتن کلاس آنها محاسبه میشود.
- K داده که نزدیکترین فاصله را دارند به عنوان K-نزدیکترین همسایه انتخاب میشوند (بهتر است k، فرد در نظر گرفته شود).
- از این K نمونه، تعداد اعضای هرکلاس را مشخص کرده و آن را Ki مینامیم (i = 1,…,C).
- کلاس بردار نامعلوم x، کلاسی است مه بیشترین Ki را داشته باشد.
نزديکترين همسايه يک الگوريتم تعليم با سرپرستي است. در حالت کلي از اين الگوريتم به دو منظور استفاده ميشود: براي تخمين تابع چگالي توزيع دادههاي تعليم و براي طبقه بندي دادههاي تست بر اساس الگوهاي تعليم.
تخمين چگالي توزيع دادهها با استفاده از الگوريتم Kn نزديکترين همسايه
براي تخمين p(x) از روي n نمونهي تعليم توسط الگوريتم k نزديکترين همسايه ميتوانيم يک سلول به مرکزيت x ايجاد کرده و اجازه دهيم اين شعاع اين سلول تا حدي گسترش پيدا کند که kn نمونهي تعليم را در بر گيرد. اين نمونه ها kn نزديکترين همسايه هاي x هستند.
در حالت کلي k را به صورت kn در نظر ميگيريم که kn تابعي تعريف شده از n است. منبع