سلام
BOW یک روش برای ساده سازی نمایش هستش که در پردازش زبان طبیعی یا بازیابی اطلاعات استفاده میشه. به طور مثال میشه یک جمله رو به صورت یک لیست با تعداد تکرار کلمات نمایش داد.
این روش عموما برای کلاسبندی مستندات(Document Classification) کاربرد داره
در بینایی ماشین میشه فرض کرد که هر تصویر به صورت یک مستند(Document) هست. در تصاویر دارای سه گام کلی هست
۱) Feature Detection : تعیین ویژگی ها با توجه به تعاریف مسائله
۲) Feature description : بعد از تعیین ویژگی هر تصویر به صورت patch های محلی نمایش داده میشه
۳) codebook generation : گام آخر نمایش بردار های ویژگی به صورت codebook همانند یک متن هست. یک codeword میتواند به صورت نمایش patch های مشابه در نظر گرفته شود. برای مثال یک روش برای این کار اعمال الگوریتم K-means بر روی patch ها هست و codeword مرکز خوشه های تولید شده هستن.
موفق باشید
|