افزايش كارايي دسته بندي متون بر اساس بهبود روش انتخاب خصيصه
افزايش كارايي دسته بندي متون بر اساس بهبود روش انتخاب خصيصه
چکیده مقاله :
در دسته بندي متون معمولا از كلمات به عنوان خصيصه استفاده مي شود. از آنجا كه در هر مجموعه متون، تعداد بسيار زيادي خصيصه وجود دارد، در اين مقاله روش هايي به منظور كاهش تعداد خصيصه ها و انتخاب خصيصه هاي مرتبط، پيشنهاد شده است. به طور كلي روش هاي فيلتري انتخاب خصيصه از چهار همبستگي مثبت و منفي بين خصيصه هاي سندها و دسته ها در ضابطه انتخاب خصيصه استفاده مي كنند. در روش هاي پيشنهادي اين مقاله ابتدا كليه همبستگي هاي مثبت و منفي را با اثر مثبت و سپس همبستگي هاي مثبت را با اثر مثبت و همبستگي هاي منفي را با اثر منفي در ضابطه انتخاب خصيصه ها در نظر گرفته ايم. نتايج آزمايشات نشان دهنده تاثير بيشتر همبستگي هاي مثبت، نسبت به همبستگي هاي منفي مي باشد. ديگر روش پيشنهادي، تركيبي از يك روش فيلتري و يك روش روكشي است كه ابتدا با استفاده از روش فيلتري Relief-F تعدادي از خصيصه ها با هزينه محاسباتي كمي انتخاب مي شوند و سپس از خصيصه هاي انتخاب شده با استفاده از روش روكشي SFS يا SBS به صورت دقيقتري با كمك دسته بند متون، خصيصه هاي نامرتبط حذف مي شوند. ارزيابي هاي انجام گرفته نشان دهنده كارايي بهتر روش تركيبي نسبت به روش هاي فيلتري است.
کلمات کلیدی :
دسته بندي متون، انتخاب خصيصه، تركيب فيلتري - روكشي، همبستگي مثبت و منفي بين خصيصه هاي سند و دسته
|