نمايش پست تنها
قديمي ۱۱-۴-۱۳۸۸, ۰۵:۲۴ بعد از ظهر   #50 (لینک دائم)
Astaraki Female
Administrator
 
آواتار Astaraki
 
تاريخ عضويت: خرداد ۱۳۸۷
محل سكونت: تهران-کرج!
پست ها: 3,465
تشكرها: 754
16,337 تشكر در 3,127 پست
My Mood: Mehrabon
ارسال پيغام Yahoo به Astaraki
Wink

شناسايي متون چاپی فارسی با دقت بالا با استفاده همزمان از مدل مخفی مارکف, برنامه ريزی پويا و ماشين بردار پشتيبان

اين مقاله به توصيف سامانه شناسايي متون چاپی فارسی اختصاص دارد که با هدف دست يابی به دقت بالا طراحی و پياده سازی شده است . بدنه اصلی سامانه با الهام از برخی پژوهش های پيشين در حوزه شناسايي متون (انگليسی و عربی( و مبتنی بر مدل مخفی مارکف 1 ايجاد شده که به نوع کاربرد آن در شناسايي گفتار پيوسته بسيار نزديک است . با اين حال برای افزايش دقت سامانه , بسته به نوع خطا , دو پيشنهاد جديد ارائه شده است . علاوه بر استفاده از يک گرامر مناسب منتج از ويژگی های حروف فارسی برای کاهش خطای جايگزينی, طرحی برای مشارکت ماشين بردار پشتيبان 2 در حذف خطاهای حذف و درج ارائه شده که عليرغم کاهش سرعت شناسايي , اين نوع از خطا را به صورت چشمگير کاهش ميدهد. اين نکته بخصوص از آن جهت اهميت دارد که خطاهای درج و حذف )نسبت به خطای جايگزينی م تداول در اين سامانه که عمدتا به اشتباه در تشخيص تعداد نقاط مربوط است(, باعث کاهش يشتر خوانايي متن به دست آمده شده و بنابراين نامطلوب ترند. عملکرد ماشين بردار پشتيبان , بر اساس ارزيابی 3 نتايج دو سامانه مبتنی بر مدل مخفی مارکف با همبستگی کم در محل وقوع خطا , استوار است . به اين منظور از برنامه ريزی پويا 4 برای ترازبندی 5 جواب های دو سامانه استفاده شده و با استفاده از آن, به ازای هر کلمه , جواب يکی از سامانه ها توسط ماشين بردار پشتيبان انتخاب شده است . همچنين از برنامه ريزی پويا برای برچسب گذاری داده های آموزش برای اين مرحله استفاده شده است . نوع استخراج ويژگيها به گونه ای است که عليرغم تعريف آنها در سطح کلمه, باعث وابستگی سامانه به تعداد محدودی کلمه نشده و همچنان مقاومت سامانه نسبت به تغيير نوع متن و ظهور کلمات خارج از لغتنامه, محفوظ ميماند.
فايل ضميمه
نوع فايل: pdf 10[1].pdf (330.9 كيلو بايت, 578 نمايش)
Astaraki آفلاين است   پاسخ با نقل قول
از Astaraki تشكر كرده اند:
eehadi (۰۴-۲۰-۱۳۹۱), saber187518 (۰۹-۲۳-۱۳۹۰), vahid135 (۰۳-۸-۱۳۹۰)