ارائه يك سيستم خبره جهت تصحيح خودكار خطاهاي املايي زبان فارسي
ارائه يك سيستم خبره جهت تصحيح خودكار خطاهاي املايي زبان فارسي
خلاصه مقاله:
در اين مقاله به ارائه يك سيستم تصحيح گر خودكار خط اهاي املايي زبان فارسي پرداخته م يشود. اين سيستم ميتواند جهت پس- پردازش براي تصحيح خودكار متون حاصل از نر مافزارهاي بازشناسي حروف بصر ي(ocr) و يا تص حيح متون نوشتا ري انسا ني مورد استفاده قرار گيرد. بخشهاي مختلف اين سيستم عبارتند از: لغتنامه زبان فارسي، الگوريتم تشخيص خطاها و الگوريتم تصحيح كلمات خطادار كه با استفاده از توابع ابتكاري بخصوصي خطاهاي موجود در متن مدل شده و تصحيح ميگردد. براي تشخيص كلمات غلط از يك لغت نامه كه بصورت خودكار توليد م يشود، استفاده شده و پس از آن، مناسبترين كلمه صحيح انتخاب م يگرد د. در انتخاب مناس بترين كلمه صحيح از توابع ابتكاري مختلفي استفاده م يگردد كه بر حسب آنكه متن ورودي، تايپي يا حاصل از
خروجي نر مافزار بازشناسي حروف بصر ي باشد، تعريف شد هاند. آزمايشات مختلف در اين پژوهش نشان داده است كه با استفاده از لغتنامهي دقيق از كلمات زبان فارسي در دامنه متون مورد بحث ميتوان به نتايج قابل توجهي در تصحيح خطاهاي متني دست يافت.
كلمات كليدي:
پسپردازش خودكار تصحيح متون، توابع ابتكاري، زبان فارسي