بازشناسی قلمهای فارسی به کمک ضرايب خودهمبستگی
در اين تحقيق ويژگی جديد ضرايب خود همبستگی برای استخراج از اسناد متنی به منظور بازشناسی قلم های فارسی معرفی شده است. در اين روش، تصوير سند مستقل از محتوای متن به عنوان يک تصوير بافت دار در نظر گرفته می شود که بافت متن، وابسته به نوع قلم می باشد. سپس ضرايب خود همبستگی به عنوان ويژگيهای مناسب برای طبقه بندی قلمهای مختلف استخراج می شود . روش پيشنهادی روی مجموعه ای شامل 1000 زيرتصوير از 20 نوع قلم متداول فارسی آزمايش شده است . نرخ بازش ناسی 95.7 به کمک همسايه نزديکتر، مناسب بودن روش پيشنهاد شده k طبقه بند را نشان می دهد . در اين مقاله همچنين استفاده از الگوريتم وراثتی برای کاهش بعد بردار ويژگی پيشنهاد شده است که علاوه بر کاهش ميزان ويژگيهای استخراجی به کمتر از نصف، افزايش دقت طبقه بندی به نرخ بازشناسی 96.9 نيز حاصل شده است.
|