تشخيص خودكار صفحات فهرست با توجه به الگوي آنها در پايان نامه هاي فارسي و لاتين
تشخيص خودكار صفحات فهرست با توجه به الگوي آنها در پايان نامه هاي فارسي و لاتين
چکيده:
صفحات فهرست در هر نوع مدرك (كتاب، مجله، پايان نامه، ...)، به نحو مختصر و فشرد ه، ساختار منطقي آن مدرك را بيان مي كنند و به كمك آن ها مي توان به راحتي ساختار مدرك را مشاهده نمود و مستقيماً به مطالب مورد نظر دست يافت. در اين مقاله براي اولين بار روشي به منظور شناسايي خودكار صفحات فهرست در پايان نامه هاي فارسي، عربي و لاتين ارائه مي شود. در اين روش، شناسايي صفحات فهرست با توجه به الگوي آن ها بدون استفاده از عمليات بازشناسي متن (اُسي آر) و تنها با به كارگيري فنون پردازش تصوير، مد نظر بوده. با اين روش مي توان صفحات فهرست را صرف نظر از نوع زبان و ترازبندي (راست به چپ يا چپ به راست بودن) متن آن ها، شناسايي كرد و به دليل عدم استفاده از اُسي آر، تابع كيفيت متن مدرك اسكن شده نيست. روش مذكور بر روي دسته اي از پايان نامه هاي فارسي، عربي و لاتين موجود در پايگاه اطلاعاتي پژوهشگاه اطلاعات و مدارك علمي ايران مورد آزمايش قرار گرفت و دقت 7/99 درصد در بازشناسي صحيح حاصل گرديد..
کليدواژگان:
تحليل تصوير مدارك (دي آي اي)، تحليل پيكربندي صفحات، تحليل ساختاري مدارك، تحليل منطقي مدارك، درك تصوير مدارك، شناسايي صفحات فهرست، پردازش تصوير[8]، بازشناسي نوري حروف (اُسي آر) ، شناسايي الگو، كتابخانه ديجيتال.
|