شناسايي دنباله زيرحروف متون چاپي فارسي با استفاده از قابليت پردازش زماني-مکاني شبكه عصبي با انتشار هدايت يافته
در زبان فارسي اتصال حروف به هم باعث ميشود که کلمات به شکل دنبالهاي از حروف درآيند. بنابراين استفاده از روشي که بتواند دنباله زيرحروف فارسي را شناسايي کند ميتواند منجر به بازشناسي بهتر کلمات فارسي شود. در اين مقاله، از شبكه عصبي با انتشار هدايت يافته براي شناسايي دنباله ها استفاده شده است. زيركلمات بدون نقطه، با استفاده از روشي به زيرحروف شكسته ميشوند. هر زيرحرف با زيرحرفهاي به دست آمده از فونت لوتوس مقايسه شده و ميزان شباهت آن با استفاده از معيار فاصله اقليدسي و ويژگي گشتاور مركزي نرمالشده سنجيده ميشود. سپس اين مقادير براي شناخت دنباله زيرحروف به شبكه داده مي شود. شبكه با انتشار هدايت يافته با استفاده از اين داده ها و همچنين اطلاعات آماري که از ساختار زيرکلمات فارسي و تعداد تکرار آنها دارد به شناسايي دنباله ميپردازد. اين شبکه يک ساختار درختي دارد و به صورت بدون ناظر عمل ميكند و براي هر زيركلمه ممكن است چندين پيشنهاد با درجه شباهت گوناگون ارايه كند. پايگاه داده، زيركلمات متداول روزنامه هاي فارسي بودند که در معرض نوعي از اعوجاج قرار گرفتند. نتايج شناسايي پس از اعمال شبكه در مقايسه با معيار فاصله اقليدسي بهبود چشمگيري يافت.