نمايش پست تنها
قديمي ۱۱-۴-۱۳۸۸, ۰۵:۱۵ بعد از ظهر   #49 (لینک دائم)
Astaraki Female
Administrator
 
آواتار Astaraki
 
تاريخ عضويت: خرداد ۱۳۸۷
محل سكونت: تهران-کرج!
پست ها: 3,465
تشكرها: 754
16,337 تشكر در 3,127 پست
My Mood: Mehrabon
ارسال پيغام Yahoo به Astaraki
Wink

شناسايي دنباله زيرحروف متون چاپي فارسي با استفاده از قابليت پردازش زماني-مکاني شبكه عصبي با انتشار هدايت يافته

در زبان فارسي اتصال حروف به هم باعث ميشود که کلمات به شکل دنبالهاي از حروف درآيند. بنابراين استفاده از روشي که بتواند دنباله زيرحروف فارسي را شناسايي کند ميتواند منجر به بازشناسي بهتر کلمات فارسي شود. در اين مقاله، از شبكه عصبي با انتشار هدايت يافته براي شناسايي دنباله ها استفاده شده است. زيركلمات بدون نقطه، با استفاده از روشي به زيرحروف شكسته ميشوند. هر زيرحرف با زيرحرفهاي به دست آمده از فونت لوتوس مقايسه شده و ميزان شباهت آن با استفاده از معيار فاصله اقليدسي و ويژگي گشتاور مركزي نرمالشده سنجيده ميشود. سپس اين مقادير براي شناخت دنباله زيرحروف به شبكه داده مي شود. شبكه با انتشار هدايت يافته با استفاده از اين داده ها و همچنين اطلاعات آماري که از ساختار زيرکلمات فارسي و تعداد تکرار آنها دارد به شناسايي دنباله ميپردازد. اين شبکه يک ساختار درختي دارد و به صورت بدون ناظر عمل ميكند و براي هر زيركلمه ممكن است چندين پيشنهاد با درجه شباهت گوناگون ارايه كند. پايگاه داده، زيركلمات متداول روزنامه هاي فارسي بودند که در معرض نوعي از اعوجاج قرار گرفتند. نتايج شناسايي پس از اعمال شبكه در مقايسه با معيار فاصله اقليدسي بهبود چشمگيري يافت.
فايل ضميمه
نوع فايل: pdf 9.pdf (320.5 كيلو بايت, 551 نمايش)
Astaraki آفلاين است   پاسخ با نقل قول
از Astaraki تشكر كرده اند:
saber187518 (۰۹-۲۳-۱۳۹۰), vahid135 (۰۳-۸-۱۳۹۰)