Artificial Intelligence - هوش مصنوعی  
انجمن را در گوگل محبوب کنيد :

بازگشت   Artificial Intelligence - هوش مصنوعی > پردازش صوت، گفتار و زبان طبيعی ! > پردازش زبان طبيعی (Natural Language Processing)


 

تبليغات سايت
Iranian Association for the Advancement of Artificial Intelligence
ارسال تاپيک جديد  پاسخ
 
LinkBack ابزارهاي تاپيک نحوه نمايش
قديمي ۰۲-۲۴-۱۳۸۹, ۱۰:۴۰ قبل از ظهر   #1 (لینک دائم)
Administrator
 
آواتار Astaraki
 
تاريخ عضويت: خرداد ۱۳۸۷
محل سكونت: تهران-کرج!
پست ها: 3,465
تشكرها: 754
16,314 تشكر در 3,125 پست
My Mood: Mehrabon
ارسال پيغام Yahoo به Astaraki
Cool نرمالساز متون فارسی

نرمالساز متون فارسی

خلاصه مقاله:
افزايش كاربردهاي زبان فارسي در سامانه هاي رايانه اي موجب بروز چالشهاي جديدي در حوزهي پردازش متون شده است. يكي از اين چالشها مشكل تشخيص صحيح كلمات و بهخصوص كلماتچندقسمتي و مركب است. اكثر كاربران به فاصله گذاريها توجه نميكنند و همچنين قواعد دقيقي در نوشتن كلمات چندقسمتي، وجود ندارد كه باعث بروز مشكلات متعدد نشانه گذاري (Tokenizing) مي شوند. در اين مقاله، روشي براي اصلاح نشانه هاي (Tokens) فارسي ارائه شده است. متون فارسي جهت استفاده در هر سيستم بايد داراي كلمات مشخص و مجزا باشند. در روش پيشنهادي براي نشانه گذاري، مشكل تصريفي ها و مركبها حل ميشود و هر كلمه مركب يا چندقسمتي يك نشانه است. اين روش با تهيه ي لغتنامه هاي مربوط به كلمات مركب و برخي استثنائات، متون داراي دستورالعملهاي متفاوت نوشتاري را به نشانه هايي منطبق بر استاندارد مينگارد. نتايج نهايي، عملكرد بسيار خوب اين روش را به صورت مجزا و به عنوان پيش پردازش ساير فعاليتها، بالاي 99 % و بسيار موثر نشان ميدهند.

كلمات كليدي:
پردازش زبان طبيعي، نرمالسازي، نشانه گذاري، واژه هاي تصريفي، Scheme
فايل ضميمه
نوع فايل: pdf CSICC15_252_280420.pdf (79.5 كيلو بايت, 239 نمايش)
Astaraki آفلاين است   پاسخ با نقل قول
از Astaraki تشكر كرده اند:
mofateh (۰۱-۲۷-۱۳۹۳), mr.xvi (۱۲-۸-۱۳۹۲)

  #ADS
نشان دهنده تبلیغات
تبليغگر
 
 
 
تاريخ عضويت: -
محل سكونت: -
سن: 2010
پست ها: -
 

نشان دهنده تبلیغات is online  
پاسخ



كاربران در حال ديدن تاپيک: 1 (0 عضو و 1 مهمان)
 
ابزارهاي تاپيک
نحوه نمايش

قوانين ارسال
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is فعال
شکلکها فعال است
كد [IMG] فعال است
كدهاي HTML غير فعال است
Trackbacks are فعال
Pingbacks are فعال
Refbacks are فعال




زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۰۷:۲۵ بعد از ظهر ميباشد.


Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2020, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.

Teach and Learn at Hexib | Sponsored by www.Syavash.com and Product In Review

استفاده از مطالب انجمن در سایر سایت ها، تنها با ذکر انجمن هوش مصنوعي به عنوان منبع و لینک مستقیم به خود مطلب مجاز است

Inactive Reminders By Icora Web Design