Artificial Intelligence - هوش مصنوعی

Artificial Intelligence - هوش مصنوعی (http://artificial.ir/intelligence/)
-   پردازش و کاوش متن( Text Mining and processing ) (http://artificial.ir/intelligence/forum17.html)
-   -   يك روش آماري مبتني بر پيكره براي جداسازي واژه هاي به هم چسبيده (http://artificial.ir/intelligence/thread3927.html)

Astaraki ۰۶-۲۱-۱۳۸۹ ۰۶:۲۳ قبل از ظهر

يك روش آماري مبتني بر پيكره براي جداسازي واژه هاي به هم چسبيده
 
1(ها)ضميمه
يك روش آماري مبتني بر پيكره براي جداسازي واژه هاي به هم چسبيده

چکیده :
در این مقاله، یک روش آماری مبتنی بر پیکره برای شناسایی واژه‌های به هم چسبیده معرفی شد. این روش، با استفاده از معیار احتمال شرطی متقارن تعیین می‌کند که آیا یک عنصر متنی، یک واژه‌ی کامل است یا مجموعه‌ای از واژه‌های به هم چسبیده است. روش پیشنهادی روی یک مجموعه‌ی 18000 تایی از اخبار ورزشی مورد آزمایش قرار گرفت و نتایج قابل قبولی را نشان داد. به ازای هر دو آستانه‌ی 0.001 و 0.0001 تعداد نمونه‌هایی که به درستی از هم جدا شدند به کل نمونه‌های جداشده نسبت قابل قبولی (بیش از 80 درصد در مورد نمونه‌های جداشده به دو بخش) را نشان داد.


كليد واژه:
پیکره‌ی متنی، تعیین مرز واژه‌ها، با‌هم‌آیی، احتمال شرطی متقارن


زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۰۸:۳۶ قبل از ظهر ميباشد.

Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.