Artificial Intelligence - هوش مصنوعی  
انجمن را در گوگل محبوب کنيد :

بازگشت   Artificial Intelligence - هوش مصنوعی > یادگیری (Learning) > دسته بندي (Classification)


 

تبليغات سايت
Iranian Association for the Advancement of Artificial Intelligence
ارسال تاپيک جديد  پاسخ
 
LinkBack ابزارهاي تاپيک نحوه نمايش
قديمي ۰۵-۱۸-۱۳۸۹, ۰۹:۱۹ بعد از ظهر   #1 (لینک دائم)
Administrator
 
آواتار Astaraki
 
تاريخ عضويت: خرداد ۱۳۸۷
محل سكونت: تهران-کرج!
پست ها: 3,465
تشكرها: 754
16,315 تشكر در 3,126 پست
My Mood: Mehrabon
ارسال پيغام Yahoo به Astaraki
Smile ارتقاي كيفيت دسته‌بندي متون با استفاده از كميته‌ دسته‌بند دو سطحي

ارتقاي كيفيت دسته‌بندي متون با استفاده از كميته‌ دسته‌بند دو سطحي

چکیده:
امروزه با توجه به رشد روز افزون دسترسي به اسناد الكترونيكي، دسته‌بندي خودكار اهميت وي‍‍ژه‌اي يافته است. روش‌هاي معمول در اين زمينه، روش‌هاي يادگيري ماشين هستند. روش‌هاي بر اساس كميته كارايي بهتري نسبت به ساير روش‌ها از خود نشان داده‌اند. در اين مقاله، دو ايده در زمينه كميته‌هاي دسته‌بند ارائه شده است. ايده اول برمبناي كميته‌ bagging كه در آن هركدام از اعضاي كميته روي زيرمجموعه‌اي از مجموعه سندهاي آموزشي، ساخته مي‌شوند، ارائه شده است. بر اساس اين ايده، ابتدا مجموعه آموزش با يك روش خوشه‌بندي به چند خوشه، بر اساس مشابهت يا عدم مشابهت كلاس‌هاي اسناد آموزشي، تقسيم مي‌شود و سپس از روي هر خوشه از اسناد، يك دسته‌بند ساخته شده و به عنوان عضو كميته قرار داده مي‌شود (روش يادگيري اعضاي كميته يكسان است). در ايده دوم ساخت كميته‌اي دو سطحي مطرح شده است. در اين ايده اعضاي كميته‌هاي سطح دوم خود كميته‌هايي هستند كه بر مبناي ايده اول ساخته مي‌شوند. در ارزيابي ايده اول مشخص شد كه افزايش كارايي بر مبناي معيار دقت و معيار بازخواني در كميته بيزين ساده نوع اول، بيشتر از ساير كميته‌هاي نوع اول بوده و به ترتيب 12 درصد و 1/5 درصد مي‌باشد. ارزيابي‌ها در كميته نوع دوم (برمبناي ايده دوم)، افزايش كارايي را نسبت به كميته نوع اول نشان مي‌دهند كه بيشترين آن نسبت به كميته Rocchio نوع اول بوده، كه معيار دقت را در حدود 8/3 درصد و معيار بازخواني را در حدود 8/18 درصد افزايش داده است.

کلمات کلیدی :
دسته‌بندي متون – Rocchio ، بيزين ساده – SVM ، خوشه‌بندي متن ، كميته دسته‌بندي ، كميته bagging ، Text Classification – Rocchio ، Naïve Bayesian ، SVM ، Text Clustering ، Classification Committee ، Bagging Committee

چکیده (انگلیسی):

Nowadays, the automated text classification has witnessed special importance due to the increasing availability of documents in digital form and ensuing need to organize them. Although this problem is in the Information Retrieval (IR) field, the dominant approach is based on machine learning techniques. Approaches based on classifier committees have shown a better performance than the others. In this research, in addition to study text classification techniques and classification committees, two ideas in this field are proposed. The first idea, is proposed based on Bagging committees. According to this idea, first, a training set by one of clustering techniques automatically is divided into several clusters based on class similarity (or dissimilarity). So for documents of every cluster, a classifier is trained and put in the committee as a member. In this approach the members of committee are created by the same technique. In our experiments for this idea, Naïve Bayesian, Rocchio and SVM learning techniques are used. In the second idea, the creation of two layered committee is discussed. Based on this idea, one committee can be created that its members are itself a committee. Members of subcommittees are creating based on the first idea. This idea is based on the fact that if Naïve Bayesian committee acts better than Naïve Bayesian classifier and so, a committee out of these committees will improve the performance of classification. Evaluation of the first idea showed that the improvement in performance based on precision and recall in Naïve Bayesian committee is exceeded the other committees (respectively 12 and 5.1 percent). Evaluation of the second idea showed that the improvement in performance in the second type of committee (based on the second idea) is more than that in the first type of committee (based on the first idea). Most improvement of performance in the second type of committee is referred to the Rocchio’s committee (based on precision and recall 3.8 and 18.8 percent, respectively).
فايل ضميمه
نوع فايل: pdf Main_1PArt_12652Jalili.pdf (366.6 كيلو بايت, 217 نمايش)
Astaraki آفلاين است   پاسخ با نقل قول
از Astaraki تشكر كرده اند:
mardin200 (۰۵-۱۸-۱۳۸۹), mehdi hajian (۱۱-۲-۱۳۹۰)

  #ADS
نشان دهنده تبلیغات
تبليغگر
 
 
 
تاريخ عضويت: -
محل سكونت: -
سن: 2010
پست ها: -
 

نشان دهنده تبلیغات is online  
پاسخ



كاربران در حال ديدن تاپيک: 1 (0 عضو و 1 مهمان)
 
ابزارهاي تاپيک
نحوه نمايش

قوانين ارسال
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is فعال
شکلکها فعال است
كد [IMG] فعال است
كدهاي HTML غير فعال است
Trackbacks are فعال
Pingbacks are فعال
Refbacks are فعال




زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۰۲:۳۵ قبل از ظهر ميباشد.


Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2020, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.

Teach and Learn at Hexib | Sponsored by www.Syavash.com and Product In Review

استفاده از مطالب انجمن در سایر سایت ها، تنها با ذکر انجمن هوش مصنوعي به عنوان منبع و لینک مستقیم به خود مطلب مجاز است

Inactive Reminders By Icora Web Design