نمايش پست تنها
قديمي ۰۱-۷-۱۳۸۹, ۰۱:۵۰ بعد از ظهر   #3 (لینک دائم)
mardin200 Male
Administrator
 
آواتار mardin200
 
تاريخ عضويت: آذر ۱۳۸۸
محل سكونت: تهران
پست ها: 309
تشكرها: 120
1,748 تشكر در 263 پست
My Mood: Mehrabon
Wink خلاصه ای از ترجمه مقاله بالا

Learning and inferencing in user ontology for personalized Semantic Web search

هدف User ontology گرفتن علایق کاربران در محیط های کاری مختلف است.که پایه سرویس اطلاعات شخصی را فراهم می کند.
در این مقاله برای فراهم کردن اطلاعات شخصی شده در وب یک آنتولوژی بر پایه ی User model ارائه می دهیم که user ontology گفته می شود. برخلاف دستاوردهای قبلی که تنها از مفاهیم و روابط طبقه بندی شده استفاده می کردند، مدل پیشنهاد شده از مفاهیم، روابط طبقه بندی شده و روابط طبقه بندی نشده در دامنه آنتولوژی داده شده استفاده می کند بطوری که بتواند علایق و خواسته های کاربران را بدست آورد. به عنوان یک دید شخصی از دامنه آنتولوژی یک user ontology با دقت بیشتر علایق کاربران را در دامنه هدف مشخص می کند. ما در اینجا یک روش آماری تعریف می کنیم برای یادگیری آنتوبوژی، و از یک domain ontology و یک پروسه فعال سازی انتشار برای استنتاج از آنتولوژی استفاده می کنیم. نهایتاً با استفاده از این دو روش یک موتور جستجوی معنایی را ایجاد می کنیم.
Domain Ontology
به عنوان ستون فقرات وب معنایی به شمار می رود که با فراهم کردن لغات و مفاهیم فرمال از یک دامنه مشخص که می تواند share کردن اطلاعات و تغییرات آنها را ساده تر کند. Domail ontology تا حدی می تواند به صورت مفید اطلاعات را از یک دامنه و منبع اطلاعاتی بگیرد. سیستم¬های زیادی تا کنون از domain ontology استفاده کردند و تا حدی موفق بودند.
User Ontology
در خیلی از موارد سیستم¬هایی که ما می سازیم کاربرهای مختلفی با آنها کار می کنند و این کاربرها ممکن است علایق متفاوتی داشته باشند و برای یک درخواست یکسان از سیستم، برای دو کاربر مختلف نخواهند نتیجه یکسانی را دریافت کنند بلکه با توجه با علایق و نیازشان جوابهایی را از سیستم بگیرند. دقیقاً هدف user ontology همین است که در ایجاد یک آنتولوژی علایق کاربران هم تأثیر گذار باشد.
چالش اصلی در ایجاد یک سرویس شخصی سازی شده اطلاعات نحوه گرفتن علایق کارابران است. این کار، کار نسبتاً جدیدی است و افراد کمی روی آن کار کرده اند. پرتچنر و گاچ از پیشگامان استفاده از آنتولوژی برای مدل کردن کاربران، برای دسترسی به اسناد بر اساس علاقه آنها هستند. روش کار آنها به این صورت است که بر اساس استفاده های مکرر کاربران و تاریخچه جستجوهایی که انجام می دهند برای آنها پروفایل هایی ایجاد می شود که از این به بعد از پروفایل های موجود برای بازیابی نتیجه جستجو استفاده می شود.
از معایب اصلی این روش این است که اگر علایق کاربران تغییر پیدا کند این تغییرات روی سیستم اعمال نخواهد شد و مشکل دیگر این روش، این است که تنها از مفاهیم استفاده می کند و روابط بین مفاهیم را در نظر نمی گیرد.
همانطور که اشاره شد هدف اصلی ما در این مقاله این است که علایق کاربران را گرفته و در آنتولوژی بگنجانیم. برای این کار یک user ontology model تعریف کردیم که روی یک domain ontology عمل می کند به این صورت که اگر ما یک سری مفاهیم داشته باشیم که آنها را با گرههای گراف نشان دهیم و روابط هم یالهای گراف باشند به هر کدام از نودها و یالها عددی اختصاص خواهد یافت که میزان علاقه کاربر را به آن موضوع خاص بیان می کند.

شکل 1
مثلا در شکل1 که یک قسمت از domain ontology مربوط به تیم های سری A فوتبال ایتالیا است نود مربوط به Ac Milan 1 است در حالی که مقدار نود Inter Milan 0.4 است که مشخص می کند که میزان علاقه به Ac Milan بیشتر است یا اینکه می توان از گراف نتیجه گرفت که کاربر بیشتر تمایل دارد که رابطه Ac Milan را با لیگ اروپا بداند.
در واقع کار اصلی که ما در اینجا انجام می دهیم این است که به نودها و روابط بین آنها اعدادی نسبت می دهیم که مقدار عدد بیان کننده میزان علاقه کاربر به آن موضوع خاص است.
Spreating activation theory
برای اختصاص دادن مقادیر مختلف به نودها از تئوری فعال سازی انتشار استفاده می کنیم روند کار به این صورت است که اگر به یک نود مقدار آغازی اختصاص دهیم به سایر نودها که به صورت مستقیم یا غیرمستقیم با آن در ارتباط هستند با توجه به رابطه ای که بین آنها وجود دارد عددی تعلق خواهد گرفت. به عنوان مثال در شکل1 اگر نود تیم مقدار 1 را بگیرد، انتظار داریم که این مقدار با توجه به یک سری روابط که در مقاله ذکر شده بین سایر نودها انتشار پیدا کند.
در واقع کار اصلی تئوری فعال سازی انتشار، بدست¬آوردن میزان علاقه فعلی کاربر به هر کدام از مفاهیم است که سپس این مقدار با میزان علاقه قبلی کاربر ترکیب می¬شود تا یک سرویس شخصی¬سازی شده را فراهم کند.
User ontology learning
بعد از اینکه یک مدل برای آنتولوژی تعریف کردیم حالا باید آنتولوژی را آموزش دهیم. در اینجا ما از یک روش آماری برای یادگیری آنتولوژی استفاده می کنیم. همانطور که گفته شد روشهای قبلی فقط از مفاهیم استفاده می کردند البته همراه با مشکلاتی که ذکر شد ولی ما هم از مفاهیم و هم از روابط بین مفاهیم استفاده می کنیم به همین خاطر باید یادگیری را هم روی مفاهیم انجام دهیم و هم روی روابط.


OntoSearch
حال که یک user ontology ساختیم و آن را آموزش دادیم ببینیم چه استفاده¬هایی می¬توان از آن کرد. قطعاً در خیلی از موارد می¬توان از یک user ontology استفاده کرد. ولی ما در اینجا می¬خواهیم به کمک آن یک موتور جستجوی معنایی ایجاد کنیم. روند کار را در شکل2 مشاهده می کنید

شکل2
در ابتدا کاربر Query خود را از سیستم می پرسد و سیستم جستجو را keyword base انجام می دهد و نتایج اولیه به صورت لیستی از اسناد باز گردانده می شوند سپس از بین این اسناد مفاهیم را استخراج می کنیم حال به کمک تئوری فعال سازی انتشار و user ontogy موجود سعی می کنیم که اسناد را رتبه بندی کنیم به شکلی که اسنادی که امتیاز بیشتری را بگیرند به مرتبه های بالاتر منتقل می شوند و اسناد غیرمرتبط با سلیقه کاربر حذف می شوند و نهایتاً اسناد رتبه بندی شده که حاصل جستجوی معنایی هستند به کاربر نشان داده می¬شوند.



Experiments
برای ارزیابی کارایی موتور جستجویی که ما ساختیم از دو تا dataset مختلف استفاده کرده ایم:
1. Searching ACM digital library
یک پایگاه داده online شامل 54000 مقاله مرتبط با کامپیوتر از 30 ژورنال مختلف می باشد این آنتولوژی نسبتاً کوچک است و دارای ساختار سلسله مراتبی می باشد. در این آنتولوژی دو مفهوم، زمانی با هم مرتبط هستند که هر دو در مشخص کردن یک سند مشارکت داشته باشند.
2. Searching google directory
یک سرویس مورد استفاده google است به منظور یکپارچه¬سازی تکنولوژی جستجوی خودش از آن استفاده می کند. همانند ACM در اینجا هم صفحات اندکس گذاری شده در دایرکتوری google با استفاده از مفاهیم برچسب گذاری می شوند.
در واقع می¬توان گفت یک آنتولوژی نسبتاً بزرگ است که از ساختار طبقه بندی ODP استفاده میکند و در آن اطلاعات به 16 طبقه اصلی تقسیم می شوند که هر کدام از آنها می¬تواند شامل زیر طبقه هایی باشد. همچنین از لحاظ ساختاری، ساختار غنی تری نسبت به آنتولوژی دیگر دارد.

برای آزمایش سیستم بر روی این دو آنتولوژی یک گروه 10 نفره را در نظر می¬گیریم. هر کدام از افراد دو سری query از سیستم می¬پرسند یکی برای آموزش و یکی برای تست. ما نتایج جستجو را با دو سیستم دیگر یعنی Google Directory و Ontosearch مقایسه کردیم. نتایج بدست آمده در همه موارد نشان دهنده آن است که روش پیشنهادی ما کارایی بهتری دارد یا حداقل در بدترین شرایط کاراییش برابر با بقیه است. ولی در مقایسه کارایی سیستم برای دو آنتولوژی مختلف مشاهده می شود که کارایی سیستم برای ACM بهتر است البته این مسئله قابل توجیه است همان طور که اشاره شد Google directory یک آنتولوژی نسبتا بزرگ است و پیدا کردن همه روابط بین مفاهیم آن کار پیچیده و وقت گیری خواهد بود به همین خاطر ما از ساختار طبقه بندی موجود تنها 3 طبقه اول را انتخاب کردیم که این روی کارایی سیستم تأثیر گذاشت. ولی در نهایت نتایج رضایت بخش بودند.

ما در این مقاله سعی داشتیم که علایق کاربران را در یک آنتولوژی بگنجانیم به همین منظور User ontology را تعریف کردیم که مفهوم نسبتاً جدیدی است. با استفاده از تئوری فعال¬سازی انتشار و بر روی یک آنتولوژی عادی، علایق کاربران را اضافه کردیم. سپس آنتولوژی را با استفاده از یک سری روش¬های آماری آموزش دادیم و با استفاده از این آنتولوژی جدید یک موتور جستجوی معنایی با میزان کارایی خوبی ساختیم.

نویسنده: محمد الیاسی

ويرايش شده توسط mardin200; ۰۱-۷-۱۳۸۹ در ساعت ۰۲:۰۶ بعد از ظهر
mardin200 آفلاين است   پاسخ با نقل قول
از mardin200 تشكر كرده اند:
alek (۱۰-۲۴-۱۳۹۰), amird1991 (۱۱-۲-۱۳۹۰), Astaraki (۰۴-۱۹-۱۳۸۹), ma.nejati (۰۴-۲-۱۳۹۱), maryam1361 (۰۶-۱۸-۱۳۹۲), pasmod (۰۱-۷-۱۳۸۹), SABRA1365 (۱۱-۱۴-۱۳۹۰), sare_2007 (۰۲-۲۴-۱۳۹۰)