بحث مهمی در ارزیابی سیستم های توصیه گر
این را نمی توان انکار کرد که نوعی عدم یکنواختی در معیارهای فعلی برای ارزیابی سیستم های توصیه گر وجود دارد که یحتمل به خاطر تعداد زیاد آنها خواهد بود.
با این حال، ما تلاش خواهیم کرد آنها را بسته به روشی که آنها کمیت رفتار خوب یک سیستم توصیه گر را تعیین می کنند، به یکی از سه دسته طبقه بندی کنیم.
(1) پیش بینی امتیاز. این معیارها بر روی اندازه گیری ظرفیت سیستم توصیه گر برای پیش بینی امتیازی که یک کاربر به یک آیتم خواهد داد قبل از انجام این امتیاز دهی متمرکز شده اند.
(2) پیش بینی رتبه بندی. این معیارها بر روی اندازه گیری ظرفیت سیستم توصیه گر برای پیش بینی رتبه ای که یک کاربر بر روی مجموعه ای از اقلام خواهد داد قبل از انجام این رتبه بندی متمرکز شده اند.
(3) ظرفیت تصمیم گیری موفق (SDMC). این معیارها بر روی اندازه گیری ظرفیت سیستم توصیه گر برای ایجاد یک تصمیم گیری (توصیه) موفق متمرکز شده اند.
جهت این طبقه بندی در ذهن، ما باید MAE ( و معیارهای مربوط به آن) را به طبقه اول، معیارهای رتبه بندی را به طبقه دوم، و دقت ( و معیارهای مرتبط با آن) و معیارهای IR را به طبقه سوم تخصیص دهیم.
اکنون، اگر ما هدف اصلی از سیستم توصیه گر (اعلام شده در ابتدای بخش 1) را ارائه نماییم، مشاهده میکنیم آنچه که طبقه های اول و دوم از معیارها سعی بر اندازه گیری آن دارند را میتوان نوعی از معیارهای بیش از حد دارای جزئیات آن دانست. در واقع، ما نباید مفروضات بیشتری نسبت به آنچه که در واقع لازم دارند، بسازیم. با این حال، هیچ اشاره ای به امتیاز یا رتبه در تعریف هدف یک سیستم توصیه گر وجود ندارد. علاوه بر این، حتی با فرض اینکه توان یک آیتم مفید یک باشد که در اینصورت p(u , i) به اندازه کافی بالا خواهد بود، براستی جای بحث است که ما می توانیم تنها با استفاده از امتیازات کاربران مقدار دقیق تابع p(u , i) را نتیجه بگیریم]41[. در نتیجه، تمایل ما این است که ساخت متریک هایی که فقط هدف واقعی از یک نوع سیستم توصیه گر را اندازه گیری می کنند محدود نماییم که البته بایستی هشیار باشیم که مفروضات ساخته شده باید در سایر سیستم های توصیه گر مناسب از آغاز اندازه گیری قابل تنظیم کردن باشد.
بنابراین، برای حفظ روشی به اندازه کافی عمومی که هر سیستم توصیه گری با هدف بیان شده¬ی قبلی را در بر بگیرد، به خاطر داشته باشیم که این هدف در مبحث شرایط تصمیم گیری سیستم توصیه گر بیان گردید. بنابراین، معیارهای SDMC به عنوان مناسب ترین گزینه برای این کار به نظر می رسد.
با این حال، توجه داشته باشید که هنگامی که ما به یک توصیه مفید در معیار SDMC اشاره می کنیم، به طور کلی در نظر داریم که یک توصیه موفق، توصیه ای است که در آن آیتم توصیه شده مشابه با علایق واقعی کاربر مورد نظر باشد. به عبارت دیگر، اگر توابع ترجیح باینری کاربران را در نظر بگیریم، توصیه های موفق، آنهایی هستند که در مورد آنها داشته باشیم: | p(u , i) - P(u , i) | = 0
در این مرحله، ما می خواهیم دو پیش فرض مهم را که در پشت این باور معروف وجود دارد بیان نماییم:
(1) فرض اول اینکه یک توصیه موفقیت آمیز است اگر و تنها اگر آیتم توصیه شده، مفید واقع گردد. با این حال، یک هدف توصیه نیز راهنمایی به کاربر می باشد. علاوه بر این، اگر توصیه ای نه "مناسب" و نه به اندازه کافی "جذاب" برای هدایت کاربر به آیتم توصیه شده ارائه گردد، تمامی توصیه ها علی رغم سودمندی آیتم غیر قابل استفاده خواهند بود. به عبارت دیگر، مجزای از تصمیم متداول برای اینکه چه چیزی را توصیه کنیم، نیازمندیم که انتخاب کنیم چه وقت و چگونه توصیه کنیم.
(2) فرض دوم اینکه یک آیتم توصیه شده سودمند است اگر و تنها اگر ترجیحات مربوط به آیتم توصیه شده، منطبق بر ترجیحات کابر هدف واقع گردد. هر چند، این امر همیشه صحیح نیست. به عنوان مثال، بسیاری از سیستم های تجارت الکترونیک را در نظر بگیرید که در آن یک آیتم توصیه شده هر زمان که منجر به تحریک برای انجام یک معامله گردد، مفید است. به طور طبیعی، در مورد دومی می تواند هیچ ارتباطی با ترجیحات کاربر نداشته باشد. در واقع، آن می تواند یک ضرورت و نیاز باشد. بنابراین، سودمندی یک آیتم توصیه شده باید تجدید نظر گردیده و مورد تعمیم قرار گیرد.
بخاطر دلایل ذکر شده در بالا مدعی هستیم "مشخصات بیش از حدی" در معیارهای فعلی برای سیستم های توصیه گر وجود دارد. به عنوان یک راه حل، ما یک چارچوب به اندازه کافی عمومی برای تجزیه ی سیستم های توصیه گر با پیروی از سیاستهای تصریح شده فراهم خواهیم کرد، اما به اندازه کافی خاص که نتایج مهمی از آن حاصل گردد. برای این منظور، ما فرض خواهیم کرد تنها هدف سیستم های توصیه گر راهنمایی کاربران به اشیای جالب و مفید می باشد.
|