معیارهای قبلی برای ارزیابی سیستم های توصیه گر
هرگاه یک سیستم توصیه گر ارزیابی شده است، معیاری استفاده می شود که بر اساس یک سری فرضیات خاص برای آن ساخته شده است. بنابراین، ما این بخش را به مرور و بررسی رایج ترین معیارها با مشخص کردن مفروضاتی که بر آنها استوار هستند اختصاص خواهیم داد و پر اهمیت ترین آنها را در نظر خواهیم گرفت. برای این منظور، اول از همه، ما شروع به توصیف چارچوب معمول پذیرفته شده در این زمینه برای تعریف فرآیند توصیه عمومی می نماییم.
در این چارچوب فعلی، یک سیستم توصیه گر در سیستم دیگری حاوی تعدادی از آیتم های موجود که توصیه می شوند تعبیه شده است. به منظور آغاز روند توصیه، آیتم های موجود بایستی توسط افراد درجه بندی شوند. در بسیاری از سیستم های توصیه گر این درجه بندی به وضوح فراهم می گردد. در برخی از موارد دیگر، این درجه بندی و ارزیابی از فعل و انفعالات سایر کاربران استنباط می شود و رتبه های ضمنی نامیده می شوند.
پس از آن ، هنگامی که سیستم توصیه گر به اندازه کافی رتبه بندی داشته باشد، این روند می تواند شروع شود. برای هر یک از توصیه ها، تعداد N<=I از اشیاء توسط توصیه گر انتخاب شده ، و به کاربر مورد نظر نشان داده می شود. علاوه بر این ، برخی از سیستم های توصیه گر همچنین اشیای محدود شده و برگزیده را جهت نمایش به کاربر در قالب یک لیست مرتب رتبه بندی می کنند. در مرحله بعد، کاربر احتمالا آیتم هایی را که در بالای این لیست ظاهر می گردند وارسی می کند.
در نهایت ، به منظور ارزیابی عملکرد سیستم توصیه گر ، برای هر شیء نشان داده شده به یک کاربر خاص ما باید میزان مطلوبیت و نزدیکی آیتم نشان داده شده را نسبت به ترجیحات کاربر انداره گیری نماییم. علاوه بر این ، در مورد لیست مرتب، ما باید مکان هر آیتم توصیه شده در این لیست را نیز به حساب آورده و تفسیر نماییم. در ادامه ، مرور سریعی بر چگونگی ارزیابی های انجام شده تا به امروز خواهیم داشت.
ملاحظات اولیه
به منظور اندازه گیری میزان نزدیکی پیش بینی ها به ترجیحات واقعی کاربران به طور معمول از یک نمایش عددی استفاده می شود. علاوه بر این ، به دلیل شفافیت بیشتر از علائم یکسانی در ادامه ی بخش جاری استفاده خواهیم کرد. برای این منظور( P(u , i پیش بینی سیستم توصیه گر برای کاربر خاص u و آیتم i و( p(u , i مقدار واقعی ترجیحات کابر تعریف می گردد.
واضح است، تابع( p(u , iهرگز نمی تواند با دقت مطلق آشکار گردد. بنابراین، ارزش این تابع معمولا با استفاده از رتبه بندی های قبلی کاربران تخمین زده می شود. همانطور که در بالا گفته شد این رتبه بندی می تواند به طور صریح یا ضمنی حاصل گردد.
در برخی موارد، هر دو تابع( p(u , i و( P(u , i تنها دو مقدار 1 یا 0 را ارائه می دهند که بدین معنی خواهد بود که آیتم خاص i برای کاربر خاص u به ترتیب مفید یا بی فایده در نظر گرفته شده است. برای این مورد منحصر بفرد، توابع p و P توابع دوتایی نامیده می شوند.
|