سلام
به طور کلی وبکاوی دارای سه شاخی اصلی هست:
۱) Web Usage Mining : در این حوزه هدف استفاده از فایل های لاگ برای پیش بینی رفتار کاربر در وب میباشد. به طور مثال ارائه صفحات پیشنهادی به کاربر، Prefetching و caching با توجه به علایق کاربر در این زمینه قرار میگیرد. منابع لاگ معمولا از : لاگ های وب سرور - لاگهای پروکسی و کش سمت کلاینت تامین میشود
۲) Web Structure Mining : هدف یافتن صفخات وبی میباشد که شباهت زیادی از لحاظ ساختار با یکدیگر دارند. در این نوع از وبکاوی عموما ساختار لینک ها در نظر گرفته میشود. به عنوان یک کاربرد فرض کنید از وب سایتی مانیتور خریداری میکنیم ولی این وب سایت دارای کیبرد نیست. با این تکنیک ها میتوان وب سایت هایی را به کاربر معرفی کرد که کیبرد نیز به فروش میرسانند.
۳) Web Content Mining : این شاخه از وبکاوی اشاره به کاوش محتوای درون صفحات وب دارد. این محتوا متن، تصویر، مالتی مدیا و ... را شامل میشود. در اکثر کاربرد ها فقط متون درون صفحات وب در نظر گرفته میشود که این شاخه را هم ردیف متن کاوی قرار میدهد. همچنین در ترکیب با وب معنایی(Semantic) بسیار مورد استفاده قرار میگیرد. با ترکیب با وب معنایی شاخه Semantic Web Mining ایجاد میشود.
حالا شما در هر زمینه که علاقه مند هستید میتونید فعالیت کنید. البته این نکته را هم یاد آور کنم که سه شاخه بالا در کاربرد هایی با یکدیگر نیز ترکیب میشوند.
موضوع بسیار جالب و کاربردی برای کار انتخاب کردید.
موفق باشید.
|