Artificial Intelligence - هوش مصنوعی  
انجمن را در گوگل محبوب کنيد :

بازگشت   Artificial Intelligence - هوش مصنوعی > داده کاوی > پردازش و کاوش متن( Text Mining and processing )


 
تبليغات سايت
Iranian Association for the Advancement of Artificial Intelligence
ارسال تاپيک جديد  پاسخ
 
LinkBack ابزارهاي تاپيک نحوه نمايش
قديمي ۰۷-۲۳-۱۳۸۷, ۱۱:۱۴ قبل از ظهر   #1 (لینک دائم)
Active users
 
آواتار mohammad_tz
 
تاريخ عضويت: شهريور ۱۳۸۷
پست ها: 34
تشكرها: 1
254 تشكر در 32 پست
پيش فرض نظر در مورد نحوه کار Google

من یه مسئله ای برام پیش اومده و اینه که به نظر من این جستجوی سریع گوگل و آماری که میده که مثلا این تعداد رکورد در فلان زمان پیدا شد نمی تونه واقعی باشه.حالا اینو رو چه حسابی می گم؟ بعضی وقتها که یه کلمه کلیدی رو جستجو می کنی گوگل پایین صفحه مثلا 10 تا ایندکس صفحه نشون می ده اما وقتی وارد صفحه مثلا 2 می شی بقیه شماره ها حذف می شه و پایان جستجو رو در همین صفحه اعلام میکنه. نظر من اینه که گوگل فقط صفحه اول رو جستجو می کنه و نتایج اون رو سریع نشون می ده و بقیه صفحات رو در پس زمینه وقتی کاربر مشغول بررسی نتایج صفحه هست انجام می ده. نمی دونم این حدس درسته یا نه اما می خوام بدونم نظر بقیه اعضای انجمن راجع به این موضوع چیه.
mohammad_tz آفلاين است   پاسخ با نقل قول
از mohammad_tz تشكر كرده است:
infoshayan (۰۷-۲۴-۱۳۸۷)

  #ADS
نشان دهنده تبلیغات
تبليغگر
 
 
 
تاريخ عضويت: -
محل سكونت: -
سن: 2010
پست ها: -
 

نشان دهنده تبلیغات is online  
قديمي ۰۷-۲۶-۱۳۸۷, ۱۰:۴۵ قبل از ظهر   #2 (لینک دائم)
Administrator
 
آواتار Siavash
 
تاريخ عضويت: ارديبهشت ۱۳۸۷
محل سكونت: تهران
پست ها: 179
تشكرها: 27
439 تشكر در 108 پست
My Mood: Mehrabon
پيش فرض

خوب در بحث Indexing مقالات خيلي زيادي هست. حرف شما تا حدودي درست هست اما كاملا نه.
هيچ كدام از Search Engine هاي بزرگ وقتي شما سرچ مي كنيد عمليات اصلي سرچ رو انجام نميدن. يعني مثلا شما كلمه ي "هوش مصنوعي" رو سرچ مي كنيد گوگل نمياد از ركورد هايي كه در بانك اطلاعاتيش داره Query بگيره در اون لحظه! در اين صورت امكان نداره در اون زمان بسيار كم بين اون تعداد بسيار بسيار زياد ركورد Query بگيره. در نتيجه از Caching استفاده مي كنه كه حتي در خيلي سايت هاي كوچك مقياس هم از اين سيستم استفاده مي شه.
يعني براي اكثر كلمات كليدي نتيجه ي آماده اي از قبل تعيين شده و صفحه اي كه شما مي بينيد تقريباً يك صفحه ي Static هست. اين صفحات بر حسب تعداد درخواست اون واژه ي جستجو بروزرساني ميشن.
مثلاً عبارتي مثل "Download" يا عباراتي كه مربوط به اخبار مي شن خيلي سريع تر Cache شون بروزرساني ميشه.
براي اينكه بهتر به اين نكته پي ببريد كلمه اي رو جستجو كنيد كه خيلي دور از ذهن باشه و فكر مي كنيد تا به حال كسي سرچ نكرده و زمان رو نگاه كنيد. مي بينيد زمان خيلي بيشتري رو نشون مي ده و دليلش هم اين هست كه Cache براي اون عبارت جستجو نداشته. يا صفحات 100 به بالاي هر عبارت زمان بيشتري نسبت به صفحه ي اول نشون مي دن.
دليل كم شدن نتايج وقتي به صفحه ي 2 مي رويد هم شايد همين باشه. چون صفحه ي اول در يك زمان Cache شده و صفحه ي دوم در زمان ديگر (يا اصلاً Cache نشده). ممكن هست در زماني كه صفحه ي اول Cache شده بوده نتايج بيشتري براي اين عبارت وجود داشته.
بعضي اوقات بايد از خيلي دقيق بودن بگذريم چون سرعت ممكنه اهميت بيشتري داشته باشه.
__________________
Siavash آفلاين است   پاسخ با نقل قول
از Siavash تشكر كرده اند:
Expon (۰۹-۱۶-۱۳۸۷), Iman (۰۵-۲۲-۱۳۸۸), SaMaN (۰۶-۲۴-۱۳۸۸), Sayafan (۱۰-۷-۱۳۸۸)
قديمي ۰۹-۱۱-۱۳۸۹, ۰۳:۵۹ قبل از ظهر   #3 (لینک دائم)
عضو جدید
 
آواتار n.p
 
تاريخ عضويت: آذر ۱۳۸۹
پست ها: 7
تشكرها: 22
2 تشكر در 1 پست
پيش فرض

احتمالا یک سری معیار باید داشته باشه که صفحات رو بر اساس اونها درجه بندی می‌کنه. احتمالا cache برای گوگل مسئله‌ای نیست. پس در نهایت کل سایت‌هایی که کلمه‌های مورد نظر رو دارند بر اساس رنکشون لیست می‌کنه. ولی وقته به صفحه‌ای رسیدین که ممکنه بر اساس معیارشون خیلی از هدف مورد نظر دور باشه، پیغامی که نوشتین رو نشودن می‌ده.
در ضمن به نظر نمی‌رسه که حتما نیاز به ذخیره کردن کل صفحه داشته باشند. فقط ایندکسه براشون مهمه.
n.p آفلاين است   پاسخ با نقل قول
پاسخ



كاربران در حال ديدن تاپيک: 1 (0 عضو و 1 مهمان)
 

قوانين ارسال
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is فعال
شکلکها فعال است
كد [IMG] فعال است
كدهاي HTML غير فعال است
Trackbacks are فعال
Pingbacks are فعال
Refbacks are فعال




زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۱۰:۲۱ بعد از ظهر ميباشد.


Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.

Teach and Learn at Hexib | Sponsored by www.Syavash.com and Product In Review

استفاده از مطالب انجمن در سایر سایت ها، تنها با ذکر انجمن هوش مصنوعي به عنوان منبع و لینک مستقیم به خود مطلب مجاز است

Inactive Reminders By Icora Web Design