Artificial Intelligence - هوش مصنوعی  
انجمن را در گوگل محبوب کنيد :

بازگشت   Artificial Intelligence - هوش مصنوعی > داده کاوی > کاوش وب(Web Mining)


 
تبليغات سايت
Iranian Association for the Advancement of Artificial Intelligence
ارسال تاپيک جديد  پاسخ
 
LinkBack ابزارهاي تاپيک نحوه نمايش
قديمي ۰۸-۱۲-۱۳۸۸, ۱۱:۲۷ قبل از ظهر   #1 (لینک دائم)
Administrator
 
آواتار Astaraki
 
تاريخ عضويت: خرداد ۱۳۸۷
محل سكونت: تهران-کرج!
پست ها: 3,465
تشكرها: 754
16,337 تشكر در 3,127 پست
My Mood: Mehrabon
ارسال پيغام Yahoo به Astaraki
Cool خصوصيات وب هاي فارسي از نظر زبان

خصوصيات وب هاي فارسي از نظر زبان

عدم وجود يك استاندارد و شناور بودن ويژگيهاي رسم الخط و مفاهيم در زبان فارسي ، موجب گرديده است تا تقريبا بتعداد صفحات وب فارسي ، سبك و سياق نگارش اين زبان بكار رفته باشد. ليكن خصوصيات مشترك اكثر وب‌هاي فارسي زبان را مي توان چنين ارزيابي نمود :
الف) نگارش برخي از وب هاي فارسي ، زبان غيررسمي يا محاوره‌اي است.
ب) در وب‌هاي فارسي ، بخصوص در متون علمي ، اغلب واژه‌هاي بيگانه ، بكرات استفاده مي‌شود كه بعضي از آنها بارسم الخط زبان اصلي نوشته مي‌شوند.
ج) رسم‌الخط وب هاي فارسي ، اصولا غيراستاندارد و متغير است و اغلب در معرض نوآوري‌ است.
ه) نوشته‌هاي وب‌هاي فارسي ، حاوي غلط‌هاي تايپي و نگارشي نسبتاً زيادي است، هرچند كه اغلب وب‌هاي فارسي مهم و پرخواننده، نگارش قابل‌قبولي دارند.
و) رسم‌الخط وب‌هاي فارسي، تابع محدوديت‌هاي محيط الكترونيكي و عدم تطبيق آن با الزامات خط فارسي است.]اشرف زاده،1383[ابزارهاي جستجو در وب هاي فارسي
در حال حاضر ابزارهاي كاوش مختلفي در ايران ظهور پيدا كرده اند.ليكن ابزارهاي جستجويي كه امكان جستجوي اطلاعات به زبان فارسي را در اختيار قرار مي دهند ، محدودند. از طرف ديگر ، امكانات و قابليتهاي آن ها براي بازيابي موثر و مناسب اطلاعات متغير هستند. برخي از ابزارهاي كاوش با امكانات جستجوي فارسي عبارتند از NPiran ، Iranhoo ، IranMehre ، Parseek ، Google و Parseek .بجز سايت‌ NPIran ، ديگر سايتها داراي‌ واسط‌ جستجوي فارسي‌ هستند و بجز Parseek ، هيچيك از ابزارهاي موجود كاوش فارسي ، چالش هاي زبان فارسي را با هدف بهينه سازي كاوش فارسي ، فراروي خود قرار نداده اند و Parseek نيز تنها مشكل كاراكترهاي فارسي با يونيكدهاي مختلف را حل نموده است.



در بين ابزارهاي كاوش فوق ، تنها موتور كاوش Google داراي برنامه روبات به منظور شناسايي و نمايه سازي صفحات يا سايتهاي وب به زبان فارسي و نمايه سازي خودكار مي باشد و قادر است صفحات فارسي را در قالب Unicode شناسايي و در پايگاه خود نمايه كند و سايت Parseek نيز از پايگاه Google براي جستجو و بازيابي اطلاعات استفاده مي كند. به تعبير ديگر، 4 ابزار كاوش ديگر توسط نمايه سازي انساني اداره مي شوند و از اين لحاظ راهنماي موضوعي تلقي مي شوند. ابزارهاي كاوش ديگر ، راهنماي موضوعي به شمار مي آيند و انسان ، فرايند شناسايي، بررسي و نمايه سازي سايتها يا صفحات وب را بر عهده دارد.]كوشا،1381[
بنظر مي رسد جاي يك ابزار كاوش قوي ملي ، تحت نظارت سازمان هاي انفورماتيكي و انجن هاي زبان شناسي فارسي ، منطبق با نيازهاي اطلاعاتي كاربران اينترنت در ايران وبا در نظر گرفتن چالش هاي رسم الخط و مفهومي فارسي و مرتفع سازي مشكلات ناشي از آن ها خالي است.
Astaraki آفلاين است   پاسخ با نقل قول
از Astaraki تشكر كرده اند:
engineer_yasin (۰۴-۲۹-۱۳۸۹), shokofeh (۰۶-۱۷-۱۳۹۰)

  #ADS
نشان دهنده تبلیغات
تبليغگر
 
 
 
تاريخ عضويت: -
محل سكونت: -
سن: 2010
پست ها: -
 

نشان دهنده تبلیغات is online  
پاسخ



كاربران در حال ديدن تاپيک: 1 (0 عضو و 1 مهمان)
 

قوانين ارسال
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is فعال
شکلکها فعال است
كد [IMG] فعال است
كدهاي HTML غير فعال است
Trackbacks are فعال
Pingbacks are فعال
Refbacks are فعال




زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۰۵:۲۷ بعد از ظهر ميباشد.


Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.

Teach and Learn at Hexib | Sponsored by www.Syavash.com and Product In Review

استفاده از مطالب انجمن در سایر سایت ها، تنها با ذکر انجمن هوش مصنوعي به عنوان منبع و لینک مستقیم به خود مطلب مجاز است

Inactive Reminders By Icora Web Design