Artificial Intelligence - هوش مصنوعی  
انجمن را در گوگل محبوب کنيد :

بازگشت   Artificial Intelligence - هوش مصنوعی > پردازش صوت، گفتار و زبان طبيعی ! > دادگان‌هاي متنی، گفتاری و زباني (Text, Language and Speech Corpora)


 
تبليغات سايت
Iranian Association for the Advancement of Artificial Intelligence
ارسال تاپيک جديد  پاسخ
 
LinkBack ابزارهاي تاپيک نحوه نمايش
قديمي ۰۷-۲۳-۱۳۹۲, ۰۱:۱۰ بعد از ظهر   #1 (لینک دائم)
عضو جدید
 
آواتار hoseinkord
 
تاريخ عضويت: مهر ۱۳۹۲
پست ها: 2
تشكرها: 2
0 تشكر در 0 پست
پيش فرض تشخیص زبان سایت

با سلام میخواستم بدونم کسی تا حالا تو زمینه شناسایی زبان یک سایت تحقیقی داشته یا نه...
هیچکس ایده ای داره تا بتونیم زبان سایت عربی و فارسی و اردو و... رو تشخیص بدیم...
خواهشا ایده ای اگر دارید لطف کنید بدید ...
یه کارایی انجام دادم ولی درصد خطا یه مقدار بالا بوده ....
تشکر از دوستان
hoseinkord آفلاين است   پاسخ با نقل قول

  #ADS
نشان دهنده تبلیغات
تبليغگر
 
 
 
تاريخ عضويت: -
محل سكونت: -
سن: 2010
پست ها: -
 

نشان دهنده تبلیغات is online  
قديمي ۰۷-۲۳-۱۳۹۲, ۰۱:۲۷ بعد از ظهر   #2 (لینک دائم)
Super Moderator
 
آواتار raha_hakhamanesh
 
تاريخ عضويت: خرداد ۱۳۸۷
محل سكونت: دنیا
پست ها: 281
تشكرها: 28
253 تشكر در 147 پست
My Mood: Zodranj
پيش فرض

نقل قول:
نوشته اصلي بوسيله hoseinkord نمايش پست
با سلام میخواستم بدونم کسی تا حالا تو زمینه شناسایی زبان یک سایت تحقیقی داشته یا نه...
هیچکس ایده ای داره تا بتونیم زبان سایت عربی و فارسی و اردو و... رو تشخیص بدیم...
خواهشا ایده ای اگر دارید لطف کنید بدید ...
یه کارایی انجام دادم ولی درصد خطا یه مقدار بالا بوده ....
تشکر از دوستان

به نام خدا
قطعا منظور شما استفاده از روش های هوشمند است ولی توجه کنید متاتگ زیربراحتی نوع زبان را مشخص می کند که معمولا در سایتهایی که با اصول نرم افزار طراحی شده اند این تگ وجود داره و شما می تونید بسادگی اون رو اسکن کنید

HTML Code:
[LEFT]<meta http-equiv="Content-Language" content="Fa" />
[/LEFT]

همچنین ببینید
php - How to detect the current language of a Joomla! website? - Stack Overflow
Best way to detect browser language?

موفق باشید
__________________
.
.
.
برای تشکر دکمه مخصوص وجود دارد لطفا پست هرز ایجاد نکنید
.
.
اینقدر از دسترسی نداشتن به مقاله شیون نکنید

مقالات انگلیسی: ایران سای (ISI, IEEE, ACM)
مقالات فارسی: سیویلیکا (کنفرانس داخلی)
مقالات فارسی: مگ ایران (ژورنالهای داخلی)
raha_hakhamanesh آفلاين است   پاسخ با نقل قول
از raha_hakhamanesh تشكر كرده اند:
hoseinkord (۰۷-۲۴-۱۳۹۲), samiran90 (۰۸-۴-۱۳۹۲)
قديمي ۰۷-۲۴-۱۳۹۲, ۰۹:۳۱ قبل از ظهر   #3 (لینک دائم)
عضو جدید
 
آواتار hoseinkord
 
تاريخ عضويت: مهر ۱۳۹۲
پست ها: 2
تشكرها: 2
0 تشكر در 0 پست
پيش فرض

نقل قول:
نوشته اصلي بوسيله raha_hakhamanesh نمايش پست
به نام خدا
قطعا منظور شما استفاده از روش های هوشمند است ولی توجه کنید متاتگ زیربراحتی نوع زبان را مشخص می کند که معمولا در سایتهایی که با اصول نرم افزار طراحی شده اند این تگ وجود داره و شما می تونید بسادگی اون رو اسکن کنید

HTML Code:
[LEFT]<meta http-equiv="Content-Language" content="Fa" />
[/LEFT]

همچنین ببینید
php - How to detect the current language of a Joomla! website? - Stack Overflow
Best way to detect browser language?

موفق باشید
با سلام وتشکر...فکر کنم من مطلب رو بد بیان کردم ....منظور این است که مطالب یک سایت رو اسکن کنیم و تشخیص بدیم زبان سایت فارسی هست یا اردو یا عربی با توجه به مشابه بودن زبان ها....تعیین کردن charset در هر سه نوع سایت فقط به صورت charset =utf-8 تعیین میشه و معمولا زبان سایت رو تعیین نمی کنند (درصد خیلی پایینی تعیین میکنند) .
در واقع یه چیزی شبیه به google translater که زبان سایت رو تشخیص میده (detect language)..
اون دوتا لینکی هم که دادید از اونجایی که با برنامه نویسی جوملا هم کار کردم...اولی با استفاده از JFactory::getLanguage(); زبان سایت رو که از بخش مدیریت تعیین شده تشخیص میده ...دومی هم که در واقع تشخیص زبان مرورگر هست برای تغییر زبان سایت خودمون با توجه به اون...
در صورتی که ایده ای برای تشخیص زبان های فارسی -اردو و عربی دارید ممنون میشم لطف کنید...
hoseinkord آفلاين است   پاسخ با نقل قول
قديمي ۰۷-۲۴-۱۳۹۲, ۱۲:۱۵ بعد از ظهر   #4 (لینک دائم)
Super Moderator
 
آواتار raha_hakhamanesh
 
تاريخ عضويت: خرداد ۱۳۸۷
محل سكونت: دنیا
پست ها: 281
تشكرها: 28
253 تشكر در 147 پست
My Mood: Zodranj
پيش فرض

نقل قول:
نوشته اصلي بوسيله hoseinkord نمايش پست
با سلام وتشکر...فکر کنم من مطلب رو بد بیان کردم ....منظور این است که مطالب یک سایت رو اسکن کنیم و تشخیص بدیم زبان سایت فارسی هست یا اردو یا عربی با توجه به مشابه بودن زبان ها....تعیین کردن charset در هر سه نوع سایت فقط به صورت charset =utf-8 تعیین میشه و معمولا زبان سایت رو تعیین نمی کنند (درصد خیلی پایینی تعیین میکنند) .
در واقع یه چیزی شبیه به google translater که زبان سایت رو تشخیص میده (detect language)..
اون دوتا لینکی هم که دادید از اونجایی که با برنامه نویسی جوملا هم کار کردم...اولی با استفاده از JFactory::getLanguage(); زبان سایت رو که از بخش مدیریت تعیین شده تشخیص میده ...دومی هم که در واقع تشخیص زبان مرورگر هست برای تغییر زبان سایت خودمون با توجه به اون...
در صورتی که ایده ای برای تشخیص زبان های فارسی -اردو و عربی دارید ممنون میشم لطف کنید...

به نام خدا
خب بنظرم حالا وضعیت سوال و موضوع پروژه زیباتر شد
چنانکه احتمالا می دونید این مسئله از زیر شاخه های NLP بشمار می آید و روش های مبتنی بر یادگیری ماشینی می تونه بهتون در این باره کمک کنه
با این حال
در پروژه هایی که قبلا این راه رو رفتن اسکریپت هایی وجود داره که میتونه به شما کمک کنه
مثلا از گوگل ترجمه: google.language.detect(text, function(result)

لینک های زیر احتمالا به شما کمک کنند
c# - How to detect the language of a string? - Stack Overflow

language-detection - Language Detection Library for Java - Google Project Hosting

Short Text Language Detection with Infinity-Gram | Shuyo's Weblog

موفق باشید
__________________
.
.
.
برای تشکر دکمه مخصوص وجود دارد لطفا پست هرز ایجاد نکنید
.
.
اینقدر از دسترسی نداشتن به مقاله شیون نکنید

مقالات انگلیسی: ایران سای (ISI, IEEE, ACM)
مقالات فارسی: سیویلیکا (کنفرانس داخلی)
مقالات فارسی: مگ ایران (ژورنالهای داخلی)
raha_hakhamanesh آفلاين است   پاسخ با نقل قول
از raha_hakhamanesh تشكر كرده است:
hoseinkord (۰۷-۲۴-۱۳۹۲)
پاسخ



كاربران در حال ديدن تاپيک: 1 (0 عضو و 1 مهمان)
 

قوانين ارسال
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is فعال
شکلکها فعال است
كد [IMG] فعال است
كدهاي HTML غير فعال است
Trackbacks are فعال
Pingbacks are فعال
Refbacks are فعال




زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۰۶:۳۶ قبل از ظهر ميباشد.


Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.

Teach and Learn at Hexib | Sponsored by www.Syavash.com and Product In Review

استفاده از مطالب انجمن در سایر سایت ها، تنها با ذکر انجمن هوش مصنوعي به عنوان منبع و لینک مستقیم به خود مطلب مجاز است

Inactive Reminders By Icora Web Design