Artificial Intelligence - هوش مصنوعی

Artificial Intelligence - هوش مصنوعی (http://artificial.ir/intelligence/)
-   دادگان‌هاي متنی، گفتاری و زباني (Text, Language and Speech Corpora) (http://artificial.ir/intelligence/forum114.html)
-   -   تشخیص زبان سایت (http://artificial.ir/intelligence/thread12114.html)

hoseinkord ۰۷-۲۳-۱۳۹۲ ۰۱:۱۰ بعد از ظهر

تشخیص زبان سایت
 
با سلام میخواستم بدونم کسی تا حالا تو زمینه شناسایی زبان یک سایت تحقیقی داشته یا نه...
هیچکس ایده ای داره تا بتونیم زبان سایت عربی و فارسی و اردو و... رو تشخیص بدیم...
خواهشا ایده ای اگر دارید لطف کنید بدید ...
یه کارایی انجام دادم ولی درصد خطا یه مقدار بالا بوده ....
تشکر از دوستان

raha_hakhamanesh ۰۷-۲۳-۱۳۹۲ ۰۱:۲۷ بعد از ظهر

نقل قول:

نوشته اصلي بوسيله hoseinkord (پست 30456)
با سلام میخواستم بدونم کسی تا حالا تو زمینه شناسایی زبان یک سایت تحقیقی داشته یا نه...
هیچکس ایده ای داره تا بتونیم زبان سایت عربی و فارسی و اردو و... رو تشخیص بدیم...
خواهشا ایده ای اگر دارید لطف کنید بدید ...
یه کارایی انجام دادم ولی درصد خطا یه مقدار بالا بوده ....
تشکر از دوستان


به نام خدا
قطعا منظور شما استفاده از روش های هوشمند است ولی توجه کنید متاتگ زیربراحتی نوع زبان را مشخص می کند که معمولا در سایتهایی که با اصول نرم افزار طراحی شده اند این تگ وجود داره و شما می تونید بسادگی اون رو اسکن کنید

HTML Code:

[LEFT]<meta http-equiv="Content-Language" content="Fa" />
[/LEFT]


همچنین ببینید
php - How to detect the current language of a Joomla! website? - Stack Overflow
Best way to detect browser language?

موفق باشید

hoseinkord ۰۷-۲۴-۱۳۹۲ ۰۹:۳۱ قبل از ظهر

نقل قول:

نوشته اصلي بوسيله raha_hakhamanesh (پست 30457)
به نام خدا
قطعا منظور شما استفاده از روش های هوشمند است ولی توجه کنید متاتگ زیربراحتی نوع زبان را مشخص می کند که معمولا در سایتهایی که با اصول نرم افزار طراحی شده اند این تگ وجود داره و شما می تونید بسادگی اون رو اسکن کنید

HTML Code:

[LEFT]<meta http-equiv="Content-Language" content="Fa" />
[/LEFT]


همچنین ببینید
php - How to detect the current language of a Joomla! website? - Stack Overflow
Best way to detect browser language?

موفق باشید

با سلام وتشکر...فکر کنم من مطلب رو بد بیان کردم ....منظور این است که مطالب یک سایت رو اسکن کنیم و تشخیص بدیم زبان سایت فارسی هست یا اردو یا عربی با توجه به مشابه بودن زبان ها....تعیین کردن charset در هر سه نوع سایت فقط به صورت charset =utf-8 تعیین میشه و معمولا زبان سایت رو تعیین نمی کنند (درصد خیلی پایینی تعیین میکنند) .
در واقع یه چیزی شبیه به google translater که زبان سایت رو تشخیص میده (detect language)..
اون دوتا لینکی هم که دادید از اونجایی که با برنامه نویسی جوملا هم کار کردم...اولی با استفاده از JFactory::getLanguage(); زبان سایت رو که از بخش مدیریت تعیین شده تشخیص میده ...دومی هم که در واقع تشخیص زبان مرورگر هست برای تغییر زبان سایت خودمون با توجه به اون...
در صورتی که ایده ای برای تشخیص زبان های فارسی -اردو و عربی دارید ممنون میشم لطف کنید...

raha_hakhamanesh ۰۷-۲۴-۱۳۹۲ ۱۲:۱۵ بعد از ظهر

نقل قول:

نوشته اصلي بوسيله hoseinkord (پست 30467)
با سلام وتشکر...فکر کنم من مطلب رو بد بیان کردم ....منظور این است که مطالب یک سایت رو اسکن کنیم و تشخیص بدیم زبان سایت فارسی هست یا اردو یا عربی با توجه به مشابه بودن زبان ها....تعیین کردن charset در هر سه نوع سایت فقط به صورت charset =utf-8 تعیین میشه و معمولا زبان سایت رو تعیین نمی کنند (درصد خیلی پایینی تعیین میکنند) .
در واقع یه چیزی شبیه به google translater که زبان سایت رو تشخیص میده (detect language)..
اون دوتا لینکی هم که دادید از اونجایی که با برنامه نویسی جوملا هم کار کردم...اولی با استفاده از JFactory::getLanguage(); زبان سایت رو که از بخش مدیریت تعیین شده تشخیص میده ...دومی هم که در واقع تشخیص زبان مرورگر هست برای تغییر زبان سایت خودمون با توجه به اون...
در صورتی که ایده ای برای تشخیص زبان های فارسی -اردو و عربی دارید ممنون میشم لطف کنید...


به نام خدا
خب بنظرم حالا وضعیت سوال و موضوع پروژه زیباتر شد
چنانکه احتمالا می دونید این مسئله از زیر شاخه های NLP بشمار می آید و روش های مبتنی بر یادگیری ماشینی می تونه بهتون در این باره کمک کنه
با این حال
در پروژه هایی که قبلا این راه رو رفتن اسکریپت هایی وجود داره که میتونه به شما کمک کنه
مثلا از گوگل ترجمه: google.language.detect(text, function(result)

لینک های زیر احتمالا به شما کمک کنند
c# - How to detect the language of a string? - Stack Overflow

language-detection - Language Detection Library for Java - Google Project Hosting

Short Text Language Detection with Infinity-Gram | Shuyo's Weblog

موفق باشید


زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۰۴:۳۱ بعد از ظهر ميباشد.

Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.