Artificial Intelligence - هوش مصنوعی  
انجمن را در گوگل محبوب کنيد :

بازگشت   Artificial Intelligence - هوش مصنوعی > داده کاوی > پردازش و کاوش متن( Text Mining and processing )


 
تبليغات سايت
Iranian Association for the Advancement of Artificial Intelligence
ارسال تاپيک جديد  پاسخ
 
LinkBack ابزارهاي تاپيک نحوه نمايش
قديمي ۰۸-۲۹-۱۳۸۷, ۱۱:۲۲ بعد از ظهر   #1 (لینک دائم)
عضو جدید
 
آواتار Padin
 
تاريخ عضويت: ارديبهشت ۱۳۸۷
پست ها: 3
تشكرها: 0
3 تشكر در 2 پست
پيش فرض Corpus

بله همونطور که سیاوش اشاره کرده، سامانه ترجمه گوگل مبتنی بر اساس انبوه واژگان (corpus) است.
یک مثال ساده از فرهنگ لغات انبوه (corpus dictionary)، فرهنگ Collins Cobuild هست. دانشجویان زبان انگلیسی با استفاده از این فرهنگ میتوانند به کاربرد یک کلمه در متون و بافتهای متفاوت (از کتب ادبی گرفته تا متون خبری چاپی و صوتی) پی ببرند.
خوب این خیلی مهمه. مثلا شما کلمه wash و hair رو میخواهی بدونی که چه جور کنار هم میان. با استفاده از فرهنگ لغات انبوه شما میتونی جستجو کنی و مثلا مشاهده می کنی که 774 بار این واژگان کنار هم اومدن و ساختارش اینطوریه که مابین این دو کلمه هیچ حرف اضافه ای قرار نمیگیره.
یه فرهنگ لغت انبوه آنلاین رو بهتون معرفی میکنم. تستش کنید:
Corpus of Contemporary American English (COCA)

نسل پیشرفته تر ماشین های مترجم مبتنی بر انبوه متون هست و از ترجمه literal (واژه به واژه) فاصله میگیریه. با استفاده از این نوع روش، میشه درواقع collocateها رو پیدا کرد. دو لغت که خیلی پهلو هم میان رو میگن collocate. مثلا: خبر + داغ.
هرچند بعد فرهنگی ترجمه در این رویکرد نادیده گرفته میشه و باید به رویکردهای دیگه ای روی آورد.

ويرايش شده توسط Padin; ۰۸-۲۹-۱۳۸۷ در ساعت ۱۱:۲۶ بعد از ظهر
Padin آفلاين است   پاسخ با نقل قول
از Padin تشكر كرده است:
mr.sina (۰۵-۲۵-۱۳۹۰)

  #ADS
نشان دهنده تبلیغات
تبليغگر
 
 
 
تاريخ عضويت: -
محل سكونت: -
سن: 2010
پست ها: -
 

نشان دهنده تبلیغات is online  
قديمي ۱۱-۱۷-۱۳۸۷, ۰۸:۴۸ بعد از ظهر   #2 (لینک دائم)
عضو جدید
 
آواتار ali-zi-zeperto
 
تاريخ عضويت: شهريور ۱۳۸۷
محل سكونت: کرج
پست ها: 4
تشكرها: 9
3 تشكر در 2 پست
پيش فرض

خوب اینکه دو کلمه زیاد کنار هم بیان به نظر من خیلی ربطی به ترجمه نداره.نهایت این چیزی که مطرح شده فکر می کنم آخرش این باشه که ساختار گرامری یه زبانی رو پیدا کنه.اگه غیر این هم باشه فکر کنم جزو سیستمهایی باشه که مفهوم پردازن(اینطوری که یادمه توی همین سایت هم مطرح شدن).نظر شما چیه؟اینطور نیست؟.به نظر من به ترجمه ماشینی میشه اعتماد کرد که از تست تورینگ به هر دو زبون مورد نظر سر بلند بیاد بیرون.

ويرايش شده توسط ali-zi-zeperto; ۱۱-۱۷-۱۳۸۷ در ساعت ۰۸:۵۶ بعد از ظهر
ali-zi-zeperto آفلاين است   پاسخ با نقل قول
قديمي ۱۱-۲۸-۱۳۸۷, ۰۶:۱۹ بعد از ظهر   #3 (لینک دائم)
عضو جدید
 
آواتار Padin
 
تاريخ عضويت: ارديبهشت ۱۳۸۷
پست ها: 3
تشكرها: 0
3 تشكر در 2 پست
پيش فرض سطح معنا

سلام. ببینید ماشین ترجمه قرار است یک متن ورودی از زبان مبدا (ST) بگیرد و در نهایت یک متن خروجی (TT) تحویل دهد. در این وسط، فرایند ترجمه بر دو مرحله است که نایدا در علم ترجمه میگوید. وی با استفاده از مدل چامسکی، معتقد بود که باید متن زبان مبدا یک ساختار سطحی است. زبان‌های انسان همگی (به صورت جهانی یا Universal) در ساختارهای عمقی یکسانند و تفاوت‌ها در ساختارهای سطحی است. پس باید متن زبان مبدا را از ساختار سطحی به ساختار عمقی رساند و بار دیگر این ساختار عمقی را در ساختار سطحی زبان مقصد پدید آورد. البته این نظریه نایدا، تفاوت‌های فرهنگی را نادیده می‌گرفت. بنابراین طبق این نظریه، که فوق‌العاده در ابتدای کار موثر است، فرایند ترجمه بر دو مرحله است:
1. رمزگشایی معنای متن مبدأ
2. رمزگذاری معنای متن مقصد
خوب اگر تا اینجا موافق باشید، شما میگویید که معنا در دستور زبان است و کاملا درست است. منتها شما دستور زبان را در نحو (Syntax) میبینید که عبارت است نحوه چیدمان واژگان و ساختار جمله. در حالی که از نظر زبانشناسی، دستور زبان آنچیزی نیست که در کتابهای گرامر میبینید، بلکه یعنی آنچه که در مغز متکلم یک زبان وجود دارد از اصوات گرفته تا واژگان و تا همان قواعد نحو و از همه مهمتر کاربردشناسی.
طبق سیستم شما، اگر بخواهیم یک ماشین مترجم بسازیم، فقط کافی است که یک فرهنگ لغت دو زبانه داشته باشیم و یک فرهنگ قواعد نحو دو زبانه و از ترکیب این دو، همه چیز را ترجمه کنیم. در اینجا شما نادیده گرفته اید که معنای واژه با توجه به جمله تعیین میشود و اگر قرار باشد رایانه بفهمد، با یک فرهنگ لغت و یک فرهنگ قواعد نحو کارش پیش نمی رود. در ضمن این نوع ترجمه به یک ترجمه ناجور (awkward) منتهی میشود و در نهایت از آزمون تورینگ هم حتی سربلند بیرون نمیاید.
رایانه باید بتواند همان شبکه مفاهیمی که در ذهن انسان وجود دارد را داشته باشد، تا بتواند بفهمد.
در نهایت، در مورد آزمون تورینگ باید بگویم که خیر من در زمینه ترجمه فکر نمیکنم آزمون تورینگ مقیاسی موثر باشد. دلیل اول آنکه الآن یک رایانه هرچقدر بد ترجمه کند، از خیلی از انسانها میتونه بهتر ترجمه کند و در اینجا عملکرد انسان ملاک نیست. چون خیلی از انسان ها که تسلط به زبان مبدا و مقصد هم دارند، نمی توانند ترجمه قابل قبولی ارائه دهند و ترجمه های ناجوری را تولید می کنند. دلیل دوم اینکه ممکن است یک رایانه ترجمه ای مأنوس و فصیح را بیرون بدهد، ولی از نظر معنایی منحرف شده باشد. یعنی در ساختار زبان، تسلط داشته باشد ولی معنی را درک نکند و یک معنی متفاوت بدهد.
یعنی در اینجا ملاک این نیست، که حساب کنیم یک انسان این را ترجمه کرده است یا نه. بلکه ملاک این باید باشد که معنی به درستی و در ساختار صحیح منتقل شده است که با روشهای ارزیابی ترجمه تا حدودی امکان پذیر است.
منتظر نظرات شما هستم. متشکرم
Padin آفلاين است   پاسخ با نقل قول
از Padin تشكر كرده اند:
coybit (۰۷-۸-۱۳۸۹), mr.sina (۰۵-۲۵-۱۳۹۰)
پاسخ



كاربران در حال ديدن تاپيک: 1 (0 عضو و 1 مهمان)
 

قوانين ارسال
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is فعال
شکلکها فعال است
كد [IMG] فعال است
كدهاي HTML غير فعال است
Trackbacks are فعال
Pingbacks are فعال
Refbacks are فعال




زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۰۲:۰۱ بعد از ظهر ميباشد.


Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.

Teach and Learn at Hexib | Sponsored by www.Syavash.com and Product In Review

استفاده از مطالب انجمن در سایر سایت ها، تنها با ذکر انجمن هوش مصنوعي به عنوان منبع و لینک مستقیم به خود مطلب مجاز است

Inactive Reminders By Icora Web Design