نمايش پست تنها
قديمي ۰۸-۲۹-۱۳۸۷, ۱۱:۲۲ بعد از ظهر   #4 (لینک دائم)
Padin
عضو جدید
 
آواتار Padin
 
تاريخ عضويت: ارديبهشت ۱۳۸۷
پست ها: 3
تشكرها: 0
3 تشكر در 2 پست
پيش فرض Corpus

بله همونطور که سیاوش اشاره کرده، سامانه ترجمه گوگل مبتنی بر اساس انبوه واژگان (corpus) است.
یک مثال ساده از فرهنگ لغات انبوه (corpus dictionary)، فرهنگ Collins Cobuild هست. دانشجویان زبان انگلیسی با استفاده از این فرهنگ میتوانند به کاربرد یک کلمه در متون و بافتهای متفاوت (از کتب ادبی گرفته تا متون خبری چاپی و صوتی) پی ببرند.
خوب این خیلی مهمه. مثلا شما کلمه wash و hair رو میخواهی بدونی که چه جور کنار هم میان. با استفاده از فرهنگ لغات انبوه شما میتونی جستجو کنی و مثلا مشاهده می کنی که 774 بار این واژگان کنار هم اومدن و ساختارش اینطوریه که مابین این دو کلمه هیچ حرف اضافه ای قرار نمیگیره.
یه فرهنگ لغت انبوه آنلاین رو بهتون معرفی میکنم. تستش کنید:
Corpus of Contemporary American English (COCA)

نسل پیشرفته تر ماشین های مترجم مبتنی بر انبوه متون هست و از ترجمه literal (واژه به واژه) فاصله میگیریه. با استفاده از این نوع روش، میشه درواقع collocateها رو پیدا کرد. دو لغت که خیلی پهلو هم میان رو میگن collocate. مثلا: خبر + داغ.
هرچند بعد فرهنگی ترجمه در این رویکرد نادیده گرفته میشه و باید به رویکردهای دیگه ای روی آورد.

ويرايش شده توسط Padin; ۰۸-۲۹-۱۳۸۷ در ساعت ۱۱:۲۶ بعد از ظهر
Padin آفلاين است   پاسخ با نقل قول
از Padin تشكر كرده است:
mr.sina (۰۵-۲۵-۱۳۹۰)