بله همونطور که سیاوش اشاره کرده، سامانه ترجمه گوگل مبتنی بر اساس انبوه واژگان (corpus) است.
یک مثال ساده از فرهنگ لغات انبوه (corpus dictionary)، فرهنگ Collins Cobuild هست. دانشجویان زبان انگلیسی با استفاده از این فرهنگ میتوانند به کاربرد یک کلمه در متون و بافتهای متفاوت (از کتب ادبی گرفته تا متون خبری چاپی و صوتی) پی ببرند.
خوب این خیلی مهمه. مثلا شما کلمه wash و hair رو میخواهی بدونی که چه جور کنار هم میان. با استفاده از فرهنگ لغات انبوه شما میتونی جستجو کنی و مثلا مشاهده می کنی که 774 بار این واژگان کنار هم اومدن و ساختارش اینطوریه که مابین این دو کلمه هیچ حرف اضافه ای قرار نمیگیره.
یه فرهنگ لغت انبوه آنلاین رو بهتون معرفی میکنم. تستش کنید:
Corpus of Contemporary American English (COCA)
نسل پیشرفته تر ماشین های مترجم مبتنی بر انبوه متون هست و از ترجمه literal (واژه به واژه) فاصله میگیریه. با استفاده از این نوع روش، میشه درواقع collocateها رو پیدا کرد. دو لغت که خیلی پهلو هم میان رو میگن collocate. مثلا: خبر + داغ.
هرچند بعد فرهنگی ترجمه در این رویکرد نادیده گرفته میشه و باید به رویکردهای دیگه ای روی آورد.