![]() |
ابداع و طراحي سيستم رايانهای جهت ترجمه متون علمي زبان انگليسي به زبان فارسي
ابداع و طراحي سيستم رايانهای جهت ترجمه متون علمي زبان انگليسي به زبان فارسي
دکتر فرج الله خداپرستي طرح مسأله الف- سيستمهايكنترلشده Controlled language systems ب- ترجمه با استعانت از كامپيوتر Computer-assisted translation ج- سيستم تمام - اتوماتيك ترجمه ماشيني FAHQT مكانيسم، مؤلفهها و اجزاي سازنده سيستمهاي ترجمه ماشيني الف - واژگان ب- نحو و ساختار 1- سيستم Augmented Transition Networks: ATN 2- سيستم Augmented Phrase Structure Grammar: APSG 3- سيستم Definite Clause Grammar: DCG 4- سيستم Lexical - Functional Grammar: LFG 5-سيستم Generalized Phrase Structure Grammar: GPSG ج- معناشناسي نظري گذرا بر سابقه ماشين ترجمه فهرستي از سوابق پژوهشي نگارنده درزمينه ترجمه ماشيني حدود نيم قرن از زمان ظهور نخستين سيستمهاي نرمافزاري ترجمه ماشينيسپري شده و در خلال اين مدت، جهان شاهد پيشرفتهايي چشمگير در قلمرو ترجمه ماشيني و دستاوردهاي متنوع جانبي آن بوده است. اهميت اين پديده جديد و مقتضاي عصر اطلاعاتايجاب كرده است كه ميزان سرمايه گذاري كشورها در اين عرصه، در طي سالهاي گذشتهچشمگير و معادل ارقامي نجومي باشد. به عنوان نمونه در كشور كوچك هلند در سال 1983،هفده ميليون گيلدر معادل هشت ونيم ميليون دلار به يك طرح تحقيقاتي ترجمه ماشيني اختصاص دادهشده(1) و هدف پروژه مذكور تنها ترجمه شيوه نگهداري و كاربرد سلاح نظامي از زبان انگليسي بهزبان فرانسه بوده است. علت اين اقبال و عنايت، لحاظ اين واقعيت است كه دستيابي به سيستمترجمه ماشيني بالذاته ميتواند زمينهساز رشد علمي و توسعه ملي باشد و در ديگر عرصههايمورد نياز جوامع امروزي نيز تحولاتي شگرف پديد آورد. ظهور اينترنت و ضرورت حضور ووجود سيستم ترجمه ماشيني در كنار آن، باعث شده است كه تلاشهاي چند جانبه تحقيقاتي دراين زمينه گستردهتر و حجم سرمايهگذاريها در اين عرصه مضاعف گردد.(2) اگر تا قبل از رونق بازار اين پديده نو، مساعي منحصرا در زمينه ابداع ترجمه ماشينيدوسويه (انگليسي به فرانسه، ژاپني به انگليسي، روسي به آلماني و...) صورت ميگرفت، در حالحاضر گرايشها معطوف به سيستمهاي چندسويه (انگليسي به فرانسه، آلماني، اسپانيولي،ايتاليائي، ژاپني، چيني و...) شده است.(3) معالوصف عليرغم اين حقايق ملموس، در كشور ما نه تنها اين موضوع مورد تغافل قرارگرفته است، بلكه ابعاد واقعي قضيه و گستره كاربردي آن نيز نامكشوف مانده است. تصوير وتصوري كه از ترجمه ماشيني در اذهان وجود دارد، منطبق با واقعيتها نيست و متأسفانهتلاشي در جهت شناخت مسأله، اهميت و نقش آن در توسعه ملي و نيز پويائي و توليد علمي درسطح كشور صورت نگرفته است. در اين گزارش سعي ميشود با استعانت از تجربيات و براساس يافتههاي ملموس حاصلاز بيست سال مطالعه و تحقيق و كار مداوم در زمينه زبانشناسي رايانهايcomputational linguistics، بررسي هر چند موجز و مختصر - اما دقيق و واقعگرايانه- ازكم و كيف ترجمه ماشيني ارائه گردد. طرح مسأله قبل از تعريف و تبيين ترجمه ماشيني، ضروري به نظر ميرسد كه از ديدگاه زبانشناسي،ماهيت ترجمه را در مفهوم عام آن يعني ترجمهاي كه توسط شخصي متخصص و زباندان انجامميگيرد و اصطلاحاً به ترجمه انساني human translation تعبير شده است، بازشناسي كنيم.با آنكه سابقه ترجمه به قبل از قرن اول ميلادي برميگردد، هنوز هم تعريفي جامع و مانع ازترجمه به گونهاي كه مورد قبول همگان باشد در اختيار نيست.(4)علت امر ناشي از نوع نگرشاهل فن- كه معمولا پيرو مكانيب مختلفاند- و شيوههاي كاربردي و روال متداول در امر ترجمهميباشد. بديهي است اگر ترجمه را از ديدگاه طرفداران >ترجمه تحتاللفظي<literal translation بنگريم تعريف، مغاير با تعاريفي خواهد بود كه هواداران >ترجمه معنائي<semantic translation يا >ترجمه آزاد< Free translation از موضوع ارائه كردهاند. مع هذانبايد از نظر دور داشت كه در تعاريف گونهگون ارائه شده از سوي زبانشناسان وتئوريسينهاي ترجمه با گرايش فكري متفاوت، نقطهنظرهاي مشترك قابل تأمل نيز هست كهجمعبندي آنها ميتواند رهگشاي ما در اين زمينه باشد. براساس اين نقطهنظرهاي مشتركميتوان چنين نتيجهگيري كرد كه هر كلام و گفته در هر زبان صورتي (Forme) دارد و محتوايي(contenu) و ترجمه عبارتست از تبديل يا برگرداندن نزديكترين پيام مستتر در صورتواژههاي زبان مبدأ >source language = SL< يعني زباني كه از آن ترجمه انجام ميگيرد به>صورت < زبان مقصد target language = TL< يعني زباني كه ترجمه متن به آن برگرداندهميشود. و اما ترجمه ماشيني Machine Translation كه در پارهاي موارد تحت عنوانترجمه خودكار )اتوماتيك، ماشيني) automatic Translation نيز معرفي شده است(6)، به سيستم نرمافزاري رايانهاي اطلاق ميشود كه از طريق آن ميتوان متون ورودي زبان مبدأ SL > > را طي فرايندهايي خاص و پيچيده - در سطوح مختلف زبانشناختي - تجزيه و تحليل ودر نهايت به زبان)يا زبانهاي مقصد (ترجمه و به صورت خروجي در اختيار كاربر قرار داد. درواقع در طراحي نرمافزار ترجمه ماشيني تمهيداتي انديشيده و در ساختار آن مؤلفهها و اجزاييدرنظر گرفته ميشود كه عليالقاعده بايد سيستم را قادر سازد تا تقريبا همانند فردي مترجم تجزيه و تحليلهاي زبانشناختي متن ورودي را انجام داده تا با بهرهگيري از دادهها و براساسيافتهها، معادل جملات زبان مبدأ را در زبان مقصد توليد كند. انجام اين عمل مستلزم آن است كهسيستم علاوه بر برنامهاي رايانهاي متشكل از مجموعه الگوريتمهاي خاص و پيچيده، مجموعهفرهنگها و بانكهاي اطلاعاتي محتوي واژگان و قواعد ساختاري و معناشناختي زبانهاي مبدأ ومقصد نيز در اختيار داشته باشد. اگر بتوان ادعا كرد كه امكان تدوين فرهنگ قواعد ساختاري يا واژگان دستوري grammatical words)) نسبتا كامل فراهم باشد، مختصه و ويژگي زبان به گونهاي است كه درهيچ برههاي از زمان نميتوان فرهنگي -هر چند مبسوط - را يافت كه دربر دارنده همه واژههايآن زبان باشد، چه زبان پديدهاي است زايا و هر زمان ميتوان انتظار داشت كه واژههايي جديدخلق و به مجموعه واژگان آن زبان افزوده شود. از اين گذشته وجود خطاهاي املايي در متنميتواند در جريان كار ترجمه ايجاد اختلال كند.(7) مترجمين ورزيده در رويارويي با كلماتناشناخته يا ساختارهاي شاذ جملات، با مراجعه به منابع معتبر، تجربيات و دانش فردي و يا ازطريق استنتاج و استقراء به حل مشكل و مسأله ميپردازند. در ترجمه ماشيني نيز بايد در مقابلاين گونه پديدهها از ساز و كاري مشابه بهره جست، يعني بايد سيستم به ابزاري خاص مجهزباشد تا اختلالي در امر ترجمه بوجود نيايد. ماشينهاي ترجمه گوناگون و معمولي موجود درسطح بازار عموما فاقد اين ساز و كارند و طبيعي است كه محتواي برون داد آنها مغلوط و نامفهوم باشد و در نتيجه مشاهده ميشود كه حاصل كا ر اينگونه سيستمها، نه تنها مطلوبنيست، بلكه در مواردي عديده، بطور كلي غيرقابل استفادهاند.(8 )در گزارشهاي متعدد اعلام شدهاست كه سيستمهايي در تيراژهايي بالا و قيمتهايي نسبتا متعادل - و حتي گاهي در سطحجهاني و با تبليغاتي گسترده به بازار عرصه شده، خريدار فقط يك بار از آنها استفاده كرده و بهعلت عدم رضايت آنها را به دور افكنده است.!(9)و اما سيستمهايي كه براساس معيارهاي علميطراحي و در ساختار آنها از مكانيسمهايي منطقي و براساس دانش زبانشناسي رايانهاياستفاده شده است، به سه گروه تقسيمبندي ميشوند.(10) الف(سيستمsystemsهايكنترل شدهControlled language پس از كاربرد درازمدت سيستم ترجمه ماشيني در زمينه كاري مشخص و محدود وحصول تجربيات كاملا موفق و رضايتبخش، گرايشها بيشتر معطوف به ابداع سيستمهايكاربردي با مجموعه واژگان و ساختارهاي معين و از پيش تعيين شده است. اغلب مؤسسات وسازمانها درپي دستيابي به سيستمهاي ترجمه ماشينياند كه نيازشان را در زمينه فعاليتهايتخصصي آنها مرتفع سازد، بويژه آنكه اينگونه سيستمها معمولا چند زبانهاند. در اينسيستمها ميزان خطا به حداقل و ميزان انعطافپذيري، در امر برنامهريزي زباني به حداكثرميرسد و امكان اعمال ديدگاههاي زبانشناختي واقعا بيشتر است. با توجه به كارآيي درخورتوجه اينگونه سيستمها و مختصات مطلوب آنها، كمپانيها و مؤسسات ترجيح ميدهند به جايتهيه نرمافزارهاي ترجمه ماشيني تجارتي، رأسا سفارش سيستمهاي ترجمه ماشيني متناسب با خواستها و حوزه فعاليت تخصصي خود بدهند. در نتيجه اين نوع تمايلات، ابداع اينگونه سيستمها در جهان رواج و رونقي بسزا يافتهاست و تنها در اروپا دهها سيستم در اين قلمرو ابداع شده كه مهمترين آنها عبارتند از: Titus،Systran، Lent، Cop Volmac، Potrans، Smart، Hook and Hatton و... اكثر اين سيستمچندزبانهاند و برخي از آنها از نظر مورد حمايت مستقيم دولتها و جامعه اروپا هستند.(11) جالب توجه اين كه، جد اعلاي اينگونه سيستمها كه نخستينبار در كانادا و به منظورترجمه انگليسي به فرانسه متون مربوط به تحولات جوي و پيشبينيهاي هواشناسي- آن هم باتعدادي معدود كلمات و ساختارهايي محدود- مورد استفاده قرار ميگرفت، امروز از چنانمقبوليتي برخوردار شده است كه كتابچههاي راهنما و شيوه نگهداري بسياري از ماشينآلاتسنگين و جنگافزارهاي مدرن به زبانهاي مختلف دنيا از طريق اين نوع سيستمها ترجمهميشود و كمپانيهاي معظمي نظير زيمنس، كارترپيلار، داسو و... از مشتريان اصلي اينگونهسيستمها هستند.(12) ب( ترجمه با استعانت از كامپيوتر Computer-assisted translation اين نوع سيستمها تحت عنوان ترجمه ماشيني نيمهخودكار و نيز ترجمه ماشيني با كمك انسان human-assisted machine translation نيز معرفي شده است. ايده اين نوعسيستمها، حاصل تحقيق پژوهشگران دانشگاه شيكاگو آمريكاست،(13) و در پي ناكاميهايسيستمهاي ماشين ترجمه آمريكايي و عدم رضايت آنها از نتايج حاصله در دهههاي گذشته ظاهر شده است. با توجه به امكان ظهور و بروز ابهامهاي واژگاني، ساختاري و معناشناختي درامر ترجمه ماشيني و ارائه جملاتي نامربوط و اشتباه به عنوان جملات خروجي و عدم توانايياصلاح و تصحيح آنها، اين شيوه عمل ترويج ميشد. نحوه كار سيستم بر اين روال است كه درهر مورد و مرحلهاي كه سيستم قادر به ايفاي نقش خود به گونهاي مطمئن نباشد ديالوگي بينكامپيوتر و كاربر برگزار ميشود و رايانه از كاربر تقاضا ميكند با توضيحات خود حل مشكليا ابهامزدايي كند، شيوه كار اين نوع سيستم ها موفقيتآميز و عملي اعلام شده است ولي از نظر سرعت واتوماسيون چندان رضايت بخش نبوده است. براساس گزارشهاي متعدد، اين نوع سيستم بيشترمورد استفاده مترجمين تازه كار و حرفهاي و مخصوصŠ بيشتر در پيش ترجمههاي theme > >يعني ترجمه از زبان مادري به زبان بيگانه كاربرد داشته است تا version يعني >ترجمه متون اززبان بيگانه به زبان مادري <. و اين خود بعد جديدي را در قلمرو ترجمه ماشيني گشودهاست.(14(به هر حال ناگفته نبايد گذاشت كه از ديدگاه بسياري از متخصصين و اهل فن سيستممورد بحث از نظر ماهوي نزديك به سيستمهايي است كه نياز به پيش - پردازش pre-edit متنداشتهاند.(15) ج( سيستم تمام - اتوماتيك ترجمه ماشيني FAHQT پيشرفتهاي شگفتانگيزي كه در طي سالهاي اخير در زمينه هوش مصنوعي ArtificialIntelligent =AI و تكنيك شبكه عصبي پديد آمده است، تأثير غيرقابل انكار در جهت تكامل وتوسعه ترجمه ماشيني داشته است.(16) از سوي ديگر ظهور و پيدايش اينترنت و نوع خاصاستفاده كاربر از مطالب متنوع و گسترده شبكههاي اطلاعاتي ايجاب كرده است كه حوزه وقلمرو ماشين ترجمه نيز گسترش يابد و امر ترجمه در اين حيطه چه از حيث كاربرد و چه از حيثميزان نياز كاربر ابعاد ديگري كسب كند. طبيعتاً چون به موازات گستردگي امر، غموض و پيچيدگي قضيه نيز بيشتر شده است، بهحكم ضرورت ميبايست به منظور رفع نيازهاي كاربران چارهاي انديشيده شود. در اين راستاسيستم تمام اتوماتيك ترجمه ماشينيباكيفيتبالايعني FAHQT، Fully automatic High-Quality Translation ابداع شد. بايد توجه داشت كه در اصل اينسيستم وجه تكامل يافته سيستمي است كه نياز به پيش- ويراستاري pre-edit وپس-ويراستاري post-edit داشته است. بديهي است كه ويراستاريهاي ياد شده توسط فردمتخصص انجام ميگرفت ولي در حال حاضر اينگونه سيستمها مجهز به غلطياب املايي ونحوي نسبتاً قدرتمندي است كه قبل از انجام ترجمه متن زبان مبدأ را آمادهسازي ميكند. پس ازانجام ترجمه نيز، از طريق خطاياب نحوي زبان مقصد، متن خروجي ويرايش ميشود و درنهايت ويرايش نهايي توسط ويراستار انجام ميگيرد.(17) مكانيسم، مؤلفهها و اجزاي سازنده سيستمهاي ترجمه ماشيني در ساختار سيستمهاي ترجمه ماشيني سه مؤلفه اصلي وجود دارد و هر مؤلفه نيز بهنوبه خود از مجموعه اجزايي تشكيل ميشود كه در راستاي تحقق نقش يا نقشهاي آن سه مؤلفهاصلي عمل ميكنند. مؤلفههاي فوقالذكر در تناظر با سه سطح كه علم زبانشناسي نوين برايهر زبان طبيعي و زنده قائل است قرار دارند. اين سه سطح عبارتند از: الف - واژگان ب- نحو و ساختار ج- معناشناسي بايد همواره اين نكته را درنظر داشت كه تفكيك اين سطوح مبين عدم ارتباط بين مختصاتواژگان، نحو و ساختار و معناشناسي متن نيست، بلكه هر سه سطح در سلسله مراتب چندبعديخود در حكم تار و پود يكديگرند. به عبارت سادهتر اين تفكيك صوري و اعتباري است، و در راستاي نوعي >شبيهسازي<فرايند ترجمه، در ذهن مترجم است، در واقع ترجمه ماشيني از طريق اين شبيهسازي متحققميشود. از نظر اهميت، اولويت، سهولت پردازش و يا مسألهزايي آنها نيز نميتوان بين سه مؤلفهياد شده تفاوتي قائل شد، بلكه هر سه آنها، از ديدگاههاي ياد شده همسطحاند. شايد در وهله اولتصور شود كه در پردازشها، به علت انتزاعيتر بودن مؤلفه معناشناسي، اين سطح پيچيدهتر ودر نتيجه مسألهزاتر باشد، ولي بايد توجه داشت كه در عمل چنين نيست، هر سطح حتي سطحواژگان نيز مسائل و مشكلات خاص خود دارد چه >ابهام<ها در هر سطح ميتواند ظاهر شود.اگر در هر سطح به گونهاي منطقي با مسائل و قضايا برخورد شود از ميزان غموض و پيچيدگيو ابهامزايي در سطوح بعدي كاسته ميشود. دليل امر وجود تعامل و ارتباط ظريف بين عناصراين سه سطح است: در سطور زير سعي ميشود تصويري كلي از مكانيسم و نقش هر يك ازمؤلفههاي مورد بحث ارائه شود. الف) واژگان نخستين مرحله پردازش در ترجمه ماشيني در سطح واژگان انجام ميگيرد. پردازشمورد نظر عبارتست از تجزيه و تحليل مرفولوژيكي واژههاي واحد ترجمه. در اين مرحله عناصرموجود در سطح واحد ترجمه يك به يك تفكيك، پردازش و مقولهگذاري ميشوند. واژگان هرزبان مختصات و دشواريهاي خاص خود را دارد و بالقوه ميتوانند مسألهزا باشند. برخي از اينمشكلات جزو پعموميتهاپي زباني هستند و به زباني خاص اختصاص ندارند; پهمنويسههاپ ازجمله مصاديق اين مضمون به شمار ميروند: در زبان فارسي واژههاي ساده و پرتداول >مرد< و>آرد<، در زبان انگليسي واژههاي run > > و correct > > و در زبان فرانسه واژههاي livre > > و cours > > ميتوانند به مقولههاي گرامري متعدد، تعلق داشته باشند. و اين امر جدا و سواي ازپديده چند معنايي است كه در هر زبان امري عادي تلقي ميشود. عدم پردازش صحيح اينگونهموارد، ميتواند موجد مسائل و مشكلات لاينحل در مراحل و سطوح بعد ميگردد. شايان ذكر آنكه، زبان انگليسي از اين منظر جزو خطازاترين زبانها محسوب ميشود€ ولي بايد همواره به خاطرداشت كه همنويسهها تنها عامل خطازا در امر پردازش واژگان نيستند، در بعضي زبانها مشكلاتخاص و مختص آن زبان وجود دارد كه در عرصه پردازش زبان مجال ظهور و بروز يافته، منشأابهام و خطا ميشوند. انفصال و ناپيوستگي عناصر واحد ترجمه در زبان انگليسي، امكان خلطادات و انتساب آنها به سازههاي غير، از جمله عوامل ابهامزا و خطازا در مرحله پردازش واژگانمحسوب ميشود بنابراين بايد با لحاظ همه موارد مسألهآفرين، تدابيري انديشيد كه در اينسطح- به ظاهر ساده- ميزان خطا به حداقل ممكن برسد و راه براي انجام پردازش و تجزيه وتحليلهاي زبانشناختي بعدي، بهتر هموار گردد. در جهت نيل به اين هدف در زبان انگليسي اقدامات متعدد انجام گرفته است . از جمله در سال 1991 پروژهاي عظيم به مديريت كنسرسيومي متشكل از چند دانشگاه و نهاد علمي و صنعتي، منجمله دانشگاه اكسفورد و دانشگاه لانكاستر، مركز تحقيقات كتابخانه ملي بريتانيا، شوراي علمي و مهندسي، آكادمي انگليس، به منظور تدوين پيكره زباني انگليسي BNCو مقولهگذاري واژههاي انگليسي شروع و در سال 1996 خاتمه يافت. پيكره زباني براساس صدميليون واژه تدوين شد و از طريق آن امكان كددهي و مقولهگذاري فراهم آمد و در نهايت، حدود98%مقولهگذاري صحيح ميسر گشت.(18) ب) نحو و ساختار Parsing در اصطلاح computational linguistics يعني اجراي برنامه تجزيه و تحليلنحوي متن و يا به عبارت كليتر تجزيه و تحليل گرامري جمله از طريق كامپيوتر. و parser بهسيستمي اطلاق ميشود كه با استعانت از آن پواحد ترجمهپ از منظر ساختار و نحو تجزيه وتحليل ميشود; به نحوي كه كامپيوتر ميتواند از طريق آن به سهولت عناصر تشكيل دهندهواحد ترجمه را بازشناسي كند، نقش آنها و روابط دروني و فيمابين آن عناصر و نوع قانونحاكم بر آنها را تشخيص دهد.(19)در ترجمه ماشيني دستيابي به اطلاعات ياد شده ضروري واجتنابناپذير است، چه علاوه بر برگردان عناصر معنائي و واژگان، ترجمه ساختار نحوي واحدترجمه، از زبان مبدأ به مقصد نيز بايد انجام شود. در واقع برگردان قالب و ساختار جمله از زبانمبدأ به زبان مقصد، شرط اصلي و اساسي ترجمه است ; و اين امر جز با تجزيه و تحليل گرامريواحد ترجمه ميسر نميشود. انجام اين مهم از طريق سيستمهاي تجزيه و تحليلگر رايانهاي صورت ميگيرد. گفته شدهاست كه مهمترين ركن ماشين ترجمه تجزيه و تحليلگر نحوي يعني parserاست. هر چند اينطرز نگرش خالي از اغراق نيست ولي بيانگر اهميت دومين مؤلفه اصلي در ساختار سيستمترجمه ماشيني است. اين اهميت، انگيزه آن بوده كه تاكنون صدها نوع parserدر سطح جهانابداع شود، تنوع مكانيسمهاي بكار رفته در ساختار تجزيه و تحليلگرهاي نحوي واقعا اعجابانگيز است. تقريبا هيچ دانشگاهي و مؤسسه آموزش عالي در سطح جهان يافت نميشودكه داراي مركز تحقيقات زبانشناسي يا رايانهاي باشد و حداقل يك تجزيه و تحليلگر نحو در آنابداع نشده باشد. نقش اصلي تجزيه و تحليلگر نحوي در ساختار ترجمه ماشيني عبارتست از: 1- تشخيص دستوري بودن جمله 2- شناخت عناصر سازنده جمله و شيوه تركيب آنها به منظور تشكيل واحدهاي بزرگتر،عبارت، بند و... 3-تعيين نقش هر يك از واحدها در جمله 4- شناخت دقيق روابط معنايي بين عناصر سازنده جمله علاوه بر نقش اصلي، نقشهاي فرعي- بنا به مقتضاي كار و سليقه مبدع - نيز براي تجزيه وتحليلگر نحوي درنظر گرفته ميشود. شيوه كار parserها متفاوت است ولي معمولا براساس دو نوع شيوه كارشان، به دودسته تقسيمبندي ميشوند: parserهاي نزولي و صعودي. با آنكه هيچكدام از اين دو نوعparserها كامل و بينقص نيستند ولي معمولا parser نزولي بيشتر مورد توجه بوده و نميشود برسد، كه خود نشانه موفقيتآميز بودن، تجزيه و تحليل نحوياست. نكته قابل توجه در مورد parser شبكه انتقالي نحوه انطباق آن با زبان برنامهنويسي lispاست; اگر parser يكي از اجزاي كلام مثلا اسم را بررسي ميكند، با توجه به اينكه - در اينجا-اجزاء كلام جزو نمادهاي پاياني محسوب ميشوند، از فرمان category استفاده ميكنيم(category terminal-symbol) ولي اگر parser در حال جستجوي واحد غيرپاياني نظيرعبارت اسمي باشد ناچار به شبكه عبارات اسمي رجوع كرده و در آن شبكه، كار جستجوي خودرا ادامه ميدهد، براي انجام اين عمل فرمان parser (parse nonterminal-symbol) را اجراميكنيم. مهمترين سيستمهاي تجزيه و تحليل نحوي كامپيوتري كه در حال حاضر مورد استفادهقرار ميگيرند، عبارتند از: 1- سيستم Augmented Transition Networks) ATN)( اين سيستم به سال 1978 و توسط Woods ابداع و پس از سالها آزمايش و تجربه و انجامپارهاي تغييرات در سال 1978 بوسيله مادلن بيتز M.Bates، سرانجام در سال 1983 و 1986 بهسعي وينوگراد Winograd و دودنز Doedens تكميل شد.(21) اين سيستم كه در نوع خودبسيار كارآ و جالب است ميتواند علاوه بر تجزيه و تحليل نحوي جملات، صحت و سقم واحدترجمه را نيز تشخيص دهد. ولي بايد توجه داشت كه نكته مهم تشخيص درستي جمله براساسمعيارهاي خاصي است كه منحصراً در عرصه Computational linguistics معتبر است ولزوماً با آنچه معيار زبانشناسي است، هماهنگ و منطبق نيست. گفته ميشود با بهرهجوئي ازسيستم ياد شده ميتوان در پارهاي از موارد مشخص، عناصر معناشناختي را نيز تجزيه وتحليل كرد. 2- سيستم Augmented Phrase Structure Grammar) APSG ) نزديكترين سيستم تجزيه و تحليل نحوي به ATN بشمار ميرود، تفاوت اصلي اين دوسيستم در اين امر نهفته است كه در سيستم APSG از ساختار شبكهايپ استفاده نميشود، هرچند اين سيستم در اصل با توجه و با تكيه بر Constituenc y ragramm(22) و آنهم براساسدستور زبان انگليسي طراحي شده است ولي امكان بهرهجوئي از آن در سيستم تجزيه و تحليلنحوي براساس dependency grammar نيز وجود دارد، اخيراٌ روايتگونه (version)جديدي از اين سيستم به منظور كاربرد در زمينههاي فرماليسم همگاني نيز ابداع شده است. 3- سيستم ( Definite Clause Grammar) DCG از جمله ملحقات زبان برنامهنويسي كامپيوتري prolog ميباشد، يعني زباني كه در اصلبمنظور پردازش دادهها و مفروضات زبانشناختي طراحي شده است. يكي از خصوصيات عمدهسيستم DCG آنست كه كاربر در مراحل تجزيه و تحليل جمله دسترسي كمتري به مراحلاجرائي و نحوه پردازش دارد، بنابراين قدرت مانور محدود ميشود ولي كارآئي سيستم درمقايسه با ANT بهتر ارزيابي شده است. 4- سيستم Lexical - Functional Grammar) LFG ) سيستمي است كه در سال 1981 با همت R.Kaplan , Joan , Bresnan ابداع شده وبراساس ساختار سازهها عمل ميكند. مكانيسم اين سيستم به گونهاي است كه با خلق سازهساختاري يعني C-structure و F-structure، اطلاعات نحوي لازم به نمودار درختي منتقلميشود. yasukawa بر اين باور است كه ميتوان بين سيستمهاي LFG و DCG همسوئي وسازش مطلق ايجاد كرد، ولي با عنايت به مكانيسم LFG و تكيه بر وجود ساختار سازهاي تجريدي حاكم و مسلط بر ساختار واژهها، تطبيق اين دو سيستم بدون انجام تغييرات لازم در كلسيستم آسان بنظر نميرسد، قابل توجه آنكه LFG بر پايه Constituency syntax طراحيشده است. 5-سيستم Generalized Phrase Structure Grammar) GPSG ) اين parser از كار و تحقيقات Gerald Gazdar نشأت گرفته و بر مبناي دستور زايش-گشتاري طراحي شده و ميكوشد قواعد نحوي را با قواعد معناشناختي مرتبط كند. عليرغم آنكهمبناي كار دستور زايش - گشتاري است نه از قواعد گشتارها بهره ميجويد نه از ژرف ساخت;منحصراً روساخت ملاك است و به اين سبب، اين رهيافت كه جنبه صوري آن چشمگيرتر استدر سيستم ترجمه بيشتر با اقبال و استقبال روبرو ميشود. بايد توجه داشت كه گشتارهابمنظور تبيين ويژگي توليد تعدادي نامحدود جملات از يك سري قاعدههاي محدود، بوسيلهچمسكي و بسال 1957 ارائه شد. GPSG با اين مسئله به گونهاي ديگر برخورد ميكند.در اينجافرض بر اين اصل استوار است كه تعدادي syntagma استاندارد بنام مقولات اشتقاقي وجوددارد كه ديگر syntagmaها از آنها مشتق ميشوند. ج) معناشناسي مشكل چندمعنايي بودن واژهها، شناخته شدهترين ويژگي زبانهاي طبيعي است و اين امرزائيده قانوني است كه در زبانشناسي تحت عنوان اقتصاد كلامي economie langagiereاشتهار يافته است مترجم به هنگام برخورد به واژه چند معنا، با تكيه بر توانش زباني competence خود وبافتار و موضوع متن ميتواند معادل واقعي واژه را تشخيص دهد و برگزيند. رايانه فاقد چنينتوانشي است. بنابراين طراح ماشين ترجمه ناگزير است مقدماتي فراهم سازد و در الگوريتم; بهتمهيداتي دست يازد كه از طريق آن بتواند خلأ موجود را ترميم كند. اين تمهيدات بايد از نخستينمراحل پردازش يعني از مرحله واژگان و نحو و ساختار آغاز گردد و تا آخرين مرحله يعنيمرحله تجزيه و تحليل معناشناختي متن تداوم يابد. با پذيرش اين واقعيت كه نميتوان پروسهپيچيده و كاملا انتزاعي معناشناسي را در اين مختصر تشريح كرد، ناچاريم به ذكر چند نمونهمثال ساده بسنده كنيم، شايد از اين رهگذر درك مطلب ميسر گردد. مثالهاي زير ميتواندروشنگر مضمون باشد، كلمه prime در زبان انگليسي يك مقوله دستوري، چهار مقوله معناييو 16 معنا دارد. واژه suspect نيز به سه مقوله دستوري (اسم و فعل و صنعت) تعلق دارد وداراي شش مقوله معنايي و 21 معناست، minister نيز دو مقوله گرامري، شش مقوله معنايي و11 معنا دارد. قاعدتŠ ماشين ترجمه ميتواند 1280 معادل فارسي را براي تعبير The prime suspectانتخاب كند. ولي اگر سيستم در پردازش واژگان و ساختارها دقيق عمل كرده باشد تعدادانتخابها به 32 و در نهايت اگر در مرحله پردازش معنا، منطقي با قضايا برخورد كند و فرهنگمعناشناختي تدوين شده براساس اصول زبانشناسي رايانهاي در اختيار داشته باشد، سيستممنحصراً تنها گزينه را انتخاب خواهد كرد. براساس همين محاسبه تعداد معادلهاي محتملفارسي prime minister در سيستمهاي ماشين ترجمه عادي 176 خواهد بود. ولي اگر درمراحل قبلي، براساس معيارهاي دقيق، پردازشها صورت گرفته باشد، تعداد معادلها به 112 ودر نهايت به تنها انتخاب صحيح دست خواهد يافت. واژه سه حرفي run را درنظر ميگيريم، اينواژه دو مقوله دستوري و 58 مقوله معنايي و بيش از 140 معنا دارد. تنها، سيستمي قادر خواهدبود كه معناي مناسب اين واژه را برگزيند كه با استعانت از الگوريتمي قوي و فرهنگمعناشناختي جامع بتواند مؤلفههاي معناشناختي را در طول پردازش and و or كند. 1-اجراي پروژه تحقيقاتي >واژگان و ساختار پايه زبان فارسي در سال 1364 بر اساس پيكره زباني ده ميليون واژه اي ( دانشگاه شيراز) 2 - نخستين پروژه آكادميكي ترجمه ماشيني در ايران ( دانشگاه شيراز) و ارائه نتايج آن به نخستين كنفرانس زبان شناسي ايران . 3- ابداع نخستين تجزيه وتحليلگر نحوي 1365-66 ( دانشگاه شيراز) 4- ابداع نخستين خطاياب املايي فارسي ارائه شده در نمايشگاه اپل و نرم افزار زرنگار . 5- الگوريتم و پياده سازي آزمايشي OCR 6 تدوين فرهنگ جامع واژگان مترادف و متضاد زبان فارسي ( مشتمل بر 137000 واژه و 27400 حوزه معنايي )دانشنامه پارس 1376 7 - تدوين فرهنگهاي مورد نياز مورد نياز سيستم ترجمه ماشيني انگليسي – فارسي 8- تدوين فرهنگ معارف مشتمل بر واژههاي فقه، اصول، كلام، منطق، فلسفه عرفان و تصوف،اخلاق، حديث و علوم قرآني به چهار زبان فارسي، فرانسه، انگليسي و لاتين(نرم افزار : سال 1365 – زير چاپ فرهنگ معاصر 1380 9-طرح تحقيقاتي فرهنگ بسامدي بسامد كلام امام 77- 79(دانشگاه شيراز) 10-رهيافت نو در شيوه تكيه بري واژگان زبان انگليسي - مركز نشر دانشگاه شيراز |
نظري گذرا بر سابقه ماشين ترجمه
در طي چند دهه اخير و همزمان با گسترش و پيشرفت زبانشناسي رايانهاي، در بسيارياز كشورهاي پيشرفته، تلاشهاي همهجانبه و پيگير در جهت ترجمه متون از طريق كامپيوترانجام گرفته و حاصل كار با توجه به تنگناها و مسائل خاص ترجمه درخور توجه بوده است. اينحقيقت را بايد گفت و پذيرفت كه ترجمه متون از طريق كامپيوتر محدوديتهاي خاص خودداشته است. در بعضي از زمينهها حاصل كاركرد واقعا رضايتبخش است ولي در بعضيموارد نتايج به دست آمده را عليرغم قابل فهم بودن- بايد ويراستاري كرد. طبيعتا نوع متن وميزان غموض و پيچيدگي آن در بازدهي امر كاملا ذيمدخل ميباشد. ترجمه متون علمي به اينعلت كه از وضوح بيشتر برخوردار و ميزان ابهامزايي آن تقريبŠ ناچيز است، به سهولت از طريقكامپيوتر انجام ميگيرد، ولي ترجمه متون ادبي كه از ديدگاه علمي در حيطه ترجمه فرهنگي cultural translation(23) قرار دارد، اگر غير ممكن نباشد چندان ساده نخواهد بود و حاصلآن نميتواند رضايتبخش باشد. براساس پيشبينيهاي اهل فن بدون شك طي چند سال آتينتايج حاصل از ترجمه متون ادبي از طريق كامپيوتر با نتايج فعلي آن كاملا متفاوت خواهدبود.(24) با عنايت به حقايق واقعگرايانه فوق، در ترجمه ماشيني ويژگيهائي وجود دارد كه نهتنها از نظر جذبه و كشش علمي بلكه از ديدگاه اقتصادي و ديگر ضرورتها و اقتضاهاي عصرانجام آنرا كاملا توجيه ميكند. به عنوان مثال در مقر سازمان ناتو در بروكسل و جامعه اروپاعليرغم آنكه حدود 1200 مترجم ورزيده به كار اشتغال دارند، در حال حاضر از ترجمه ماشيننيز استفاده ميشود.(25) و عامل امر مسأله سرعت و زمان و صرف هزينههاست. ميزان كاريكه مترجمي ورزيده در خلال چندين روز انجام ميدهد، كامپيوتر در عرض چند دقيقه ترجمهميكند. حتي اگر كيفيت و دقت ترجمه ماشيني كمتر از حاصل كار مترجم باشد، باز هم از جهاتمختلف اهميت و ارزش خاص آن چشمگير است. حديث تكامل ماشين ترجمه از جذابيت خاصي برخوردار است بدين معنا كه نخستين تلاشها منجر به تدوين فرهنگهاي دوزبانه رايانهاي شد، يعني پس از وارد كردن كلمه ، معادل آن در زبان ديگر به دست ميآمد. دامنه جاهطلبيها در اين عرصه،بتدريج افزون و افزونتر گشت تا كمكم احساس شد كه امكان تجزيه مرفولوژيكي واژگان نيز ازطريق رايانه ميسر است، به دنبال آن ترجمه كلمه به كلمه متن از طريق رايانه باب شد، ترجمهعبارت به عبارت و پس از آن جمله به جمله در دستور كار محققين قرار گرفت.(26) نخستينتحقيقات در اين زمينه در شوروي سابق صورت گرفت و پس از آن، آمريكائيها پيشتازان اينعرصه شدند. در سال 1954 دانشگاه جورج تاون آمريكا عهدهدار انجام نخستين پروژه ماشينترجمه (ترجمه ماشيني) گشت. آنها با استفاده از فرهنگي 250 كلمهاي و شش قاعده نحويتوانستند جملاتي را از روسي به انگليسي ترجمه كنند. و به اين طريق نشان دادند كه ترجمه ازطريق رايانه امكانپذير هست.(27) پس از آن سيل سرمايه به سوي پروژههاي ترجمه ماشينيسرازير گشت و انجام چندين پروژه تحقيقاتي در دانشگاههاي مهم هاروارد، M.I.T، پنسيلوانياو ديگر مؤسسات آموزش عالي آمريكا شروع شد. تنها در سال 1966 دولت آمريكا 20 ميليوندلار در زمينه ماشين ترجمه سرمايهگذاري كرد ,ولي درنهايت. عدم توفيق محققان امريكايي در امر ابهامزدايي متونترجمه شده، انتقادات شديد برانگيخت . زبانشناسي بنام بارهيلل Bar- Hillel در سال 1964 گزارشي انتقادآميز راجع به اين قضيه منتشركرد و پس از آن در سال 1966 با انتشار گزارش ديگريبه قلم pierce آخرين ضربه به پيكره اين تحقيقات وارد شد . سر انجام فعاليت آمريكائيها در اين زمينه تقريبا متوقف ماند و دوباره پس از وقفهاي بيستساله در دهه هشتاد، سلسله تحقيقات خود را از سر گرفتند. شورويها كه پيشگامان اين عرصه بشمار ميروند در دهه پنجاه ميلادي، پژوهشهايخود را در زمينه ترجمه ماشيني آغاز كردند. تحقيقات آنها معمولا در انستيتوي مركز اطلاعاتعلمي VINITY به سرپرستي پروفسور ميخائيلوف و آزمايشگاه مدلسازي الكترونيك زيرنظر پروفسور واسيليف انجام ميگرفت.(28) در همين سالها بلسكايا Belskaya الگوريتميجامع براي ترجمه ماشيني دوسويه انگليسي- روسي ارائه كرد. و در طي دهه شصتزبانشناسان فرماليست روسي در زمينههاي متعدد موضوع مورد بحث تحقيقات ارزندهايسامان دادند. غنا و عمق پژوهشهاي گسترده آنان در زمينه نشانهشناسي( (semiotics وتجزيه و تحليل نشانهها، رابطه متن و معنا، تجزيه و تحليلهاي مرفولوژيكي، نحوي ومعناشناختي بيانگر آن است كه روسها مسائل و مشكلات مربوط به ابهامهاي واژگاني ومعنايي را حل كردهاند. مهمترين رويداد در حيطه ماشين ترجمه، همزمان با ابداع نخستينكامپيوتر شخصي دنيا بنام مير (Mir) در انستيتوي سيبرنتيك آكادمي علوم اوكراين در شهركيف به وقوع ميپيوندد. در دانشگاه ايالتي مسكو نيز گروهي به سركردگي كولاگينا (Kulagina) و مولوشنايا(Moloshnaya) الگوريتمي قوي در زمينه تجزيه و تحليلمرفولوژيكي و ساختاري ابداع كردند. ملچوك Melcuk زبانشناس نامدار روسي در انستيتويزبانهاي خارجي اولين كسي بود كه مؤلفههاي معنايي را در ترجمه ماشيني بكار بست، تابالاخره نخستين ماشين ترجمه كاربردي شورويها در سال 1976 به ثمر نشست و مورداستفاده همگان قرار گرفت.(29) نكته مهم آنكه راز و رمز سيستم ترجمه ماشيني پوشيده ماند تا زماني كه ملچوك و يكياز همكارانش به غرب پناهندهشدند. در اروپا تحقيقات در زمينه ترجمه ماشيني از دهه شصت نضج گرفت. CNRSهايفرانسه نخستين مراكز پژوهشي بودند، دانشگاه گرونوبل در اين زمينه فعاليت چشمگير و قابلملاحظهاي داشت و نخستين محصول كاربردي آن Geta، بود كه با سرمايهگذاري كميسيونجامعه اروپا به ثمر نشست و انگيزه انجام صدها پروژه تحقيقاتي در اروپاي غربي شد،سيستمهاي Metal با سرمايهگذاري زيمنس، Eurolang، Eurotra، Systra، Logos،Fugitso، و... حاصل آن پروژههاست كه اكثراً چند سويه هستند و در آن واحد ترجمه متن از يكزبان به چند زبان اروپايي را امكانپذير ميسازند.(30) پيشرفتهاي شگرف اروپائيان در دهههشتاد و نود ميلادي الهامبخش آسيائيها در پيگيري تلاش ايشان شد. ژاپنيها در اين عرصهپيروزترين محسوب ميشوند و به دنبال آنها چينيها، كرهايها، مالزياييها و تايلنديها و...سيستمهاي ترجمه ماشيني خود را ابداع كرده و به كمال ميرسانند. و اما در ايران تقليدگونههايي از كار ماشين ترجمه شده است ولي متأسفانه به علت عدم وجود بينش علمي كافي،حاصل كار از سطحي ناچيز فراتر نرفته است. ترجمه جملاتي ابتدايي، ساده و پيشپا افتادهانجام داده ميشود كه در حكم بازيچهاي بيش نيست. اين امر باعث شده كه تصور و تصويري غيرواقعي از قضيه در اذهان ايجاد شود. حتي ابتداييترين واقعيات نيز از نظرها پنهان ماندهاست. بدين معنا كه ماشين ترجمه علاوه بر محصول اصلي خود، داراي محصولات جانبي متعدداست كه از نظر ارزش و اهميت كمتر از محصول اصلي نيست.. . با عنايت به اين امر كه تصور ميكنيم در ايران، بيش از هر فرد يا گروه ديگر صلاحيت اظهار نظر و اجراي پروژه ترجمه ماشيني در سطوح مختلف را داشته باشيم، و با توجه به سابقه بيست ساله كار هاي تحقيقاتي و پشتوانه غني علمي ما در اين زمينه و حصول نتايج كاملا رضايتبخش، در صورت لزوم و تقاضا ميتوانيم تفصيل امر و شرح روشها تكنيكهاي اجرايي و نيز الگوريتم و dataهاي مربوط را در اختيارتان قرار دهيم . در سطور زيربه ايجاز و اختصار و فهرستوار شمهاي از كارهاي پژوهشي خود در زمينه ترجمه ماشيني وزبانشناسي رايانهاي ارائه ميشود: |
زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۰۷:۳۹ قبل از ظهر ميباشد. |
Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.