ترجمان؛ آرتور گلدشمر: سالها پیش در پروازی از آمستردام به بوستون، دو راهبۀ آمریکایی سمت راست من نشسته بودند و به حرفهای مرد جوانِ خوشصحبتی از اهالی هلند گوش میدادند. مرد جوان قصد داشت ایالات متحده را ازنو کشف کند. او از راهبهها پرسید اهل کجا هستند؟ افسوس که شهر فرامینگهام در ماساچوست جزوِ برنامۀ سفرش نبود؛ اما اعلام کرد که «یه خروار۱ وقت داره و قراره از یه خروار جای مختلف دیدن کنه».
جوان سرخوشِ هلندی بهوضوح این را دریافته بود که «خروار» مترادف جذابی برای «زیادِ» بیرنگوبوست. او علم نحو انگلیسی را بهخوبی فرا گرفته بود و دایرۀ لغات نسبتاً گستردهای هم داشت؛ اما فاقد تجربۀ تناسب کلمات با بافتهای اجتماعی بود.
خبر اخیر، که موتور ترجمۀ گوگل قرار است از سیستم عبارتمحور به شبکۀ عصبی۲ تغییر کند، این خاطره را به ذهنم آورد. تفاوتهای فنیِ این دو در این لینک تشریح شده است. هر دو روش متکی به آموزش ماشین با یک «پیکرۀ متنی» شامل جملههای جفتیاند: جملۀ اصلی و ترجمۀ آن. سپس کامپیوتر، براساس توالی کلمات در متن اصلی، قواعدی برای استنباط محتملترین توالی کلمات در زبان مقصد استخراج میکند.
این روالْ عملی در تطابقِ الگوهاست. زمانی که خطاب به گوشی هوشمندتان میگویید
من مترجمی حرفهای هستم و تاکنون حدود ۱۲۵ کتاب از زبان فرانسه ترجمه کردهام
«مرا به بروکلین هدایت کن»، برای تفسیر هجاهای گفتهشده، یا، هنگامی که یک برنامۀ عکس چهرۀ دوستتان را شناسایی میکند و به آن برچسب میزند، از الگوریتمهای تطابقِ الگوی مشابهی استفاده میشود. ماشینْ چهرهها یا مقصدها را «نمیفهمد»؛ آنها را به بُردارهایی از اعداد تقلیل داده و پردازش میکند.
من مترجمی حرفهای هستم و تاکنون حدود ۱۲۵ کتاب از زبان فرانسه ترجمه کردهام. بنابراین ممکن است از من انتظار برود که در برابر ادعای گوگل از کوره در بروم که موتور ترجمۀ جدیدش تقریباً بهخوبی مترجمی انسانی است، زیرا از صفر تا شش، نمرۀ پنج را کسب میکند، درحالیکه میانگین انسانها 5.1 بوده است. اما علاوهبرآن دکترای ریاضی هم دارم و نرمافزاری ساختهام که روزنامههای اروپایی را به چهار زبان مختلف «میخواند» و نتایج را براساس موضوع دستهبندی میکند. پس بهجای اینکه در برابر احتمال جایگزینشدن بامترجم ماشینی موضع دفاعی بگیرم، از قابلیتهای چشمگیر ماشینها آگاه و نسبتبه پیچیدگی و مهارت تکنیکیِ کار گوگل سراپا ستایشم.
اما این ستایش چشمهایم را بر نواقص ترجمۀ ماشینی نمیبندد. مسافر هلندی را به یاد بیاورید که «یه خروار» انگلیسی میدانست. فصاحت مرد جوان نشان میداد که «خیسافزار»۳ یا بهعبارتی شبکۀ عصبی زندۀ او بهخوبی برای درک شهودیِ قواعد ظریف (و استثناها)، که زبان را طبیعی میکنند، آموزش دیده بود. در مقابل، زبانهای کامپیوتری دستورزبانی بدون بافت دارند. اما هلندیِ جوانْ فاقد تجربۀ اجتماعی از زبان انگلیسی بود تا قواعدِ ظریفتری را درک کند که به انتخاب واژه، لحن و ساختارِ زبانیِ یک بومی شکل میدهند. گویندهای بومی نیز ممکن است، برای دستیافتن به نتیجهای خاص، شکستن این قواعد را انتخاب کند. اگر من به دو نفر راهبه بهجای «جاهای زیادی» میگفتم «یه خروار جا»، حتماً از آن منظوری میداشتم؛ اما مرد هلندی به ورطۀ طنزِ ناخواسته افتاد.
جوان سرخوشِ هلندی بهوضوح این را دریافته بود که «خروار» مترادف جذابی برای «زیادِ» بیرنگوبوست. او علم نحو انگلیسی را بهخوبی فرا گرفته بود و دایرۀ لغات نسبتاً گستردهای هم داشت؛ اما فاقد تجربۀ تناسب کلمات با بافتهای اجتماعی بود.
خبر اخیر، که موتور ترجمۀ گوگل قرار است از سیستم عبارتمحور به شبکۀ عصبی۲ تغییر کند، این خاطره را به ذهنم آورد. تفاوتهای فنیِ این دو در این لینک تشریح شده است. هر دو روش متکی به آموزش ماشین با یک «پیکرۀ متنی» شامل جملههای جفتیاند: جملۀ اصلی و ترجمۀ آن. سپس کامپیوتر، براساس توالی کلمات در متن اصلی، قواعدی برای استنباط محتملترین توالی کلمات در زبان مقصد استخراج میکند.
این روالْ عملی در تطابقِ الگوهاست. زمانی که خطاب به گوشی هوشمندتان میگویید
من مترجمی حرفهای هستم و تاکنون حدود ۱۲۵ کتاب از زبان فرانسه ترجمه کردهام
«مرا به بروکلین هدایت کن»، برای تفسیر هجاهای گفتهشده، یا، هنگامی که یک برنامۀ عکس چهرۀ دوستتان را شناسایی میکند و به آن برچسب میزند، از الگوریتمهای تطابقِ الگوی مشابهی استفاده میشود. ماشینْ چهرهها یا مقصدها را «نمیفهمد»؛ آنها را به بُردارهایی از اعداد تقلیل داده و پردازش میکند.
من مترجمی حرفهای هستم و تاکنون حدود ۱۲۵ کتاب از زبان فرانسه ترجمه کردهام. بنابراین ممکن است از من انتظار برود که در برابر ادعای گوگل از کوره در بروم که موتور ترجمۀ جدیدش تقریباً بهخوبی مترجمی انسانی است، زیرا از صفر تا شش، نمرۀ پنج را کسب میکند، درحالیکه میانگین انسانها 5.1 بوده است. اما علاوهبرآن دکترای ریاضی هم دارم و نرمافزاری ساختهام که روزنامههای اروپایی را به چهار زبان مختلف «میخواند» و نتایج را براساس موضوع دستهبندی میکند. پس بهجای اینکه در برابر احتمال جایگزینشدن بامترجم ماشینی موضع دفاعی بگیرم، از قابلیتهای چشمگیر ماشینها آگاه و نسبتبه پیچیدگی و مهارت تکنیکیِ کار گوگل سراپا ستایشم.
اما این ستایش چشمهایم را بر نواقص ترجمۀ ماشینی نمیبندد. مسافر هلندی را به یاد بیاورید که «یه خروار» انگلیسی میدانست. فصاحت مرد جوان نشان میداد که «خیسافزار»۳ یا بهعبارتی شبکۀ عصبی زندۀ او بهخوبی برای درک شهودیِ قواعد ظریف (و استثناها)، که زبان را طبیعی میکنند، آموزش دیده بود. در مقابل، زبانهای کامپیوتری دستورزبانی بدون بافت دارند. اما هلندیِ جوانْ فاقد تجربۀ اجتماعی از زبان انگلیسی بود تا قواعدِ ظریفتری را درک کند که به انتخاب واژه، لحن و ساختارِ زبانیِ یک بومی شکل میدهند. گویندهای بومی نیز ممکن است، برای دستیافتن به نتیجهای خاص، شکستن این قواعد را انتخاب کند. اگر من به دو نفر راهبه بهجای «جاهای زیادی» میگفتم «یه خروار جا»، حتماً از آن منظوری میداشتم؛ اما مرد هلندی به ورطۀ طنزِ ناخواسته افتاد.
از قابلیتهای چشمگیر ماشینهای ترجمه آگاه و نسبتبه مهارت تکنیکیِ کار گوگل سراپا ستایشم
موتور ترجمۀ گوگل با استفاده از پیکرههای متنیِ متفاوت، از منابع خبری گرفته تا ویکیپدیا، «آموزشدیده» است. یگانه سرنخی که موجب پی بردن به بافت یک پیکره میشود، توصیف سادۀ آن پیکره است. استنباطِ تناسب یا عدمتناسبِ واژهای مثل «خروار» از چنین اطلاعاتِ اندکیْ سخت خواهد بود. اگر بنا به ترجمۀ این واژه به فرانسه باشد، ماشین میتواند معادلی مناسب را برای آن در beaucoup یا ۴plusieurs حدس بزند. این معادلها ممکن است معنای گفته را ارائه کنند، اما طنز آن را نه. زیرا این طنز وابسته به واژۀ «خروار» است که از لحاظ اجتماعی نشانهدار است، درحالیکه plusieurs خنثی است. هرچقدر هم که الگوریتم پیچیده باشد، باید به اطلاعات فراهمشده تکیه کند و سرنخها دربارۀ بافت، بهخصوص بافت اجتماعی، برای انتقال از طریق کُد بسیار مشکلاند.
petite phrase در زبان فرانسه را مثال بگیریم. phrase بهانگلیسی میتواند «جمله» یا «عبارت» معنا دهد. وقتی مارسل پروست در رمان در جستوجوی زمان ازدسترفته (۱۹۱۳)، در پارۀ «la petite phrase de Vinteuil’»، از آن در بافتی موسیقایی استفاده میکند، باید «عبارت» ترجمه شود، زیرا «جمله» بیمعناست. ترجمۀ گوگل در برگردانِ آن بسیار خوب عمل میکند
نباید از ماشینهای ترجمه انتظار معجزه، ترجمههای ادبی شایسته یا ارائۀ مناسبِ متلکهای سیاسی را داشت
موتور ترجمۀ گوگل با استفاده از پیکرههای متنیِ متفاوت، از منابع خبری گرفته تا ویکیپدیا، «آموزشدیده» است. یگانه سرنخی که موجب پی بردن به بافت یک پیکره میشود، توصیف سادۀ آن پیکره است. استنباطِ تناسب یا عدمتناسبِ واژهای مثل «خروار» از چنین اطلاعاتِ اندکیْ سخت خواهد بود. اگر بنا به ترجمۀ این واژه به فرانسه باشد، ماشین میتواند معادلی مناسب را برای آن در beaucoup یا ۴plusieurs حدس بزند. این معادلها ممکن است معنای گفته را ارائه کنند، اما طنز آن را نه. زیرا این طنز وابسته به واژۀ «خروار» است که از لحاظ اجتماعی نشانهدار است، درحالیکه plusieurs خنثی است. هرچقدر هم که الگوریتم پیچیده باشد، باید به اطلاعات فراهمشده تکیه کند و سرنخها دربارۀ بافت، بهخصوص بافت اجتماعی، برای انتقال از طریق کُد بسیار مشکلاند.
petite phrase در زبان فرانسه را مثال بگیریم. phrase بهانگلیسی میتواند «جمله» یا «عبارت» معنا دهد. وقتی مارسل پروست در رمان در جستوجوی زمان ازدسترفته (۱۹۱۳)، در پارۀ «la petite phrase de Vinteuil’»، از آن در بافتی موسیقایی استفاده میکند، باید «عبارت» ترجمه شود، زیرا «جمله» بیمعناست. ترجمۀ گوگل در برگردانِ آن بسیار خوب عمل میکند
نباید از ماشینهای ترجمه انتظار معجزه، ترجمههای ادبی شایسته یا ارائۀ مناسبِ متلکهای سیاسی را داشت
(منظور نسخۀ قدیمی عبارتمحور آن است؛ نسخۀ جدید شبکۀ عصبی تا الان تنها برای چینی ماندارین قابلاستفاده است). اگر فقط petite phrase را وارد کنید، به شما «جملۀ کوتاه» را تحویل میدهد. اگر la petite phrase de Vinteuil را وارد کنید (وانتوی نام شخصیتی است که ازقضا آهنگساز است)، به شما «عبارت کوتاه وانتوی» را تحویل میدهد که پژواکی از ترجمههای منتشرشده از اثر پروست است. کمیابی نام «وانتوی» بافت لازم را فراهم میآورد و الگوریتم آماری از آن بهره میگیرد. اما اگر le petite phrase de Sarkozy را وارد کنید، بهجای «متلک سارکوزی» که صحیح است، «عبارت کوتاه سارکوزی» را میپراند، زیرا در بافت سیاسیای که نام رئیسجمهور سابق آن را مینمایاند une petite phrase گفتۀ تندوتیزی است که بهسوی رقیبی سیاسی نشانه رفته است: یک متلک، نه عبارتی موسیقایی. اما نام سارکوزی در چنان تنوعی از جملات پدیدار میشود که موتور آماری از ثبت درست آن در میماند و آنگاه این خطا۵ را با یک اشتباه اصطلاحی تأسفآور همنشین میکند.
درست همانند تلاشهای پیشین برای خلق هوش مصنوعی که سابقۀ آن به روزهای دانشجوییِ من در ام.آی.تی برمیگردد، مسئله این است که هوش بهنحوی باورنکردنی پیچیده است. هوشمندبودن صرفاً توانایی استنباط منطقی از قواعد، یا استنباط آماری از قاعدهمندیها نیست. پیشازآن، شخص باید بداند که کدام قواعد کاربردیاند، هنری که نیازمند آگاهیداشتن از حساسیت به موقعیت است. برنامهنویسها بسیار باهوشاند، اما هنوز آنقدر باهوش نیستند که تنوع گستردۀ بافتهایِ حاملِ معنا را پیشبینی کنند. درنتیجه حتی بهترین الگوریتمها نیز نکاتی را از دست میدهند و، همانطورکه هنری جیمز گفته، مترجم ایدئال کسی است که «هیچ نکتهای از دستش در نرود».
برنامهنویسها بسیار باهوشاند، اما هنوز آنقدر باهوش نیستند که تنوع گستردۀ بافتهایِ حاملِ معنا را پیشبینی کنند
نمیگویم که ترجمۀ مکانیکی سودمند نیست. مقدار زیادی از کارِ ترجمهْ تکراری است. گاهی اوقات ماشینها از عهدۀ انجامِ کاری بسنده برمیآیند. اما نباید انتظار معجزه، ترجمههای ادبی شایسته یا ارائۀ مناسبِ متلکهای سیاسی را داشت. پژوهشهای مرتبط با هوش مصنوعی، از همان روزهای آغازین، زیر سایۀ ادعاهای مغرورانه بودهاند. این را از ترس شغلم نمیگویم: از ترجمه بازنشسته شدهام و این روزها بخشی از وقتم را صرف کدنویسی میکنم.
نمیگویم که ترجمۀ مکانیکی سودمند نیست. مقدار زیادی از کارِ ترجمهْ تکراری است. گاهی اوقات ماشینها از عهدۀ انجامِ کاری بسنده برمیآیند. اما نباید انتظار معجزه، ترجمههای ادبی شایسته یا ارائۀ مناسبِ متلکهای سیاسی را داشت. پژوهشهای مرتبط با هوش مصنوعی، از همان روزهای آغازین، زیر سایۀ ادعاهای مغرورانه بودهاند. این را از ترس شغلم نمیگویم: از ترجمه بازنشسته شدهام و این روزها بخشی از وقتم را صرف کدنویسی میکنم.