مطالعات ترجمه، جلد ۸، شماره ۲۹، صفحات ۰-۰

عنوان فارسی نقش پیکره‌های بزرگ یک‌زبانه در بهبود کیفیت ترجمۀ ماشینی
چکیده فارسی مقاله باهم‌آیی‌ها، یعنی ترکیبات بازرخدادی واژه‌ها که احتمال هم‌رخدادی آنها بیش از آن چیزی است که تصادفاً رخ می‌دهد در زبان‌های طبیعی به کرات مشاهده می‌شوند. از آنجایی که واژه‌نامه‌های دوزبانه قادر به ارائۀ معادل‌های واژگانی مناسبی برای اغلب این باهم‌آیی‌ها نیستند، اکثر قریب به اتفاق سیستم‌های ترجمه ماشینی در مواجهه با این گونه ترکیبات، اجرای دقیقی نداشته و در نتیجه کیفیت برونداد آنها تا حد قابل ملاحظه‌ای کاهش می‌یابد. در سال‌های اخیر پیکره‌های یک‌زبانه در حل مسائل مختلف زبان‌شناسی، شامل پردازش زبان طبیعی، ترجمۀ ماشینی آماری، آموزش زبان و سایر حوزه‌های مرتبط نقش مهمی ایفا نموده‌اند. مطالعۀ حاضر فرایند ساخت و استفاده از یک پیکرۀ بزرگ یک‌زبانۀ فارسی را مورد بررسی قرار می‌دهد. این پیکره این امکان را به ما می‌دهد تا مشکل ابهام باهم‌آیی‌های انگلیسی را در حین ترجمۀ آنها به زبان فارسی توسط یک سیستم ترجمۀ ماشینی رفع نماییم. با استفاده از چنین پیکره‌ای به عنوان پیکرۀ زبان مقصد و نیز یک واژه‌نامۀ دوزبانۀ انگلیسی-فارسی، کارآیی این پیکره در یافتن مناسب‌ترین معادل فارسی برای باهم‌آیی‌های انگلیسی، به منظور ارتقای کیفیت سیستم ترجمۀ ماشینی، مورد ارزیابی قرار می‌گیرد. نتایج آزمایشی که در این راستا بر روی یک پیکرۀ آزمون صورت گرفت بسیار امیدبخش بوده و صحت آن به 90.83% رسیده است.
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی The Role of Large Monolingual Corpora in Improving Machine Translation Quality
چکیده انگلیسی مقاله Collocations, recurrent combinations of words whose co-occurrence probability is higher than chance, are frequent in natural languages. Since bilingual dictionaries do not offer proper equivalents for most of such collocations, the majority of machine translation systems perform poorly when faced with collocations, and as a result, their output quality decreases to a high degree. Monolingual corpora have recently been used in solving various linguistic problems including natural language processing, statistical machine translation, language teaching and the like. The present study describes the process of creating and exploiting a large monolingual corpus of Persian. This corpus enables us to solve the ambiguity problem of English collocations when translating into Persian with an English-Persian machine translation system. Using such a corpus as a target language corpus and an English-Persian bilingual dictionary, we study the efficiency of this corpus in finding the most appropriate Persian equivalents for English collocations in order to enhance the output quality of a machine translation system. The results of the experiment on a test corpus were very encouraging and achieved 90.83% success.`
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله

نشانی اینترنتی https://journal.translationstudies.ir/ts/article/view/223
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده en
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده Scientific Articles
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات