|
مطالعات ترجمه، جلد ۱۴، شماره ۵۴، صفحات ۰-۰
|
|
|
عنوان فارسی |
ترجمۀ خودکار عبارات اسمی زبان مبدأ با استفاده از پیکرۀ خام زبان مقصد |
|
چکیده فارسی مقاله |
وجود زنجیرهای از اسمها و صفتها که دارای چندین معادل ترجمانی هستند و یا عبارات اسمی که از نظر واژگانی یا ساختاری مبهم هستند مشکل رایج در ترجمه هر زبانی به زبان دیگر است. اما این مشکل زمانی نمود بیشتری پیدا میکند که برخی از این اسمها یا صفتها در یک زنجیره از نظر طبقه واژگانی یا اجزای کلام نیز مبهم باشند؛ یعنی یک صفت میتواند در عین حال یک اسم نیز باشد و بالعکس. مقاله حاضر کوششی است در جهت ارائه روشی برای تحلیل ساختار عبارات اسمی بر اساس پیکرههای بزرگ برچسبگذاری نشده. روش پیشنهادی روشی مستقل از زبان و خودکار است که بر اساس بسامد هم رخدادهای دادهها در یک پیکره خام میباشد و از این رو میتوان آن را یک روش یادگیری غیرنظارتی تلقی کرد. کارایی این روش با استفاده از آزمایشی که طی آن یک پیکره نمونه متشکل از 280 واژه که از نظر واژگانی مبهم بودند (مبهم از نظر اسم و صفت) در قالب عبارات اسمی مورد آزمون قرارگرفت. نتایج حاصل از این آزمون نشان دهنده میزان خطای 2/7 درصدی با در نظرگرفتن تمام انواع عبارات اسمی مبهم و با دقت کارایی کلی برنامه به میزان 8/92 درصد بود که بسیار امیدوارکننده به نظر میرسد. |
|
کلیدواژههای فارسی مقاله |
|
|
عنوان انگلیسی |
Automatic Translation of Source Language Noun Phrases Using a Raw Corpus of Target Language |
|
چکیده انگلیسی مقاله |
A common problem concerning translation between every two languages is the existence of a sequence of nouns and adjectives for which several translations are possible, or noun phrases which are lexically or structurally ambiguous. The situation becomes even more critical when some of these nouns or adjectives in the sequence are also ambiguous regarding their part of speech. That is, an adjective may also be a noun or vice versa. This paper is an attempt to present an approach for analyzing noun phrase structure based on large unannotated corpora. The proposed method is a language independent one, an automatic approach based on co-occurrence frequencies of data in the raw corpora, and thus can be considered as an unsupervised learning method. The performance of the method has been evaluated through an experiment in which a sample corpus of 280 lexically ambiguous words (ambiguous between noun and adjective) in the framework of noun phrases are tested. The results obtained from this experiment show that the total error rate considering all types of ambiguous noun phrases is as low as 7.2%, with the overall program accuracy of 92.8% which is very promising. |
|
کلیدواژههای انگلیسی مقاله |
|
|
نویسندگان مقاله |
|
|
نشانی اینترنتی |
https://journal.translationstudies.ir/ts/article/view/309 |
فایل مقاله |
فایلی برای مقاله ذخیره نشده است |
کد مقاله (doi) |
|
زبان مقاله منتشر شده |
en |
موضوعات مقاله منتشر شده |
|
نوع مقاله منتشر شده |
Scientific Research Paper |
|
|
برگشت به:
صفحه اول پایگاه |
نسخه مرتبط |
نشریه مرتبط |
فهرست نشریات
|