این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پردازش علائم و داده ها، جلد ۱۱، شماره ۲، صفحات ۷۱-۸۰

عنوان فارسی تأثیر ساخت‌واژه‌ها در تجزیه وابستگی زبان فارسی
چکیده فارسی مقاله سامانه‌های مبتنی بر داده به راحتی می‌توانند به سایر زبان‌ها یا دامنه‌ها منتقل شوند. استفاده از این رویکرد در تجزیه وابستگی منجر به ارائه روش‌های مبتنی داده شد که تنها نیازمند پیکره‌ای حاوی جملات و درخت وابستگی متناظر با آن به عنوان داده آموزشی است. الگوریتم‌های طراحی شده برای تجزیه وابستگی با وجود صحت بالا در زبان انگلیسی، بر روی دسته‌ای از زبان‌ها با افت صحت مواجه می‌شوند که دلیل این امر را می‌توان در پر رنگ‌تر بودن عامل بی‌ترتیبی و غنای ساخت‌واژی آنها دانست. این بدان معناست که سامانه‌های مبتنی بر داده نیازمند انتخاب خصوصیات و تنظیم دقیق پارامترها به منظور رسیدن به کارایی بهینه هستند. زبان فارسی که به تازگی پیکره وابستگی برای آن طراحی شده است جزو زبان‌هایی است که دو عامل بی‌ترتیبی و غنای ساخت‌واژی را داراست. در این مقاله سعی شده که عوامل تأثیرگذار بر کاهش صحت تجزیه وابستگی در زبان فارسی شناسایی و راهکارهایی برای بهبود صحت آن ارائه شود.
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Effect of morphologies on Persian dependency parsing
چکیده انگلیسی مقاله Data-driven systems can be adapted to different languages and domains easily. Using this trend in dependency parsing was lead to introduce data-driven approaches. Existence of appreciate corpora that contain sentences and theirs associated dependency trees are the only pre-requirement in data-driven approaches. Despite obtaining high accurate results for dependency parsing task in English language, for many of other languages with high free-word order and rich morphology, most applying algorithms lead to drop in accuracy compared to English language. Therefore, data-driven systems require careful selection of features and tuning of parameters to reach optimal performance. A dependency corpus for Persian language introduced recently. Persian language has high free-word order and rich morphology. In this paper we try to find detect effective factors for decreasing parsing accuracy and we present solutions to improve the accuracy.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله مجتبی خلاش | mojtaba khallash


بهروز مینایی بیدگلی | behrouz minaei bidgoli



نشانی اینترنتی http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-331-1&slc_lang=fa&sid=fa
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-233371.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده مقالات پردازش متن
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات