این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
دوشنبه 14 مهر 1404
پردازش علائم و داده ها
، جلد ۱۴، شماره ۴، صفحات ۷۹-۹۶
عنوان فارسی
تبدیل خودکار درختبانک وابستگی فارسی به درختبانک سازهای
چکیده فارسی مقاله
درختبانکها بهطورمعمول به دو شکل مبتنی بر ساختار وابستگی و مبتنی بر ساختار سازهای ایجاد میشوند. هر دوی این ساختارها در حوزه زبانشناسی و پردازش زبان طبیعی کاربرد دارند. هماکنون چندین درختبانک وابستگی برای زبان فارسی وجود دارد، اما درختبانک سازهای با حجم بزرگ برای این زبان وجود ندارد. در این مقاله قصد داریم روشی را برای تبدیل یک درختبانک وابستگی به معادل سازهای آن، بر اساس یک الگوریتم موجود ارائه دهیم. الگوریتم مبنا با استفاده از مجموعهای از قواعد تبدیل، زیردرختهای سازهای متناظر با یالهای وابستگی را یافته و با ترکیب آنها ساختار سازهای نهایی را تولید میکند. ما این الگوریتم را بر روی ساختارهای وابستگی زبان فارسی اعمال و ضمن ارائه نتایج، اصلاحاتی را در جهت بهبود کارایی آن ارائه میکنیم. نشان داده میشود که پیمایش یالهای وابستگی در یک جهت خاص بر روی کیفیت الگوریتم تأثیرگذار است. همینطور ما اصلاحاتی را در الگورتیم مربوط به تطبیق قواعد و الگوریتم اتصال زیردرختها ارائه میکنیم. این اصلاحات کارایی الگوریتم را به شکل قابل ملاحظهای افزایش میدهند. نتایج عملی بهبودی را به اندازه 48/16% نسبت به الگوریتم مبنا نشان میدهد.
کلیدواژههای فارسی مقاله
عنوان انگلیسی
Converting Dependency Treebank to Constituency Treebank for Persian
چکیده انگلیسی مقاله
There are two major types of treebanks: dependency-based and constituency-based. Both of them have applications in natural language processing and computational linguistics. Several dependency treebanks have been developed for Persian. However, there is no available big size constituency treebank for this language. In this paper, we aim to propose an algorithm for automatic conversion of a dependency treebank to a constituency treebank for Persian. Our method is based on an existing method. However, we make modification to enhance its accuracy. The base algorithm constructs a constituency structure according to a set of conversion rules. Each rule maps a dependency relation to a constituency subtree. The constituency structure is built by combining these subtrees. We investigate the effects of the order in which dependency relations are processed on the output constituency structure. We show that the best order depends on the charactersitics of the target language. We also make modification in the algorithm for matching the conversion rules. To match a dependency relation to a conversion rule, we start with detailed infromation and if no match was found, we decrease the details and also change the method for matching. We also make modification in the algorithm used for combining the constituency subtrees. We use statistical data derived from a treebank to find a proper position for attaching a constituency subtree to the projection chain of the head. The expremental results show that these modifications provide an improvement of 16.48% in the accuracy of the conversion algorithm.
کلیدواژههای انگلیسی مقاله
نویسندگان مقاله
احمد پورامینی | Ahmad Pouramini
Sirjan University of Technology
داشنگاه صنعتی سیرجان
مسعود قیومی |
پژوهشگاه علوم انسانی و مطالعات فرهنگی
امینه ناصری |
داشنگاه صنعتی سیرجان
نشانی اینترنتی
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-614-3&slc_lang=fa&sid=fa
فایل مقاله
اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-577508.pdf
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
مقالات پردازش متن
نوع مقاله منتشر شده
پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات