سامانه اطلاعات پژوهشی ایران

این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند

دوشنبه 24 شهریور 1404


پژوهشنامه پردازش و مدیریت اطلاعات، جلد ۳۸، شماره ۲، صفحات ۲۷۳-۳۰۳


عنوان فارسی	معرفی و آزمون پیکره علیت PerCause برای شناسایی روابط علّی فارسی

چکیده فارسی مقاله	شناسایی روابط علّی و همچنین تعیین مرز عناصر علّی در متن، از جمله مسائل چالش برانگیز در پردازش زبان طبیعی (NLP) به ویژه در زبان‌‌های کم‌منبع مانند فارسی است. در این پژوهش، در راستای آموزش سیستمی برای شناسایی روابط علّی و مرز عناصر آن، یک پیکره علّیت برچسب خورده انسانی برای زبان فارسی معرفی می‌شود. این مجموعه شامل 4446 جمله (مستخرج از پیکره بیجن خان و متن یکسری کتاب) و 5128 رابطه علّی است و در صورت وجود، سه برچسب علت، معلول و نشانه علّی برای هر رابطه مشخص شده است. ما از این پیکره برای آموزش سیستمی برای تشخیص مرزهای عناصر علّی استفاده کردیم. همچنین، یک بستر آزمون شناسایی علّیت را با سه روش یادگیری ماشین و دو سیستم یادگیری عمیق مبتنی بر این پیکره ارائه می‌کنیم. ارزیابی‌های عملکرد نشان می‌دهد که بهترین نتیجه کلی از طریق طبقه‌بندی کننده CRF به دست می‌آید که معیار F برابر 76% را ارائه می‌کند. علاوه بر این، بهترین صحت (91.4٪) در روش یادگیری عمیق BiLSTM-CRF به دست آمده است. به نظر می‌رسد وجود CRF به دلیل مدلسازی بافتار منجر به بهبود دقت سیستم می‌شود.

کلیدواژه‌های فارسی مقاله	PerCause، شناسایی عبارات عّلی، CRF، یادگیری عمیق

عنوان انگلیسی	Persian Causality Corpus (PerCause) and the Causality Detection Benchmark

چکیده انگلیسی مقاله	Recognizing causal elements and causal relations in the text is among the challenging issues in natural language processing (NLP), specifically in low-resource languages such as Persian. In this research, we prepare a causality human-annotated corpus for the Persian language. This corpus consists of 4446 sentences and 5128 causal relations. Three labels of Cause, Effect, and Causal mark are specified to each relation, if possible. We used this corpus to train a system for detecting causal elements' boundaries. Also, we present a causality detection benchmark for three machine-learning methods and two deep learning systems based on this corpus. Performance evaluations indicate that our best total result is obtained through the CRF classifier, which provides an F-measure of 0.76. In addition, the best accuracy (91.4%) is obtained through the BiLSTM-CRF deep learning method

کلیدواژه‌های انگلیسی مقاله	PerCause, Causality annotated corpus, causality detection, deep learning, CRF

نویسندگان مقاله	زینب رحیمی \| Zeinab Rahimi NLP Research Laboratory, Shahid Beheshti University, Tehran, Iran آزمایشگاه پردازش زبان طبیعی، دانشگاه شهید بهشتی، تهران، ایران مهرنوش شمس فرد \| Mehrnoush ShamsFard NLP Research Laboratory, Shahid Beheshti University, Tehran, Iran آزمایشگاه پردازش زبان طبیعی، دانشگاه شهید بهشتی، تهران، ایران

نشانی اینترنتی	http://jipm.irandoc.ac.ir/browse.php?a_code=A-10-10856-2&slc_lang=fa&sid=1
فایل مقاله	فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده	fa
موضوعات مقاله منتشر شده	ابزارهای زبانی و زبان‌شناختی
نوع مقاله منتشر شده	پژوهشی

برگشت به: صفحه اول پایگاه \| نسخه مرتبط \| نشریه مرتبط \| فهرست نشریات

ارسال پیام برخط

در صورت مشاهده هر نوع اشکال در داده های پایگاه و یا برای ارسال نظرات و پیشنهاد های خود می توانید با پر کردن فرم تماس ما را در جریان قرار دهید.
برای پر کردن فرم تماس اینجا را کلیک کنید.

آمار پایگاه

نمایه شده در ISI 135

نمایه شده در PubMed 109

نمایه شده در Scopus 191

کاربران برخط 866

بازدید امروز 18636

بازدید کل 35044047

اطلاعات تماس

آدرس : تهران، سعادت آباد، بلوار پاکنژاد شمالی، بالاتر از میدان سرو، نبش کوچه ندا، پلاک ۶۸، ساختمان جاوید، واحد ۱۶

پست الکترونیک: yektaweb-AT-gmail.com

توجه

کلیه حقوق این وب سایت و مطالب آن متعلق به شرکت یکتاوب بوده و استفاده از مطالب آن با ذکر منبع بلامانع است
طراحی و برنامه نویسی: یکتاوب افزار شرق