این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
جمعه 28 شهریور 1404
پردازش علائم و داده ها
، جلد ۲۰، شماره ۱، صفحات ۱۸۱-۱۹۷
عنوان فارسی
بهکارگیری نظریه ساختار بلاغی برای بهبود بازنمایی متن با شبکههای عصبی عمیق
چکیده فارسی مقاله
یافتن یک بازنمایی معنایی غنی با ابعاد کم برای متون طولانی یکی از چالشهای اساسی در فعالیتهای مختلف پردازش زبان طبیعی به شمار میرود. این بازنمایی باید اطلاعات معنایی و نحوی متن را در برگرفته و همچنین بر حسب وظیفه مد نظر ارتباط و تشابه متون را در ابعاد کم مدلسازی کند. در این مقاله تلاش بر آن است تا با بهرهگیری از نظریه ساختار بلاغی و شبکههای عصبی عمیق چالشهای مطرح شده مرتفع گردد. نظریه ساختار بلاغی با ارائه یک ساختار سلسله مراتبی به توصیف اهمیت عبارات موجود در متن و روابط بین آنها میپردازد. در اینجا تأثیر بهکارگیری این ساختار درختی بر دو وظیفه بازیابی اطلاعات و تحلیل احساسات بررسی شدهاست. در وظیفه بازیابی اطلاعات، جهت مدلسازی وابستگی معنایی بین مستندات، یادگیری بازنمایی سند توسط شبکههای عصبی بازگشتی عمیق دوقلو صورت پذیرفت. بطوریکه ذخیره و بازیابی مستندات متنی تسهیل گردد. این شبکه از دو زیرشبکه بازگشتی عمیق تشکیل شدهاست. این شبکههای بازگشتی، مبتنی بر ساختار درختی حاصل از تجزیه متن توسط نظریه ساختار بلاغی میباشند. این متدلوژی بر روی دو مجموعه داده خبری شامل اخبار بیبیسی و همچنین زیرمجموعهای از دادگان رویترز مورد ارزیابی قرار گرفت. نتایج نشان میدهد بازنمایی ارائه شده توسط این ساختار، کارآیی بالاتری از بازنماییهای سنتی مبتنی بر سبد کلمه دارد. این رویکرد کارایی را به میزان 6٪ بر روی مجموعه داده بیبیسی و 3٪ بر روی مجموعه داده رویترز نسبت به بهترین روش کلاسیک بهبود دادهاست. در وظیفه تحلیل احساسات، در ابتدا به کمک شبکه عصبی بازگشتی عمیق مبتنی بر درخت ساختار بلاغی به ایجاد بازنمایی و در نهایت دستهبندی احساسات نظرات افراد پرداخته شد. سپس سایر اطلاعات موجود در درخت جهت بهبود مدل مورد استفاده قرار گرفت. این اطلاعات شامل آگاهی از اهمیت هر بخش از متن با استفاده از درخت ساختار بلاغی میباشد. با تشخیص بخشهای مرکزی متن و اعمال مکانیزم توجه بر آن در شبکه عمیق بازگشتی بازنمایی غنیتری برای متن ایجاد میگردد. این بازنمایی کارایی مدل تحلیل احساسات را بر روی دادگان اینترنتی نظرات بینندگان فیلم در مقایسه با روشهای پایه به میزان 3٪ افزایش داده است. نتایج حاصل از این بررسی، بهبود بازنمایی متن با استفاده از شبکههای عمیق مبتنی بر نظریه ساختار بلاغی را نشان میدهد. بهبود بازنمایی به کمک ساختاردهی متن غیر ساختار یافته بر روی زبانهای دیگر از جمله زبان فارسی میتواند مورد راستی آزمایی قرار بگیرد.
کلیدواژههای فارسی مقاله
بازنمایی متن، نظریه ساختار بلاغی، شبکه های عصبی عمیق، شبکه های دوقلو، مکانیزم توجه
عنوان انگلیسی
Using RST-based deep neural networks to improve text representation
چکیده انگلیسی مقاله
Finding a highly informative, low-dimensional representation for texts, specifically long texts, is one of the main challenges for natural language processing (NLP) tasks. For texts longer than sentences or a paragraph, finding a good representation beyond the bag-of-words model without losing word order is still a challenge. This representation should capture the semantic and syntactic information of the text while retaining relevance for large-scale similarity search and accurate text classification. We propose the utilization of Rhetorical Structure Theory (RST) to consider the text structure in the representation. RST creates a tree-structure format for the text document and model the importance and relationship between sentences or phrases. In this paper, we examine the effect of using this structure on two different NLP tasks. In information retrieval, to embed document relevance in distributed representation, we use a Siamese neural network to jointly learn document representations. Our Siamese network consists of two sub-networks of recursive neural networks (RNN) built over the RST tree. For this task, we use a subset of Reuters's news corpus and BBC news dataset. The results show that our approach outperforms conventional text representations like tf_idf, LDA, LSA and word vector averaging. The proposed representation beats the best conventional method by %6 and %3 in precision at k retrieved documents on BBC and Reuters datasets, respectively. In the sentiment analysis task, first, we use an rst-based recursive neural network to represent movie reviews and classify the polarity of people's opinions. Then we propose to use the nucleus-satellite information of a node in the rst-tree to build an attention mechanism by deep RNN to generate better discourse representations. We test the effectiveness of our approach on sentiment analysis task, and we prove that considering the importance of the text span improves sentiment analysis performance by %3 on the internet movie review database. In this paper, we improve the text representation by the rst-based deep neural network. We can evaluate this approach on the other languages to show the effectiveness of using the structure format of the text.
کلیدواژههای انگلیسی مقاله
Document embedding, Semantic representation, Rhetorical Structure Theory, Deep Neural network, Attention Mechanism
نویسندگان مقاله
عرفانه غروی | Erfaneh Gharavi
University of Tehran
دانشگاه تهران
هادی ویسی | Hadi Veisi
University of Tehran
دانشگاه تهران
نشانی اینترنتی
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-117-3&slc_lang=fa&sid=1
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
مقالات پردازش متن
نوع مقاله منتشر شده
پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات