سامانه اطلاعات پژوهشی ایران

این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند

جمعه 7 آذر 1404


پردازش علائم و داده ها، جلد ۱۵، شماره ۲، صفحات ۸۹-۱۰۲


عنوان فارسی	یک چارچوب نیمه‌نظارتی مبتنی بر لغت‌نامه وفقی خودساخت جهت تشخیص احساس نظرات فارسی

چکیده فارسی مقاله	با معرفی وب 2.0 و 3.0 تعاملات کاربران در فضای مجازی، منجر به ایجاد انبوهی از نظرات ارزشمند شده است. با توجه به‌دشواری یا عدم امکان تحلیل و بررسی دستی این نظرات، تحلیل احساس متن و یا نظرکاوی به‌عنوان یکی از زیرمجموعه‌های پردازش زبان طبیعی مطرح شد. تلاش‌های محدودی در نظرکاوی فارسی نسبت به سایر زبانها صورت گرفته است. در این مقاله برای اولین بار یک چارچوب نیمهنظارتی برای نظرکاوی فارسی ارائه گردیده است. ضمناً، ازآنجاکه یکی از آخرین پیشرفت‌های علمی در نظرکاوی زبان فارسی الگوریتمی بر اساس استخراج الگوهای حسی وفقی (حساس به مجموعهداده) مبتنی بر خبره انسانی می‌باشد، در این پژوهش ضمن ارتقای الگوریتم مذکور، تعیین برچسبهای حاوی احساس به کمک یک لغت‌نامه‌ی خودساخت (بدون نیاز به خبره انسانی) وفقی انجام می‌گیرد. همچنین کاربرد دستهبند مدل مخفی مارکوف خودناظر بر روی خصیصههای فوق‌الذکر در کنار قوانین مبتنی بر معیارشباهت برای فرآیند نظرکاوی بررسی‌شده است. در راستای خودآموزسازی هوشمند، تکنیکی برای ارزیابی قابلیت اطمینان بالای خروجی، ارائه‌شده است که خودآموزی به‌شرط وجود آن انجام می‌پذیرد. روش پیشنهادی با اجرا بر روی دادگان مبنا نرخ صحت 90 درصد (باوجود عدم نیاز به خبره انسانی) را که در مقایسه با روشهای نظارتی و نیمه‌نظارتی مستقل از خبره‌ی موجود برتری قابل‌ملاحظه‌ای دارد، خروجی می‌دهد. همچنین این الگوریتم نیمه‌نظارتی هنگام استفاده از مجموعه آموزش کوچک با نسبت مجموعه دادگان آموزش/آزمون 10 به 90 نیز بررسی و با نرخ صحت 80% قابلیت اطمینان آن به اثبات رسید.

کلیدواژه‌های فارسی مقاله

عنوان انگلیسی	A Semi-supervised Framework Based on Self-constructed Adaptive Lexicon for Persian Sentiment Analysis

چکیده انگلیسی مقاله	With appearance of Web 2.0 and 3.0, users' contribution in WWW has created a huge amount of valuable expressed opinions. Considering the difficulty or impossibility of manually analyzing such big data, sentiment analysis, as a branch of Natural Language Processing, has been highly considered. Despite the other (popular) languages, a limited number of researches have been conducted in Persian Sentiment Analysis (PSA). In this study, for the first time, a semi-supervised framework is proposed for PSA. Moreovers, considering that one of the most recent studies in PSA is an algorithm based on extracting adaptive (dataset-sensitive) expert-based emotional patterns, in this research, extraction of the same state-of-the-art emotional patterns is proposed to be performed automatically. Moreover, application of the HMM classifier, by utilizing the mentioned features, as its states, is analyzed and additionally, HMM-based sentiment analysis is upgraded by being combined with a rule-based classifier, for the opinion assignment process. In addition, toward intelligent self-training, a criterion for evaluating high reliability of output is presented by which (assuming satisfaction of the criterion) self-training is performed in "lexicon-extraction" and "classifier," as learning systems. The proposed method, by being applied on the basis dataset, provides 90% of accuracy (despite expert-independence in lexicon generation), which in comparison with the supervised and semi-supervised methods in state of the art has a considerable superiority. Moreover, this semi-supervised method, while utilizing a small training dataset with 10/90 ratio of train/test datsets, is evaluated and the 80% accuracy demonstrats its reliability.

کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله	محسن نجف زاده \| Mohsen Najafzadeh سعید راحتی قوچانی \| Saeed Rahati Quchan رضا قائمی \| Reza Ghaemi

نشانی اینترنتی	http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-1260-1&slc_lang=fa&sid=1
فایل مقاله	اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-877399.pdf
کد مقاله (doi)
زبان مقاله منتشر شده	fa
موضوعات مقاله منتشر شده	مقالات پردازش متن
نوع مقاله منتشر شده	کاربردی

برگشت به: صفحه اول پایگاه \| نسخه مرتبط \| نشریه مرتبط \| فهرست نشریات

ارسال پیام برخط

در صورت مشاهده هر نوع اشکال در داده های پایگاه و یا برای ارسال نظرات و پیشنهاد های خود می توانید با پر کردن فرم تماس ما را در جریان قرار دهید.
برای پر کردن فرم تماس اینجا را کلیک کنید.

آمار پایگاه

نمایه شده در ISI 135

نمایه شده در PubMed 109

نمایه شده در Scopus 192

کاربران برخط 876

بازدید امروز 15196

بازدید کل 38554891

اطلاعات تماس

آدرس : تهران، سعادت آباد، بلوار پاکنژاد شمالی، بالاتر از میدان سرو، نبش کوچه ندا، پلاک ۶۸، ساختمان جاوید، واحد ۱۶

پست الکترونیک: yektaweb-AT-gmail.com

توجه

کلیه حقوق این وب سایت و مطالب آن متعلق به شرکت یکتاوب بوده و استفاده از مطالب آن با ذکر منبع بلامانع است
طراحی و برنامه نویسی: یکتاوب افزار شرق