این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
جمعه 7 آذر 1404
پردازش علائم و داده ها
، جلد ۱۵، شماره ۲، صفحات ۸۹-۱۰۲
عنوان فارسی
یک چارچوب نیمهنظارتی مبتنی بر لغتنامه وفقی خودساخت جهت تشخیص احساس نظرات فارسی
چکیده فارسی مقاله
با معرفی وب 2.0 و 3.0 تعاملات کاربران در فضای مجازی، منجر به ایجاد انبوهی از نظرات ارزشمند شده است. با توجه بهدشواری یا عدم امکان تحلیل و بررسی دستی این نظرات، تحلیل احساس متن و یا نظرکاوی بهعنوان یکی از زیرمجموعههای پردازش زبان طبیعی مطرح شد. تلاشهای محدودی در نظرکاوی فارسی نسبت به سایر زبانها صورت گرفته است. در این مقاله برای اولین بار یک چارچوب نیمهنظارتی برای نظرکاوی فارسی ارائه گردیده است. ضمناً، ازآنجاکه یکی از آخرین پیشرفتهای علمی در نظرکاوی زبان فارسی الگوریتمی بر اساس استخراج الگوهای حسی وفقی (حساس به مجموعهداده) مبتنی بر خبره انسانی میباشد، در این پژوهش ضمن ارتقای الگوریتم مذکور، تعیین برچسبهای حاوی احساس به کمک یک لغتنامهی خودساخت (بدون نیاز به خبره انسانی) وفقی انجام میگیرد. همچنین کاربرد دستهبند مدل مخفی مارکوف خودناظر بر روی خصیصههای فوقالذکر در کنار قوانین مبتنی بر معیارشباهت برای فرآیند نظرکاوی بررسیشده است. در راستای خودآموزسازی هوشمند، تکنیکی برای ارزیابی قابلیت اطمینان بالای خروجی، ارائهشده است که خودآموزی بهشرط وجود آن انجام میپذیرد. روش پیشنهادی با اجرا بر روی دادگان مبنا نرخ صحت 90 درصد (باوجود عدم نیاز به خبره انسانی) را که در مقایسه با روشهای نظارتی و نیمهنظارتی مستقل از خبرهی موجود برتری قابلملاحظهای دارد، خروجی میدهد. همچنین این الگوریتم نیمهنظارتی هنگام استفاده از مجموعه آموزش کوچک با نسبت مجموعه دادگان آموزش/آزمون 10 به 90 نیز بررسی و با نرخ صحت 80% قابلیت اطمینان آن به اثبات رسید.
کلیدواژههای فارسی مقاله
عنوان انگلیسی
A Semi-supervised Framework Based on Self-constructed Adaptive Lexicon for Persian Sentiment Analysis
چکیده انگلیسی مقاله
With appearance of Web 2.0 and 3.0, users' contribution in WWW has created a huge amount of valuable expressed opinions. Considering the difficulty or impossibility of manually analyzing such big data, sentiment analysis, as a branch of Natural Language Processing, has been highly considered. Despite the other (popular) languages, a limited number of researches have been conducted in Persian Sentiment Analysis (PSA). In this study, for the first time, a semi-supervised framework is proposed for PSA. Moreovers, considering that one of the most recent studies in PSA is an algorithm based on extracting adaptive (dataset-sensitive) expert-based emotional patterns, in this research, extraction of the same state-of-the-art emotional patterns is proposed to be performed automatically. Moreover, application of the HMM classifier, by utilizing the mentioned features, as its states, is analyzed and additionally, HMM-based sentiment analysis is upgraded by being combined with a rule-based classifier, for the opinion assignment process. In addition, toward intelligent self-training, a criterion for evaluating high reliability of output is presented by which (assuming satisfaction of the criterion) self-training is performed in "lexicon-extraction" and "classifier," as learning systems. The proposed method, by being applied on the basis dataset, provides 90% of accuracy (despite expert-independence in lexicon generation), which in comparison with the supervised and semi-supervised methods in state of the art has a considerable superiority. Moreover, this semi-supervised method, while utilizing a small training dataset with 10/90 ratio of train/test datsets, is evaluated and the 80% accuracy demonstrats its reliability.
کلیدواژههای انگلیسی مقاله
نویسندگان مقاله
محسن نجف زاده | Mohsen Najafzadeh
سعید راحتی قوچانی | Saeed Rahati Quchan
رضا قائمی | Reza Ghaemi
نشانی اینترنتی
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-1260-1&slc_lang=fa&sid=1
فایل مقاله
اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-877399.pdf
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
مقالات پردازش متن
نوع مقاله منتشر شده
کاربردی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات