این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پردازش علائم و داده ها، جلد ۱۵، شماره ۲، صفحات ۸۹-۱۰۲

عنوان فارسی یک چارچوب نیمه‌نظارتی مبتنی بر لغت‌نامه وفقی خودساخت جهت تشخیص احساس نظرات فارسی
چکیده فارسی مقاله با معرفی وب 2.0 و 3.0 تعاملات کاربران در فضای مجازی، منجر به ایجاد انبوهی از نظرات ارزشمند شده است. با توجه به‌دشواری یا عدم امکان تحلیل و بررسی دستی این نظرات، تحلیل احساس متن و یا نظرکاوی به‌عنوان یکی از زیرمجموعه‌های پردازش زبان طبیعی مطرح شد. تلاش‌های محدودی در نظرکاوی فارسی نسبت به سایر زبان­ها صورت گرفته است. در این مقاله برای اولین بار یک چارچوب نیمه­نظارتی برای نظرکاوی فارسی ارائه گردیده است. ضمناً، ازآنجاکه یکی از آخرین پیشرفت‌های علمی در نظرکاوی زبان فارسی الگوریتمی بر اساس استخراج الگوهای حسی وفقی (حساس به مجموعه­داده) مبتنی بر خبره انسانی می‌باشد، در این پژوهش ضمن ارتقای الگوریتم مذکور، تعیین برچسب­های حاوی احساس به کمک یک لغت‌نامه‌ی خودساخت (بدون نیاز به خبره انسانی) وفقی انجام می‌گیرد. همچنین کاربرد دسته­بند مدل مخفی مارکوف خودناظر بر روی خصیصه­های فوق‌الذکر در کنار قوانین مبتنی بر معیارشباهت برای فرآیند نظرکاوی بررسی‌شده است. در راستای خودآموزسازی هوشمند، تکنیکی برای ارزیابی قابلیت اطمینان بالای خروجی، ارائه‌شده است که خودآموزی به‌شرط وجود آن انجام می‌پذیرد. روش پیشنهادی با اجرا بر روی دادگان مبنا نرخ صحت 90 درصد (باوجود عدم نیاز به خبره انسانی) را که در مقایسه با روش­های نظارتی و نیمه‌نظارتی مستقل از خبره‌ی موجود برتری قابل‌ملاحظه‌ای دارد، خروجی می‌دهد. همچنین این الگوریتم نیمه‌نظارتی هنگام استفاده از مجموعه آموزش کوچک با نسبت مجموعه دادگان آموزش/آزمون 10 به 90 نیز بررسی و با نرخ صحت 80% قابلیت اطمینان آن به اثبات رسید.
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی A Semi-supervised Framework Based on Self-constructed Adaptive Lexicon for Persian Sentiment Analysis
چکیده انگلیسی مقاله With appearance of Web 2.0 and 3.0, users' contribution in WWW has created a huge amount of valuable expressed opinions. Considering the difficulty or impossibility of manually analyzing such big data, sentiment analysis, as a branch of Natural Language Processing, has been highly considered. Despite the other (popular) languages, a limited number of researches have been conducted in Persian Sentiment Analysis (PSA). In this study, for the first time, a semi-supervised framework is proposed for PSA. Moreovers, considering that one of the most recent studies in PSA is an algorithm based on extracting adaptive (dataset-sensitive) expert-based emotional patterns, in this research, extraction of the same state-of-the-art emotional patterns is proposed to be performed automatically. Moreover, application of the HMM classifier, by utilizing the mentioned features, as its states, is analyzed and additionally, HMM-based sentiment analysis is upgraded by being combined with a rule-based classifier, for the opinion assignment process. In addition, toward intelligent self-training, a criterion for evaluating high reliability of output is presented by which (assuming satisfaction of the criterion) self-training is performed in "lexicon-extraction" and "classifier," as learning systems. The proposed method, by being applied on the basis dataset, provides 90% of accuracy (despite expert-independence in lexicon generation), which in comparison with the supervised and semi-supervised methods in state of the art has a considerable superiority. Moreover, this semi-supervised method, while utilizing a small training dataset with 10/90 ratio of train/test datsets, is evaluated and the 80% accuracy demonstrats its reliability.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله محسن نجف زاده | Mohsen Najafzadeh


سعید راحتی قوچانی | Saeed Rahati Quchan


رضا قائمی | Reza Ghaemi



نشانی اینترنتی http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-1260-1&slc_lang=fa&sid=1
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-877399.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده مقالات پردازش متن
نوع مقاله منتشر شده کاربردی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات