|
مدیریت فناوری اطلاعات، جلد ۱۰، شماره ۲، صفحات ۳۰۹-۳۳۰
|
|
|
عنوان فارسی |
کاربرد الگوریتمهای یادگیری ماشین در متنکاوی با رویکرد آنالیز احساس |
|
چکیده فارسی مقاله |
تخصیص نظرها و متنهای منتشر شدۀ کاربران در فضای مجازی به طبقاتی با احساسات مثبت یا منفی، در تحقیقهای مربوط به متنکاوی اهمیت بسیار زیادی دارد. هدف این مقاله، استفاده و مقایسۀ روشهای یادگیری ماشین در طبقهبندی متنهای فارسی بر اساس احساسات کاربران فعال در فضای مجازی است. دادههای پژوهش، مجموعه نظرهای منتشرشده دربارۀ فیلمهای ایرانی و خارجی در بازۀ زمانی 1392 تا 1395 در سایتهای سینمایی و نقد فیلم فارسی زبان است. پیش از بهکارگیری الگوریتمها، فرایند پیشپردازش دادهها بر اساس تبدیل آنها به نویسه، حذف ایستواژهها و تحلیل چندواژهای انجام گرفت. برای طبقهبندی دادهها، الگوریتمهای با نظارت نایوبیز، ماشین بردار پشتیبان و شبکۀ عصبی استفاده شد. براساس نتایج بهدستآمده، در آزمون خارج از نمونه با وجود دقت عددی بیشتر الگوریتم نایوبیز بر شبکۀ عصبی و ماشین بردار پشتیبان بر نایوبیز، برتری آماری نایوبیز بر شبکههای عصبی و ماشین بردار پشتیبان بر نایوبیز اثبات نشد. با وجود این، نتایج تحقیق گویای برتری معنادار الگوریتم ماشین بردار پشتیبان بر شبکههای عصبی در دقت طبقهبندی در سطح اطمینان 5 درصد است. |
|
کلیدواژههای فارسی مقاله |
|
|
عنوان انگلیسی |
The Application of Machine Learning Algorithms for Text Mining based on Sentiment Analysis Approach |
|
چکیده انگلیسی مقاله |
Classification of the cyber texts and comments into two categories of positive and negative sentiment among social media users is of high importance in the research are related to text mining. In this research, we applied supervised classification methods to classify Persian texts based on sentiment in cyber space. The result of this research is in a form of a system that can decide whether a comment which is published in cyber space such as social networks is considered positive or negative. The comments that are published in Persian movie and movie review websites from 1392 to 1395 are considered as the data set for this research. A part of these data are considered as training and others are considered as testing data. Prior to implementing the algorithms, pre-processing activities such as tokenizing, removing stop words, and n-germs process were applied on the texts. Naïve Bayes, Neural Networks and support vector machine were used for text classification in this study. Out of sample tests showed that there is no evidence indicating that the accuracy of SVM approach is statistically higher than Naïve Bayes or that the accuracy of Naïve Bayes is not statistically higher than NN approach. However, the researchers can conclude that the accuracy of the classification using SVM approach is statistically higher than the accuracy of NN approach in 5% confidence level. |
|
کلیدواژههای انگلیسی مقاله |
|
|
نویسندگان مقاله |
رضا سمیع زاده | استادیار دانشگاه گروه مهندسی صنایع، دانشکدۀ فنی و مهندسی، دانشگاه الزهرا، تهران، ایران
الناز محمودی سعید آباد | دانشجوی کارشناسی ارشد مهندسی صنایع، دانشکدۀ فنی مهندسی، دانشگاه الزهرا، تهران، ایران
|
|
نشانی اینترنتی |
https://jitm.ut.ac.ir/article_65661_c8b4e78bb9acd81d32aaae090dd3eee4.pdf |
فایل مقاله |
اشکال در دسترسی به فایل - ./files/site1/rds_journals/1085/article-1085-1767720.pdf |
کد مقاله (doi) |
|
زبان مقاله منتشر شده |
fa |
موضوعات مقاله منتشر شده |
|
نوع مقاله منتشر شده |
|
|
|
برگشت به:
صفحه اول پایگاه |
نسخه مرتبط |
نشریه مرتبط |
فهرست نشریات
|