این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
جمعه 21 شهریور 1404
پژوهشنامه پردازش و مدیریت اطلاعات
، جلد ۳۴، شماره ۳، صفحات ۱۲۱۱-۱۲۳۴
عنوان فارسی
ارائه روش ردهبندی تکردهای برای شناسایی متون پژوهشی حوزه محیط زیست ایران با استفاده از ماشین بردار پشتیبان
چکیده فارسی مقاله
ردهبندی متون پژوهشی بهمنظور شناسایی و تحلیل عرضه و تقاضای پژوهشی در حوزههای مختلف علوم اهمیت ویژهای دارد. در این میان ردهبندی پژوهشهای حوزه محیطزیست بهدلیل اهمیت فراوان آن در کشور و نیز میانرشتهای بودن آن ضروری است. این پژوهش روش ردهبندی تکردهای متون پژوهشی این حوزه را با استفاده از ماشین بردار پشتیبان ارائه میدهد و به ارزیابی پارامترهای مهم تأثیرگذار در کیفیت این ردهبندی میپردازد. نتایج نشان میدهد که استفاده از مجموعه داده هسته توصیفی در یادگیری مدل،کارایی بهتری نسبت به هسته محتوایی دارد. همچنین، استفاده از هسته چندجملهای و وزندهی دودویی واژهها در ماتریس بردار ویژگیها نتایج بهتری نسبت به حالتهای معمول دیگر ارائه میکند. در این مطالعه، روش جدید وزندهی با نام NG-TF معرفی و ارائه شده است که نتایج ارزیابی آن نسبت به روشهای دیگر، بهویژه در معیار دقت، برتری قابلتوجهی دارد. از این رو، میتوان از این روش وزندهی برای تعیین واژگان نماینده یک حوزه پژوهشی استفاده کرد.
کلیدواژههای فارسی مقاله
عنوان انگلیسی
Using One-Class SVM for Scientific Documents Classification Case study: Iranian Environmental Thesis
چکیده انگلیسی مقاله
The classification of research studies is important in order to identify and analyze the research supply and demand in various fields of science. In particular, the classification of environmental research is essential because of its importance in Iran and its interdisciplinary nature. This research proposes One-Class Classification (OCC) method to classify the research studies in this domain using Support Vector Machine (SVM) and consequently evaluates important parameters affecting the quality of this classification. The results show that the use of descriptive metadata has better performance than the content metadata in order to make a core data set to learn the model. Moreover, the use of the polynomial kernel and the binary weighing of words in the features vector matrix leads to better results than other states. In this paper a new weighing method has been proposed which is superior to the other methods especially in precision criterion. We call this weighing method as NG-TF, which can be used in term-document matrix to determine the indicator terms of scientific domains.
کلیدواژههای انگلیسی مقاله
نویسندگان مقاله
محمد ربیعی | Mohammad Rabiei
Iran University of Science and Technology
دانشگاه علم و صنعت ایران
سیدمهدی حسینی مطلق | Seyyed-Mahdi MahdiHosseini-Motlagh
Iran University of Science and Technology
دانشگاه علم و صنعت ایران
بهروز مینایی بیدگلی | Behrouz Minaei Bidgoli
Iran University of Science and Technology
دانشگاه علم و صنعت ایران
نشانی اینترنتی
http://jipm.irandoc.ac.ir/browse.php?a_code=A-10-1174-3&slc_lang=fa&sid=1
فایل مقاله
اشکال در دسترسی به فایل - ./files/site1/rds_journals/1504/article-1504-1638058.pdf
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
فناوری اطلاعات
نوع مقاله منتشر شده
پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات