پژوهشنامه پردازش و مدیریت اطلاعات، جلد ۳۶، شماره ۴، صفحات ۱۱۵۹-۱۱۷۹

عنوان فارسی استخراج هوشمند مرز فراداده و متن در پایان‌نامه‌های فارسی با رویکرد BA_SVM
چکیده فارسی مقاله ‌استخراج فراداده باعث تسهیل در فرایند نمایه‌سازی و بهبود در بازیابی اطلاعات است. از سوی دیگر، خودکارسازی این فرایند سبب افزایش کارایی نسبت به استخراج دستی فراداده‌هاست. نام دانشجو، نام اساتید، عنوان، رشته و مقطع تحصیلی، چکیده، و کلمات کلیدی نمونه‌ای از فراداده‌های پایان‌نامه است. هدف در این مقاله شناسایی خودکار مرز فراداده و بدنه اصلی در پایان‌نامه‌های فارسی است. بدین منظور، 250 پایان‌نامه ثبت‌شده در سامانه «ایرانداک» جمع‌آوری شده است. ویژگی‌های مد نظر از هر پاراگراف استخراج شده و سپس، پاراگراف‌های پایان‌نامه با روش ماشین بردار پشتیبان به دو کلاس فراداده و بدنه طبقه‌بندی شد. در این پژوهش برای تنظیم پارامترهای الگوریتم ماشین بردار پشتیبان، الگوریتم فرامکاشفه‌ای خفاش به‌کار گرفته شده است. نتایج نشان می‌دهد که روش پیشنهادی با دقت 96/6 درصد نوع پاراگراف را تشخیص می‌دهد.
کلیدواژه‌های فارسی مقاله استخراج فراداده، استخراج اطلاعات، ماشین بردار پشتیبان، الگوریتم فرامکاشفه‌ای، الگوریتم خفاش

عنوان انگلیسی Automatic Detection of the Boundary between Metadata and Body in Persian Theses using BA_SVM
چکیده انگلیسی مقاله Metadata extraction facilitates the process of indexing and improves information retrieval. Also automation of this process increases efficiency more than manual extraction. The example of the thesis metadata are names of students, professors, title, field, degree, abstract, keywords, etc. In this paper the aim is automatic boundary detection of metadata from the main body in Persian theses. Therefore, 250 theses collected from IRANDOC system. Features were extracted from paragraphs of each thesis then paragraphs were classified using support vector machine into 2 classes: metadata and body. In this study, Bat algorithm is used to set the parameter of SVM. The result reveals that the proposed method predicts type of paragraphs with 96.6 percent accuracy.
کلیدواژه‌های انگلیسی مقاله Metadata Extraction, Information Extraction, Support Vector Machine (SVM), Metaheuristic Algorithm, Bat Algorithm (BA)

نویسندگان مقاله محدثه رهنما | Mohadese Rahnama
Alzahra University; Tehran, Iran
دانشگاه الزهرا (س)؛ تهران، ایران؛

سیدمحمدحسین هاشمی‌نژاد | Seyed Mohammad Hossein Hasheminejad
Alzahra University; Tehran, Iran
دانشگاه الزهرا (س)؛ تهران، ایران؛

جلال‌الدین نصیری | Jalal A Nasiri
Iranian Research Institute for Information Scienceand Technology (IranDoc); Tehran, Iran
پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)؛ تهران، ایران؛


نشانی اینترنتی http://jipm.irandoc.ac.ir/browse.php?a_code=A-10-7274-1&slc_lang=fa&sid=1
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده ذخیره و بازیابی
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات