این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
شنبه 22 شهریور 1404
پژوهشنامه پردازش و مدیریت اطلاعات
، جلد ۳۶، شماره ۲، صفحات ۵۶۳-۵۹۲
عنوان فارسی
استخراج کلمات و عبارات کلیدی از متون فارسی(مروری بر پژوهشهای صورت گرفته )
چکیده فارسی مقاله
استخراج کلمات/ عبارات کلیدی متن، پیشنیاز بسیاری دیگر از وظایف حوزه پردازش زبان طبیعی است. اما بررسی متون فارسی و انگلیسی این حوزه نشان میدهد که تلاشهای انگشتشماری برای استخراج کلمات/ عبارات کلیدی از متون فارسی صورتگرفته است. ازاینرو، این مقاله با هدف تعیین موقعیت کنونی پردازش زبان طبیعی فارسی، و بهطور خاص، استخراج کلمات/ عبارات کلیدی از متون فارسی به مرور خلاصهای از مقالات فارسی و انگلیسی منتشرشده در این حوزه که از متون فارسی برای آزمودن ایدهها استفاده کردهاند، میپردازد. سپس، هر مقاله را از نظر روششناسی، نحوه اجرا و پیادهسازی، روش ارزیابی، و معیارهای آن مورد تعمق قرار داده و به چالش میکشد. در مجموع، 14 مقاله فارسی و 6 مقاله انگلیسی به استخراج کلمات و عبارات کلیدی از متون فارسی پرداختهاند. روش بیشتر این مقالات استفاده از اطلاعات آماری و زبانشناختی بوده است. اکثر این مقالات یا در روششناسی انتخابشده ایراد دارند و یا نویسندگان نتوانستهاند ایده پیشنهادی خود را بهوضوح برای خواننده تبیین نمایند. در بسیاری از مقالات از مجموعه داده استانداردی برای ارزیابی سیستم استفاده نشده و نحوه محاسبه معیارهای ارزیابی مبهم یا دارای اشکال است. در مجموع، بهجز 3 مقاله که روش اجراشده را بهنحو نسبتاً قابلقبولی گزارش کردهاند، سایر مقالات قابلیت تکرارپذیری و تعمیم ندارند. این است که نمیتوان از آنها بهعنوان معیار پایهای برای ارزیابی سیستمهای آینده استفاده کرد یا از ایده مطرحشده در آنها با اطمینان در ساخت و توسعه نرمافزارهای کاربردی و عملی در حوزه استخراج کلمات کلیدی استفاده نمود.
کلیدواژههای فارسی مقاله
استخراج کلمات کلیدی، استخراج عبارات کلیدی، پردازش زبان طبیعی، زبان فارسی، بررسی مروری
عنوان انگلیسی
Keyword and Phrase Extraction from Persian Texts: A Review of the literature
چکیده انگلیسی مقاله
Keyword and phrase extraction is a prerequisite of many natural language processing tasks. However, a review on the related Persian and English literature showed that a few studies have already been done on how to extract keywords and phrases from Persian texts. Thus, aiming to shed light on the research status of Keyword and phrase extraction from Persian texts, the present study reviews the Persian and English publications which have assessed their research ideas over Persian texts. We also focus on each of the studies to challenge their methodologies, implementations and evaluation methods and measures. To our knowledge, a total number of 14 Persian and 6 English papers exist which have worked on the extraction of Persian keywords and phrases. Investigating on the papers revealed that they were mostly based on statistical and linguistic information. A majority of the papers suffered from the lack of either appropriate methodologies or lucid explanation of their research ideas. They generally used non-standard datasets and vague or problematic metrics to evaluate the experimental systems. Generally speaking, except 3 papers that appropriately reported their proposed methods, the other papers lacked reproducibility and generalizability. Hence, their results cannot be confidently used as a benchmark in evaluating future works, and their proposed ideas cannot be employed in developing applications for extraction of key words and phrases from Persian texts.
کلیدواژههای انگلیسی مقاله
extraction, key words, key phrases, natural language processing, Persian language, review
نویسندگان مقاله
عاطفه کلانتری | Atefeh kalantari
School of Education & Psychology, Shiraz University, Shiraz, Iran and Academic Librarian, Nursing & Midwifery Faculty, Qazvin University of Medical Sciences, Qazvin, Iran
دانشگاه شیراز؛ شیراز، ایران؛ مسئول کتابخانه دانشکده پرستاری و مامایی؛ دانشگاه علوم پزشکی قزوین؛ قزوین، ایران؛
عبدالرسول جوکار | Abdolrasool Jowkar
School of Education & Psychology, Shiraz University, Shiraz, Iran
بخش علم اطلاعات و دانششناسی؛ دانشکده روانشناسی و علوم تربیتی؛ دانشگاه شیراز؛ شیراز، ایران؛
سید مصطفی فخراحمد | Seyed Mostafa Fakhrahmad
Department of Computer Science and Engineering & IT; Shiraz University; Shiraz, Iran
؛ بخش مهندسی و علوم کامپیوتر و فناوری اطلاعات؛ دانشگاه شیراز؛ شیراز، ایران
جواد عباس پور | Javad Abbaspour
School of Education & Psychology; Shiraz University; Shiraz, Iran;
بخش علم اطلاعات و دانششناسی؛ دانشکده روانشناسی و علوم تربیتی؛ دانشگاه شیراز؛ شیراز، ایران؛
هاجر ستوده | Hajar Sotudeh
School of Education & Psychology; Shiraz University; Shiraz, Iran;
بخش علم اطلاعات و دانششناسی؛ دانشکده روانشناسی و علوم تربیتی؛ دانشگاه شیراز؛ شیراز، ایران؛
مسعود مرتضوی نصرآباد | Massoud Mortazavi
School of Education & Psychology; Ferdowsi University of Mashhad; Mashhad, Iran; Research & Development Specialist; Pars Azarakhsh Co.; Tehran, Iran;
دانشگاه فردوسی مشهد؛ مشهد، ایران؛ کارشناس بخش تست و توسعه؛ شرکت پارسآذرخش؛ تهران، ایران
امیر جوادی | Amir Javadi
Social Medicine Department; Qazvin University of Medical Sciences; Qazvin, Iran;
گروه پزشکی اجتماعی؛ دانشکده پزشکی؛ دانشگاه علوم پزشکی قزوین؛ قزوین، ایران
زهرا پوربهمن | Zahra Pourbahman
AmirKabir University of Technology; Tehran, Iran
دانشکده مهندسی کامپیوتر؛ دانشگاه صنعتی امیرکبیر؛ تهران، ایران؛
نشانی اینترنتی
http://jipm.irandoc.ac.ir/browse.php?a_code=A-10-6303-1&slc_lang=fa&sid=1
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
مروری
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات