این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
سه شنبه 15 مهر 1404
پردازش علائم و داده ها
، جلد ۱۴، شماره ۴، صفحات ۱۱۷-۱۲۸
عنوان فارسی
بهبود صحت ابهامزدایی نام نویسنده با استفاده از خوشهبندی تجمّعی
چکیده فارسی مقاله
امروزه کتابخانههای دیجیتال از مهمترین و سریعترین منابع پژوهشی در جهان محسوب میشوند. از نقطهنظر مدیریت تجمیع دانش، توانایی جستجوی صحیح، دقیق و سریع مطالب علمی مد نظر کاربر، اهمیت زیادی دارد. پیچیدگی و وجود تشابه در بانکهای اطلاعاتی موجب میگردد این منابع در هنگام بهرهبرداری با چالشها و ابهامات زیادی مواجه شوند و همین چالشها دستمایه پژوهشهای گستردهای را در این حوزه شکل داده است. یکی از مهمترین این چالشها، وجود ابهام در نام نویسنده است. در این خصوص روشهای بسیاری با بهرهگیری از روشهای خوشهبندی نسبت به حل نامهای مبهم مبادرت ورزیدهاند. این روشها تا حدودی توانستهاند مشکل را برطرف کنند، اما همچنان مسئله تکهتکهبودن خوشهها و خطا در نتایج تولیدی، از معایب روشهای موجود است. از سویی تجربه نشان داده که یک روش بهتنهایی نتایجی با صحت بالا نمیتواند تولید کند. بدین منظور در این مقاله مدلی جهت حل مشکل ذکرشده ارائه شده است. راهکار پیشنهادی در دو گام، عملیات ابهامزدایی را انجام میدهد. در گام نخست خوشههای اولیه با استفاده از "الگوریتم خوشهبندی سلسلهمراتبی تجمعی با پارامترها و توابع اندازهگیری مشابهت مختلف"، تولید میشوند. در گام دوم با بهرهگیری از "الگوریتم خوشهبندی تجمعی"، خوشههای تولیدشده بهگونهای ترکیب میشوند تا خوشههایی غنی با درصد کمتری از تکهتکهبودن و صحت بالاتر تولید شوند. در ارزیابی الگوریتم پیشنهادی از "مجموعه دادگان DBLP، تحت معیار K" استفاده شده است. نتایج، بهبود قابل توجهی را در ترکیب خوشههای مذکور نشان میدهند.
کلیدواژههای فارسی مقاله
عنوان انگلیسی
Improving the accuracy of the author name disambiguation by using clustering ensemble
چکیده انگلیسی مقاله
Today, digital libraries are important academic resources including millions of citations and bibliographic essential information such as titles, author's names and location of publications. From the view of knowledge accumulation management, the ability to search fast, accurate, desired contents, has a great importance. The complexity and similarity in these resources cause many challenges and ambiguities. One of the most of these challenges is the author name disambiguation which makes an extensive scope of research. Although many effective methods have been developed by using clustering techniques in disambiguation of the author's name, the accuracy of these methods is not acceptable and still there are some problems such as fragmentation and error in the produced results of these methods, since there is no uniform standard of citations, various combinations, and numerous, written, verbal patterns. In fact, experiences have shown that the use of a single method to disambiguate names does not provide results with a high accuracy despite concerns expressed above. In this paper, a new method is proposed to disambiguate author names in different formats and combinations with more accuracy. The proposed solution carries out the disambiguation in two steps; In the first step, agglomerative hierarchical clustering algorithm produces clusters using similar functions and different thresholds. In the second step, clusters produced by clustering ensemble technique in the previous stage are combined to provide more accurate clusters with less fragmentation. The proposed method is experimentally evaluated by conducted DBLP datasets with K criterion. The evaluation results show that the proposed method enhances the accuracy of disambiguation of author names in different formats.
کلیدواژههای انگلیسی مقاله
نویسندگان مقاله
سید محمد مرتضوی |
دانشگاه آزاد اسلامی واحد نجف آباد
محمد حسین ندیمی شهرکی |
دانشگاه آزاد اسلامی واحد نجف آباد
مصطفی موسی خانی |
دانشگاه آزاد اسلامی واحد نجف آباد
نشانی اینترنتی
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-995-1&slc_lang=fa&sid=fa
فایل مقاله
اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-577510.pdf
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
مقالات پردازش متن
نوع مقاله منتشر شده
پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات