این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پردازش علائم و داده ها، جلد ۱۴، شماره ۴، صفحات ۱۱۷-۱۲۸

عنوان فارسی بهبود صحت ابهام‌زدایی نام نویسنده با استفاده از خوشه‌بندی تجمّعی
چکیده فارسی مقاله امروزه کتابخانه‌های دیجیتال از مهم­ترین و سریع­ترین منابع پژوهشی در جهان محسوب می­شوند. از نقطه‌نظر مدیریت تجمیع دانش، توانایی جستجوی صحیح، دقیق و سریع مطالب علمی مد نظر کاربر، اهمیت زیادی دارد. پیچیدگی و وجود تشابه در بانک­های اطلاعاتی موجب می­گردد این منابع در هنگام بهره­برداری با چالش­ها و ابهامات زیادی مواجه شوند و همین چالش­ها دست‌مایه پژوهش‌های گسترده‌ای را در این حوزه شکل داده است. یکی از مهم­ترین این چالش­ها، وجود ابهام در نام نویسنده است. در این خصوص روش‌های بسیاری با بهره‌گیری از روش‌های خوشه­بندی نسبت به حل نام­های مبهم مبادرت ورزیده­اند. این روش‌ها تا حدودی توانسته‌اند مشکل را برطرف کنند، اما همچنان مسئله تکه‌تکه‌بودن خوشه‌ها و خطا در نتایج تولیدی، از معایب روش‌های موجود است. از سویی تجربه نشان داده که یک روش به‌تنهایی نتایجی با صحت بالا نمی‌تواند تولید کند. بدین منظور در این مقاله مدلی جهت حل مشکل ذکر‌شده ارائه شده است‌. راهکار پیشنهادی در دو گام، عملیات ابهام‌زدایی را انجام می­دهد. در گام نخست خوشه­های اولیه با استفاده از "الگوریتم خوشه‌بندی سلسله‌مراتبی تجمعی با پارامترها و توابع اندازه‌گیری مشابهت مختلف"، تولید می‌شوند. در گام دوم با بهره­گیری از "الگوریتم خوشه‌بندی تجمعی"، خوشه­های تولید‌شده به‌گونه­ای ترکیب می­شوند تا خوشه‌هایی غنی با درصد کمتری از تکه‌تکه‌بودن و صحت بالاتر تولید شوند. در ارزیابی‌ الگوریتم پیشنهادی از "مجموعه دادگان DBLP، تحت معیار K" استفاده شده است. نتایج،  بهبود قابل توجهی را در ترکیب خوشه‌های مذکور نشان می­دهند.  
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Improving the accuracy of the author name disambiguation by using clustering ensemble
چکیده انگلیسی مقاله Today, digital libraries are important academic resources including millions of citations and bibliographic essential information such as titles, author's names and location of publications. From the view of knowledge accumulation management, the ability to search fast, accurate, desired contents, has a great importance. The complexity and similarity in these resources cause many challenges and ambiguities. One of the most of these challenges is the author name disambiguation which makes an extensive scope of research. Although many effective methods have been developed by using clustering techniques in disambiguation of the author's name, the accuracy of these methods is not acceptable and still there are some problems such as fragmentation and error in the produced results of these methods, since there is no uniform standard of citations, various combinations, and numerous, written, verbal patterns. In fact, experiences have shown that the use of a single method to disambiguate names does not provide results with a high accuracy despite concerns expressed above. In this paper, a new method is proposed to disambiguate author names in different formats and combinations with more accuracy. The proposed solution carries out the disambiguation in two steps; In the first step, agglomerative hierarchical clustering algorithm produces clusters using similar functions and different thresholds. In the second step, clusters produced by clustering ensemble technique in the previous stage are combined to provide more accurate clusters with less fragmentation. The proposed method is experimentally evaluated by conducted DBLP datasets with K criterion. The evaluation results show that the proposed method enhances the accuracy of disambiguation of author names in different formats.  
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله سید محمد مرتضوی |
دانشگاه آزاد اسلامی واحد نجف آباد

محمد حسین ندیمی شهرکی |
دانشگاه آزاد اسلامی واحد نجف آباد

مصطفی موسی خانی |
دانشگاه آزاد اسلامی واحد نجف آباد


نشانی اینترنتی http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-995-1&slc_lang=fa&sid=fa
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-577510.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده مقالات پردازش متن
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات