این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پردازش علائم و داده ها، جلد ۲۱، شماره ۳، صفحات ۱۱۱-۱۳۶

عنوان فارسی ارائه روش مبتنی بر الگوریتم ژنتیک برای مسئله یافتن پایدارترین خوشه ها در خوشه‌بندی ترکیبی
چکیده فارسی مقاله هر روزه انسان‌ها با حجم وسیعی از اطلاعات روبه‌رو هستند که باید آن‌ها را ذخیره‌سازی یا نمایش دهند. یکی از روش‌های حیاتی کنترل و مدیریت این داده‌ها، گروه‌بندی و دسته بندی آن‌ها در خوشه‌ها ‌می‌باشد. امروزه خوشه‌بندی نقش حیاتی در روش‌های بازیابی اطلاعات برای سازمان‌دهی مجموعه‌های بزرگ درون تعداد کمی ‌خوشه معنادار دارد. یکی از مهم‌ترین انگیزه‌های استفاده از خوشه‌بندی، تعیین و آشکار کردن ساختار ذاتی و پنهان یک مجموعه داده است. کاربران انسانی به‌علت تفاوت در سلیقه و طرز تفکرات مختلف از کشف ساختار ذاتی و درونی مجموعه داده ای بزرگ متون ناتوان هستند. الگوریتم‌های خوشه‌بندی ترکیبی چند الگوریتم خوشه‌بندی را با هم ترکیب می‌کنند تا در نهایت به یک سیستم کلی خوشه‌بندی برسند. روش‌های خوشه‌بندی ترکیبی برای یافتن راه‌های بهتری با استفاده از بیرون کشیدن اطلاعات از چندین افراز اولیه داده‌ها ‌می‌باشد. از آن‌جا‌که الگوریتم‌های خوشه‌بندی مختلف به نقاط مختلف داده نگاه ‌می‌کنند، آن‌ها ‌می‌توانند افراز‌های مختلفی را از این چنین داده‌هایی تولید کنند. با ترکیب افراز‌های به‌دست آمده از الگوریتم‌های مختلف، ایجاد یک افراز با کارایی بالا ممکن است، حتی اگر خوشه‌ها از هم بسیار متراکم باشند. اکثر مطالعات در این حوزه تمامی خوشه‌های اولیه را بررسی میکنند. در این مقاله به روش جدیدی پرداخته می‌شود که به‌جای استفاده از تمامی خوشه‌های اولیه تولید شده، از پایدارترین آن‌ها استفاده می‌کند. برای انتخاب خوشه‌های پایدارتر از تابع توافقی مبتنی بر ماتریس همبستگی استفاده می‌شود. روش انتخاب پایدارترین خوشه‌ها بر اساس معیار پایداری خوشه مبتنی بر معیار فیشر صورت می‌گیرد و سپس خوشه‌های به‌دست آمده توسط الگوریتم ژنتیک مورد ارزیابی قرار می‌گیرد و طیق این الگوریتم پایدارترین خوشه ها انتخاب می‌شود. نتایج تجربی روی چندین مجموعه داده نشان می هد که خروجی روش پیشنهادی خوشه‌های متنوع و با پایداری بالا میباشد.
کلیدواژه‌های فارسی مقاله پایداری خوشه ها، الگوریتم تکاملی، خوشه بندی ترکیبی، معیار فیشر

عنوان انگلیسی Presenting a Method based on Genetic Algorithm for finding the most Stable Clusters in Ensemble Clustering
چکیده انگلیسی مقاله Human being always deals with a large amount of information. To use this information easily, the management and storage of this information are challenging. One approach to their management and storage is their clustering. Clustering is an important task in data mining. It can cluster data into a (usually small) number of meaningful clusters somehow similar data are in an identical cluster and different data are in different clusters. The motivation of using clustering is to uncover and determine the underlying and natural structures of data. Human users are not able to uncover and determine the underlying and natural structures of data in a unified manner. Different users have different opinions for data clustering; this means the clustering is naturally unstable. To tackle the clustering instability, the clustering ensemble has emerged. The clustering ensemble combines a pool of base unstable partitions (produced by an unstable clustering algorithm(s)) into a stable, robust, innovative and better partition (usually named as consensus partition). The superiority of the clustering ensemble algorithms to the base clustering algorithms is due to the wisdom of crowds (WoC) concept. The WoC concept says that each member of a pool looks at the problem with a different point of view and their consensus decision is better than any of them. In this paper, we propose a clustering ensemble approach where it uses a diverse subset of an primitive ensemble. In spite of the previous works, we use only a fraction of clusters of the base partitions. The most robust clusters are selected to participate in creation of consensus partition. The metric of measuring cluster stability is f-measure. The optimal subset is chosen by genetic algorithm. The method is experimentally compared with the state of the art clustering ensemble algorithms.
کلیدواژه‌های انگلیسی مقاله Cluster stability, evolutionary algorithm, Ensemble clustering, Fisher criterion

نویسندگان مقاله نوید صمیمی | Navid Samimi
1Ph.D. Student, Islamic Azad University, Yasuj-Kohgiloyeh & Boyerahmad, Iran.
دانشگاه آزاد اسلامی واحد یاسوج، کهگیلویه و بویراحمد، ایران

صمد نجاتیان | Samad Nejatian
2Department of Electrical Engineering, Yasooj Branch, Islamic Azad University, Yasooj, Kohgiloye and
دانشکده مهندسی برق، واحد یاسوج، دانشگاه آزاد اسلامی، کهگیلویه و بویراحمد، ایران،

حمید پروین | Hamid Parvin
Department of Computer Engineering, Islamic Azad University of Noorabad Mamasani, Fars, Iran
گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد نورآباد ممسنی ، نورآباد ممسنی فارس

کرم اله باقری فرد | Karamolah Bagheri Fard
5Department of Computer Engineering, Yasuj Branch, Islamic Azad University, Yasuj, Kohgiloye and Boyerahmad, Iran.
دانشکده مهندسی کامپیوتر، واحد یاسوج، دانشگاه آزاد اسلامی، کهگیلویه و بویراحمد، ایران


نشانی اینترنتی http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-279-15&slc_lang=fa&sid=1
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده مقالات پردازش داده‌های رقمی
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات