این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
چهارشنبه 21 آبان 1404
پردازش علائم و داده ها
، جلد ۱۹، شماره ۱، صفحات ۰-۰
عنوان فارسی
ارائه یک روش موثر برای یادگیری مقاوم متریک در برابر نویز برچسب
چکیده فارسی مقاله
تعیین شباهت/ فاصله دادهها در بسیاری از الگوریتمهای یادگیری ماشین، شناسایی الگو و دادهکاوی کاربرد دارد. در بسیاری از کاربردها، معیارهای عمومی شباهت/فاصله کارایی بالایی ندارد و معمولاً با استفاده از دادهها میتوان معیار مناسبتری را یاد گرفت. دادههای آموزشی برای این منظور معمولاً بهصورت زوجهای مشابه و نامشابه و یا محدودیتهای سهگانه هستند. در کاربردهای واقعی، این دادههای آموزشی از طریق اینترنت و معمولاً با روشهایی نظیر Crowdsourcing جمعآوری میشود که میتواند حاوی نویز و اطلاعات اشتباه باشد. کارایی روشهای یادگیری متریک در صورت وجود اطلاعات آموزشی نویزی و اشتباه بشدت افت میکند و حتی ممکن است این روشها از معیارهای عمومی فاصله نظیر اقلیدسی نیز بدتر عمل کنند. بنابراین نیاز به مقاومسازی روشهای یادگیری متریک در برابر نویز برچسب وجود دارد. در این تحقیق، یک تابع احتمالاتی جدید برای تعیین احتمال نویزی بودن برچسب دادهها با استفاده از محدودیتهای سهگانه آموزشی ارائهشده است که باعث میشود الگوریتم یادگیری متریک بتواند دادههای پرت و نویزی را شناسایی کند و تأثیر آنها را فرایند یادگیری کاهش دهد. همچنین نشان دادهشده است که چگونه از اطلاعات بهدستآمده میتوان برای افزایش کارایی الگوریتم مبتنی بر متریک (مانند kNN) بهره برد و عملکرد آن را بهطور قابلملاحظهای افزایش داد. نتایج آزمایشات بر روی مجموعهای از دادههای ساختگی و واقعی، تائید میکند که روش پیشنهادی بهطور قابلملاحظهای کارایی روشهای یادگیری متریک را در محیطهایی با نویز برچسب بهبود میبخشد و بر روشهای همتا در مرزهای دانش در سطوح مختلف نویز برچسب برتری دارد.
کلیدواژههای فارسی مقاله
یادگیری متریک مقاوم، نویز برچسب، داده های پرت، معیار فاصله
عنوان انگلیسی
An Effective Approach for Robust Metric Learning in the Presence of Label Noise
چکیده انگلیسی مقاله
Many algorithms in machine learning, pattern recognition, and data mining are based on a similarity/distance measure. For example, the kNN classifier and clustering algorithms such as k-means require a similarity/distance function. Also, in Content-Based Information Retrieval (CBIR) systems, we need to rank the retrieved objects based on the similarity to the query. As generic measures such as Euclidean and cosine similarity are not appropriate in many applications, metric learning algorithms are developed which aim to learn an optimal distance function from data. These methods often need training data in the form of pair or triplet sets. Nowadays, this training data popularly is obtained via crowdsourcing from the Internet. Therefore, this information may be contaminated with label noise resulting in the poor performance of the learned metric. In some datasets, even it is possible that the learned metrics perform worse than the general ones such as Euclidean. To address this emerging challenge, we present a new robust metric learning algorithm that can identify outliers and label noise simultaneously from training side information. For this purpose, we model the probability distribution of label noise based on information in the training data. The proposed distribution function efficiently assigns the high probability to the data points contaminated with label noise. On the other hand, its value on the normal instances is near zero. Afterward, we weight the training instances according to these probabilities in our metric learning optimization problem. The proposed optimization problem can be solved using available SVM libraries such as LibSVM efficiently. Note that the proposed approach for identifying data with label noise is general and can easily be applied to any existing metric learning algorithms. After the metric learning phase, we utilized both the weights and the learned metric to enhance the accuracy of the metric-based classifier such as kNN. Several experiments are conducted on both real and synthetic datasets. The results confirm that the proposed algorithm enhances the performance of the learned metric in the presence of label noise and considerably outperforms state-of-the-art peer methods at different noise levels.
کلیدواژههای انگلیسی مقاله
Robust Metric Learning, Label Noise, Outlier, Distance Measure
نویسندگان مقاله
داود ذبیح زاده | Davood Zabihzadeh
Sabzevar University of New Technology
دانشگاه فناوری نوین سبزوار
سعید زاهدی | Saeed Zahedi
Ferdowsi University of Mashhad
دانشگاه فردوسی مشهد
رضا منصفی | Reza Monsefi
Ferdowsi University of Mashhad
دانشگاه فردوسی مشهد
نشانی اینترنتی
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-1158-1&slc_lang=fa&sid=1
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
مقالات پردازش دادههای رقمی
نوع مقاله منتشر شده
پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات