این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
دوشنبه 31 شهریور 1404
پردازش علائم و داده ها
، جلد ۲۱، شماره ۱، صفحات ۸۹-۱۰۰
عنوان فارسی
طراحی شبکه بهینهساز خودکار الهام گرفته از الگوریتم بهینهسازی BFGS با حافظه محدود
چکیده فارسی مقاله
امروزه علیرغم توسعه مدلهای یادگیری ماشین برای استخراج ویژگیها به صورت خودکار، هنوز الگوریتمهای بهینهسازی به صورت دستی طراحی میشوند. یکی از اهداف فرایادگیری (
meta-learning
)، خودکار کردن فرایند بهینهسازی است. الگوریتم
های بهینهسازی دستی مبتنی بر بردار گرادیان تنها براساس عملیات ضرب داخلی، ضرب اسکالر و جمع برداری بر روی بردارهای ورودی نوشته می شوند. بنابراین می توان گفت که این الگوریتمها در فضای هیلبرت بعد مساله بهینهسازی اجرا می شوند. ما نیز قصد داریم با ایده گرفتن از این مطلب، فضایی برای یادگیری ورودیها ایجاد کنیم که مستقل از ابعاد ورودی باشد. بدین منظور با ایده گرفتن از الگوریتم
BFGS
با حافظه محدود
(
L-BFGS
)
و همچنین سلول
LSTM
یک ساختار جدید با نام
Hilbert LSTM
(
HLSTM
)
معرفی میکنیم که فرایند یادگیری در آن مستقل از ابعاد ورودی انجام میشود. به عبارتی الگوریتم یادگیری در فضای هیلبرت مساله بهینهسازی اجرا میشود. برای رسیدن به این هدف از لایه ضرایب خطی استفاده میکنیم که ترکیب خطی بردارهای ورودی را محاسبه میکند و ضرایب این ترکیب خطی، با کمک ضرب داخلی بردارهای ورودی بدست میآید. آزمایشهای ما نشان میدهند که نتایج بهدست آمده توسط بهینهساز ارائه شده، به مراتب بهتر از نتایج الگوریتمهای بهینهسازی دستی است.
کلیدواژههای فارسی مقاله
Hilbert LSTM، LSTM، L-BFGS، فرایادگیری، بهینهسازی خودکار
عنوان انگلیسی
Designing L-BFGS inspired automatic optimizer network
چکیده انگلیسی مقاله
Nowadays using features learned by machines is common and these types of features have excellent quality in comparison with hand-designed features. While many machine learning models are developed to extract features automatically, however, the optimizing algorithms are still designed manually. In this paper, we propose a method to cast the optimizing algorithm as a machine learning problem. This is a branch of machine learning which is named meta-learning or learning to learn.
Gradient-based optimization algorithms (e.g. gradient descent and BFGS) receive the gradient vector in each step and, by using the information of the previous points and gradients, estimate the update vector at the current point. The inputs and outputs of these algorithms are vectors whose dimension is the same as the optimization problem. These algorithms are written solely based on vector addition, scalar-product, and inner-product operations. Therefore, we can say that these algorithms are executed in a Hilbert space whose dimension is determined by the optimization problem. In this paper, we propose a novel method for learning to optimize over a Hilbert space of unknown dimensionality.
We introduce a new neural network module named Hilbert LSTM (HLSTM) which is based on a novel LSTM cell whose learning process is independent of the input data dimension. This independency is the result of restricting the network to the operations on a Hilbert space, prohibiting the network to work directly with the entries within a vector. To achieve this goal, we use a linear coefficients layer that linearly combines the input vectors based on coefficients computed by their inner products.
Training the network based on the inner product between vectors leads to learning an optimization algorithm that is independent of the data dimension
. Our experiments show that the proposed optimizer achieves better results in comparison with hand-designed algorithms.
کلیدواژههای انگلیسی مقاله
Hilbert LSTM, LSTM, L-BFGS, meta-learning, automatic optimization
نویسندگان مقاله
محمد اعتصام | Mohammad Etesam
Ferdowsi University of Mashhad
دانشگاه فردوسی مشهد
اشکان صادقی لطف آبادی | Ashkan Sadeghi-Lotfabadi
Ferdowsi University of Mashhad
دانشگاه فردوسی مشهد
سید کمال الدین غیاثی شیرازی | Kamaledin Ghiasi-Shirazi
Ferdowsi University of Mashhad
دانشگاه فردوسی مشهد
نشانی اینترنتی
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-2042-1&slc_lang=fa&sid=1
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
مقالات پردازش دادههای رقمی
نوع مقاله منتشر شده
بنیادی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات