دانلود کتاب روش جهت متناوب ضرایب برای یادگیری ماشین

9 ماه پیش

عنوان کتاب: Alternating Direction Method of Multipliers for Machine Learning
نویسنده: Zhi-Quan Luo
حوزه: یادگیری ماشین
سال انتشار: 2022
تعداد صفحه: 274
زبان اصلی: انگلیسی
نوع فایل: pdf
حجم فایل: 3.1 مگابایت

روش جهت متناوب ضرب کننده ها (ADMM) برای من یک الگوریتم جادویی است. به نظر مغرضانه من، این روش کم و بیش یک روش جهانی برای حل طیف وسیعی از مشکلات محدودی است که پزشکان عادی در یادگیری ماشین ممکن است با آن مواجه شوند. برخلاف شیب نزول، که تقریباً یک روش جهانی برای مشکلات بدون محدودیت است، به نظر می رسد ADMM ظریف تر و در عین حال شفاف تر است. راز در ضریب لاگرانژ نهفته است، که به طور موقت مشکل محدود را نامحدود می کند، نه تنها دشواری در رسیدگی به محدودیت ها را برطرف می کند، بلکه بر برخی از عیوب ذاتی روش پنالتی و نزول گرادیان پیش بینی شده نیز غلبه می کند، در حالی که تفکر افراد غیر متخصص بسیار آسان تر است. از دو روش اخیر ضریب لاگرانژ همچنین نقش اصلی را در اثبات همگرایی و نرخ همگرایی ADMM ایفا می کند. با اغراق ممکن، می‌توانم بگویم کسی که نمی‌تواند زیبایی ADMM را درک کند، نمی‌تواند محقق خوبی در بهینه‌سازی باشد. از زمان اولین برخورد من با ADMM در حدود سال 2009، دیدم که افراد یادگیری ماشینی بیشتر و بیشتر از ADMM استفاده می کنند و دامنه کاربردهای آن را گسترش می دهند. من نیز از پیشرفت های جدید بسیار بهره بردم و سهمی در آن داشتم. با این حال، من همچنین متوجه شدم که بسیاری از مهندسان از ADMM به درستی استفاده نمی کنند (مشاهده ترین مثال این است که ساده لوحانه ADMM را برای دو بلوک متغیر برای مشکلات بیش از دو بلوک اعمال می کنیم). یک آموزش عالی در مورد ADMM، بهینه سازی توزیع شده و یادگیری آماری از طریق روش جهت گیری متناوب ضریب ها، نوشته بوید و همکاران، وجود دارد. در سال 2011. با این وجود، اکنون 10 سال از عمر آن می گذرد و پیشرفت های جدید را پوشش نمی دهد، که در واقع فکر می کنم برای کاربردهای گسترده تر ADMM مهم تر از توسعه های سنتی هستند، زیرا پیشرفت های جدید بر اساس تقاضاهای برنامه های کاربردی واقعی در کشور انجام شده است. پردازش سیگنال و یادگیری ماشین بنابراین، من فکر می کنم که نوشتن یک کتاب جدید در مورد ADMM برای بسیاری از افراد، از جمله خود من هنگام تدریس و مشاوره به دانشجویان بسیار مفید خواهد بود. هدف من این است که مهم‌ترین جنبه‌های پیشرفت‌های جدید در ADMM را به جای محدود کردن به مواد سنتی که معمولاً برای موارد محدب و دو بلوکی هستند، وارد کنم. واضح است که من نمی توانم همه مقالات را در ADMM بررسی کنم. بنابراین، استراتژی این است که به جای آن الگوریتم‌های معرف بر اساس انواع آن‌ها (به عنوان مثال، محدب، غیر محدب، تصادفی و توزیع‌شده) انتخاب شوند. در نتیجه، نباید تعجب کرد که برخی از انواع ADMM گنجانده نشده اند (زیرا آنها نماینده ترین نوع خود نیستند بلکه فقط در مورد عمیق تر بحث می کنند یا برای استفاده یا تجزیه و تحلیل بسیار پیچیده هستند) در حالی که برخی از انواع ADMM به نظر می رسد نسبتاً خام هستند، اما آنها هنوز هم شامل می شوند (زیرا آن نوع ADMM کمتر مورد بررسی قرار گرفته است). البته سلیقه شخصی و دانش محدود نیز اهمیت زیادی دارد. در نهایت، خودکفا بودن نیز بسیار مهم است. بنابراین، من نیز می خواهم شواهدی را با جزئیات ارائه کنم.

Alternating direction method of multipliers (ADMM) is a magic algorithm to me. In my biased opinion, it is more or less a universal method for solving a wide range of constrained problems that ordinary practitioners in machine learning may encounter. Unlike gradient descent, which is roughly a universal method for unconstrained problems, ADMM appears to be more elegant yet less transparent. The secret lies in the Lagrange multiplier, which temporarily makes the constrained problem unconstrained, not only removing the difficulty in handling the constraints but also overcoming some inherent defects of the penalty method and the projected gradient descent, while non-experts are much easier to think of the latter two methods. The Lagrange multiplier also plays a central role in the proofs of convergence and convergence rate of ADMM. With possible exaggeration, I would say that one who cannot appreciate the beauty of ADMMcannot be a good researcher in optimization. Since my first encounter with ADMM around 2009, I have seen that more and more machine learning people are using ADMM and extending its scope of applications. I also benefited a lot from and contributed a bit to the new developments. Yet, I also found that many engineers are not using ADMMcorrectly (the most notable example is to naively apply the ADMMfor two blocks of variables to problems with more than two blocks). There has been an excellent tutorial on ADMM, Distributed Optimization and Statistical Learning via the Alternating Direction Method of Multipliers, written by Boyd et al. in 2011. Nonetheless, it is now 10 years old and does not cover the new developments, which I actually think are more important than the traditional ones for the wider applications of ADMM, because the new developments were done out of demands from real applications in signal processing and machine learning. So, I think that writing a new book on ADMM will be very useful for many people, including myself when teaching and advising students. My goal is to incorporate the most important aspects of the new developments in ADMM, rather than being confined to the traditional materials, which are typically for convex and two-block cases. Clearly, I am unable to review all papers on ADMM. So, the strategy is to choose representative algorithms by their types (e.g., convex, nonconvex, stochastic, and distributed) instead. As a result, one should not be surprised that some variants of ADMM are not included (because they are not the most representative ones of their types but just discuss in more depth, or are too complex to use or analyze) while some variants of ADMM appear to be rather crude but they are still included (because that type of ADMM is less explored). Of course, personal flavor and limited knowledge also matter greatly. Finally, being self-contained is also very important. So, I also want to present proofs in detail.

این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:

Download: Alternating Direction Method of Multipliers for Machine Learning

پست های اخیر

دانلود کتاب روش جهت متناوب ضرایب برای یادگیری ماشین

نظرات کاربران

دیدگاهتان را بنویسید لغو پاسخ

پست های محبوب

بیشتر بخوانید

آهنگ خارجی

کتب علمی

رمان انگلیسی

کتب عمومی

پست های اخیر

دانلود کتاب روش جهت متناوب ضرایب برای یادگیری ماشین

مشاهده بیشتر

نظرات کاربران

دیدگاهتان را بنویسید لغو پاسخ

پست های محبوب

بیشتر بخوانید

آهنگ خارجی

کتب علمی

رمان انگلیسی

کتب عمومی