- عنوان کتاب: Learning Ray / Flexible Distributed Python for Machine Learning
- نویسنده: Max Pumperla
- حوزه: برنامه نویسی پایتون,یادگیری ماشین
- سال انتشار: 2023
- تعداد صفحه: 274
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 7.03 مگابایت
محاسبات توزیع شده موضوعی جذاب است. با نگاهی به روزهای اولیه محاسبات، نمیتوان تحت تأثیر این واقعیت قرار نگرفت که امروزه بسیاری از شرکتها حجم کار خود را در میان خوشههای کامپیوتری توزیع میکنند. جالب است که ما راههای کارآمدی برای انجام این کار پیدا کردهایم، اما کاهش مقیاس نیز بیش از پیش به یک ضرورت تبدیل میشود. رایانههای فردی سریعتر میشوند، و با این حال نیاز ما به محاسبات در مقیاس بزرگ بیش از آنچه که ماشینها میتوانند انجام دهند بیشتر است. Ray با درک این موضوع که مقیاسبندی هم یک ضرورت و هم یک چالش است، قصد دارد محاسبات توزیعشده را برای توسعهدهندگان ساده کند. این محاسبات توزیع شده را برای افراد غیرمتخصص در دسترس قرار می دهد و مقیاس اسکریپت های پایتون خود را در چندین گره نسبتاً آسان ممکن می کند. Ray در مقیاسبندی حجمهای کاری سنگین دادهها و محاسباتی، مانند پیشپردازش دادهها و آموزش مدل، خوب است و به صراحت بارهای کاری یادگیری ماشین (ML) را با نیاز به مقیاسسازی هدف قرار میدهد. در حالی که امروزه میتوان این دو نوع بار کاری را بدون Ray مقیاسبندی کرد، احتمالاً باید از APIهای مختلف و سیستمهای توزیع شده برای هر کدام استفاده کنید. و مدیریت چندین سیستم توزیع شده می تواند از بسیاری جهات کثیف و ناکارآمد باشد. اضافه شدن Ray AI Runtime (AIR) با انتشار Ray 2.0 در آگوست 2022، پشتیبانی از بارهای کاری پیچیده ML در Ray را بیش از پیش افزایش داد. AIR مجموعه ای از کتابخانه ها و ابزارهایی است که ساخت و استقرار برنامه های کاربردی ML سرتاسر را در یک سیستم توزیع شده آسان می کند. با AIR، حتی پیچیده ترین گردش های کاری را معمولاً می توان به صورت یک اسکریپت پایتون بیان کرد. این بدان معناست که می توانید ابتدا برنامه های خود را به صورت محلی اجرا کنید، که می تواند تفاوت زیادی از نظر اشکال زدایی و سرعت توسعه ایجاد کند. دانشمندان داده از Ray سود می برند زیرا می توانند بر اکوسیستم رو به رشد کتابخانه های Ray ML و ادغام های شخص ثالث تکیه کنند. Ray AIR به شما کمک میکند تا ایدهها را به سرعت نمونهسازی کنید و راحتتر از توسعه به تولید بروید. برخلاف بسیاری از سیستمهای توزیعشده دیگر، Ray از پردازندههای گرافیکی نیز پشتیبانی میکند، که میتواند به ویژه برای نقشهایی مانند مهندسان ML مهم باشد. برای پشتیبانی از مهندسان داده، Ray با ابزارهایی مانند Kubernetes ادغام شده است و میتواند در تنظیمات چند ابری مستقر شود.
Distributed computing is a fascinating topic. Looking back at the early days of computing, one can’t help but be impressed by the fact that so many companies today distribute their workloads across clusters of computers. It’s impressive that we have figured out efficient ways to do so, but scaling out is also becoming more and more of a necessity. Individual computers keep getting faster, and yet our need for large-scale computing keeps exceeding what single machines can do. Recognizing that scaling is both a necessity and a challenge, Ray aims to make distributed computing simple for developers. It makes distributed computing accessible to nonexperts and makes it possible to scale your Python scripts across multiple nodes fairly easily. Ray is good at scaling both data- and compute-heavy workloads, such as data preprocessing and model training—and it explicitly targets machine learning (ML) workloads with the need to scale. While it is possible today to scale these two types of workloads without Ray, you would likely have to use different APIs and distributed systems for each. And managing several distributed systems can be messy and inefficient in many ways. The addition of the Ray AI Runtime (AIR) with the release of Ray 2.0 in August 2022 increased the support for complex ML workloads in Ray even further. AIR is a collection of libraries and tools that make it easy to build and deploy end-to-end ML applications in a single distributed system. With AIR, even the most complex workflows can usually be expressed as a single Python script. That means you can run your programs locally first, which can make a big difference in terms of debugging and development speed. Data scientists benefit from Ray because they can rely on a growing ecosystem of Ray ML libraries and third-party integrations. Ray AIR helps you to quickly prototype ideas and go more easily from development to production. Unlike many other distributed systems, Ray has native support for GPUs as well, which can be particularly important to roles like ML engineers. To support data engineers, Ray also has tight integrations with tools like Kubernetes and can be deployed in multicloud setups.
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:
Download: Learning Ray / Flexible Distributed Python for Machine Learning
نظرات کاربران