مجله علمی تفریحی بیبیس
0

دانلود کتاب یادگیری ری(Ray) – پایتون توزیع‌شده انعطاف‌پذیر برای یادگیری ماشین

بازدید 1425
  • عنوان کتاب: Learning Ray / Flexible Distributed Python for Machine Learning
  • نویسنده: Max Pumperla
  • حوزه: برنامه نویسی پایتون,یادگیری ماشین
  • سال انتشار: 2023
  • تعداد صفحه: 274
  • زبان اصلی: انگلیسی
  • نوع فایل: pdf
  • حجم فایل: 7.03 مگابایت

محاسبات توزیع شده موضوعی جذاب است. با نگاهی به روزهای اولیه محاسبات، نمی‌توان تحت تأثیر این واقعیت قرار نگرفت که امروزه بسیاری از شرکت‌ها حجم کار خود را در میان خوشه‌های کامپیوتری توزیع می‌کنند. جالب است که ما راه‌های کارآمدی برای انجام این کار پیدا کرده‌ایم، اما کاهش مقیاس نیز بیش از پیش به یک ضرورت تبدیل می‌شود. رایانه‌های فردی سریع‌تر می‌شوند، و با این حال نیاز ما به محاسبات در مقیاس بزرگ بیش از آنچه که ماشین‌ها می‌توانند انجام دهند بیشتر است. Ray با درک این موضوع که مقیاس‌بندی هم یک ضرورت و هم یک چالش است، قصد دارد محاسبات توزیع‌شده را برای توسعه‌دهندگان ساده کند. این محاسبات توزیع شده را برای افراد غیرمتخصص در دسترس قرار می دهد و مقیاس اسکریپت های پایتون خود را در چندین گره نسبتاً آسان ممکن می کند. Ray در مقیاس‌بندی حجم‌های کاری سنگین داده‌ها و محاسباتی، مانند پیش‌پردازش داده‌ها و آموزش مدل، خوب است و به صراحت بارهای کاری یادگیری ماشین (ML) را با نیاز به مقیاس‌سازی هدف قرار می‌دهد. در حالی که امروزه می‌توان این دو نوع بار کاری را بدون Ray مقیاس‌بندی کرد، احتمالاً باید از APIهای مختلف و سیستم‌های توزیع شده برای هر کدام استفاده کنید. و مدیریت چندین سیستم توزیع شده می تواند از بسیاری جهات کثیف و ناکارآمد باشد. اضافه شدن Ray AI Runtime (AIR) با انتشار Ray 2.0 در آگوست 2022، پشتیبانی از بارهای کاری پیچیده ML در Ray را بیش از پیش افزایش داد. AIR مجموعه ای از کتابخانه ها و ابزارهایی است که ساخت و استقرار برنامه های کاربردی ML سرتاسر را در یک سیستم توزیع شده آسان می کند. با AIR، حتی پیچیده ترین گردش های کاری را معمولاً می توان به صورت یک اسکریپت پایتون بیان کرد. این بدان معناست که می توانید ابتدا برنامه های خود را به صورت محلی اجرا کنید، که می تواند تفاوت زیادی از نظر اشکال زدایی و سرعت توسعه ایجاد کند. دانشمندان داده از Ray سود می برند زیرا می توانند بر اکوسیستم رو به رشد کتابخانه های Ray ML و ادغام های شخص ثالث تکیه کنند. Ray AIR به شما کمک می‌کند تا ایده‌ها را به سرعت نمونه‌سازی کنید و راحت‌تر از توسعه به تولید بروید. برخلاف بسیاری از سیستم‌های توزیع‌شده دیگر، Ray از پردازنده‌های گرافیکی نیز پشتیبانی می‌کند، که می‌تواند به ویژه برای نقش‌هایی مانند مهندسان ML مهم باشد. برای پشتیبانی از مهندسان داده، Ray با ابزارهایی مانند Kubernetes ادغام شده است و می‌تواند در تنظیمات چند ابری مستقر شود.

Distributed computing is a fascinating topic. Looking back at the early days of computing, one can’t help but be impressed by the fact that so many companies today distribute their workloads across clusters of computers. It’s impressive that we have figured out efficient ways to do so, but scaling out is also becoming more and more of a necessity. Individual computers keep getting faster, and yet our need for large-scale computing keeps exceeding what single machines can do. Recognizing that scaling is both a necessity and a challenge, Ray aims to make distributed computing simple for developers. It makes distributed computing accessible to nonexperts and makes it possible to scale your Python scripts across multiple nodes fairly easily. Ray is good at scaling both data- and compute-heavy workloads, such as data preprocessing and model training—and it explicitly targets machine learning (ML) workloads with the need to scale. While it is possible today to scale these two types of workloads without Ray, you would likely have to use different APIs and distributed systems for each. And managing several distributed systems can be messy and inefficient in many ways. The addition of the Ray AI Runtime (AIR) with the release of Ray 2.0 in August 2022 increased the support for complex ML workloads in Ray even further. AIR is a collection of libraries and tools that make it easy to build and deploy end-to-end ML applications in a single distributed system. With AIR, even the most complex workflows can usually be expressed as a single Python script. That means you can run your programs locally first, which can make a big difference in terms of debugging and development speed. Data scientists benefit from Ray because they can rely on a growing ecosystem of Ray ML libraries and third-party integrations. Ray AIR helps you to quickly prototype ideas and go more easily from development to production. Unlike many other distributed systems, Ray has native support for GPUs as well, which can be particularly important to roles like ML engineers. To support data engineers, Ray also has tight integrations with tools like Kubernetes and can be deployed in multicloud setups.

این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:

Download: Learning Ray / Flexible Distributed Python for Machine Learning

نظرات کاربران

  •  چنانچه دیدگاه شما توهین آمیز باشد تایید نخواهد شد.
  •  چنانچه دیدگاه شما جنبه تبلیغاتی داشته باشد تایید نخواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

بیشتر بخوانید