مجله علمی تفریحی بیبیس
0

دانلود کتاب مقیاس پذیری یادگیری ماشین با Spark

بازدید 627
  • عنوان کتاب: Scaling Machine Learning with Spark
  • نویسنده: Adi Polak
  • حوزه: یادگیری ماشین, Spark
  • سال انتشار: 2023
  • تعداد صفحه: 180
  • زبان اصلی: انگلیسی
  • نوع فایل: pdf
  • حجم فایل: 4.59 مگابایت

در زمینه توسعه یادگیری ماشین و علم داده، ضبط، ادغام و ساخت مدل‌ها به صورت مشترک و همزمان با آزمایش ترکیبی از ویژگی‌ها، تکنیک‌های استانداردسازی و فراپارامترها پیچیده است. علاوه بر این، ردیابی آزمایش‌ها، بازتولید نتایج، مدل‌های بسته‌بندی برای استقرار، ذخیره و مدیریت مدل‌ها بدون تحریف اهداف اصلی شرکت، یک کار کامل است. بنا به دلایل ذکر شده در بالا، بدیهی است که نیاز به تکامل توسعه و ساخت ML وجود دارد. این یک توسعه نرم افزار قوی تر، قابل پیش بینی، استاندارد و فیلتر شده است. برای ادامه این موضوع، بسیاری از سازمان‌ها شروع به ساخت پلتفرم‌های یادگیری ماشین داخلی برای مدیریت چرخه حیات ML کرده‌اند، و با این حال هنوز با چالش‌هایی روبرو هستند، زیرا اغلب پلتفرم‌های ML اغلب تنها از مجموعه کوچکی از الگوریتم‌های داخلی کتابخانه‌های ML پشتیبانی می‌کنند. به زیرساخت های هر شرکت وابسته است. علاوه بر این، این پلتفرم‌ها معمولا منبع باز نیستند و کاربران نمی‌توانند به راحتی از کتابخانه‌های جدید ML استفاده کنند یا کار خود را با دیگران در جامعه به اشتراک بگذارند. مدیریت چرخه عمر آزمایش ML را می توان به عنوان MLOps نیز نامید که ترکیبی از یادگیری ماشینی، توسعه و عملیات است. یادگیری ماشینی همه چیز در مورد خود آزمایش، آموزش، تنظیم و یافتن مدل بهینه است. توسعه در مورد توسعه خطوط لوله و ابزار برای ادغام و انتقال مدل یادگیری ماشینی از مرحله توسعه / آزمایشی به مرحله بندی و تولید است. و در نهایت، عملیات مربوط به ابزارهای CI/CD، نظارت و مدیریت مدل‌ها در مقیاس است.

In the field of machine learning development and data science, it is complex to record, integrate and build models collaboratively while experimenting with a combination of features, standardization techniques, and hyperparameters. In addition, it’s a complete task to track experiments, reproduce results, package models for deployment, store and manage models without distorting the company’s core goals Due to the above-given reasons, it is obvious there is a need to evolve ML development and make it a more robust, predictable, standardized, and filtered software development. To go further with this, many organizations have started to build internal machine learning platforms to manage the ML lifecycle, and yet they still face challenges like most of the ML platforms often support only a small set of built-in algorithms of ML libraries which are bound to each company’s infrastructure. Moreover, these platforms are usually not open source, and users cannot easily leverage new ML libraries or share their work with others in the community. Managing ML Experiment lifecycle can be also referred to as MLOps, which is a combination of machine learning, development, and operations. Machine learning is all about the experiment itself, training, tuning, and finding the optimal model. Development is about developing the pipelines and tools to integrate and take the machine learning model from the development / experimental stage to staging and production. And lastly, operations is about the CI/CD tools, monitoring, and managing the models at scale.

این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:

Download: Scaling Machine Learning with Spark

نظرات کاربران

  •  چنانچه دیدگاه شما توهین آمیز باشد تایید نخواهد شد.
  •  چنانچه دیدگاه شما جنبه تبلیغاتی داشته باشد تایید نخواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

بیشتر بخوانید