- عنوان کتاب: Practical Machine Learning with Spark
- نویسنده: Gourav Gupta
- حوزه: یادگیری ماشین
- سال انتشار: 2023
- تعداد صفحه: 554
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 18.0 مگابایت
از سال 1964، از آغاز اتوماسیون و هوشمندسازی نسبت به ماشینها، کاربردهای یادگیری ماشین (ML) در طول دو دهه گذشته پیشرفت چشمگیری داشته است. اما با این حال، دامنه بهبود زیادی برای تصمیم گیری های سریع و دقیق وجود دارد. هدف کتاب حاضر آگاه کردن خوانندگان از فعالیتهای روزمره است که با استفاده از برنامههای ML با استفاده از آپاچی اسپارک زندگی را هوشمندتر و راحتتر میکند. در ابتدا، یک چارچوب پردازش واحد در ML برای حل مشکلات حیاتی مورد استفاده قرار گرفت. به دلیل پردازش مستقل، آموزش و آزمایش مدل ها معمولاً زمان بیشتری می برد و به منابع بیشتری نیاز دارد. همچنین، مشکل برای داده های بزرگ (بعد بالا و حجم داده ویژگی ها) در ML پیچیده تر و وقت گیرتر می شود. بنابراین، یک لایه تجزیه و تحلیل حافظه امیدوارکننده مانند Apache Spark برای مدیریت و آموزش مدل هوش سنگین به روشی بهینه باید معرفی شود. به طور کلی، دو نوع چارچوب توزیع شده وجود دارد، مانند Apache Hadoop و Apache Spark. با توجه به برخی محدودیت ها در Hadoop، بیشتر MNC ها بعداً Apache Spark را پذیرفتند. این کتاب شامل جزئیات جامع و شفاف از ابتدا تا سطح تولید یک چارچوب توزیع شده است که برای خوانندگان مفید خواهد بود. همچنین، خوانندگان یاد میگیرند که به راحتی از سناریوهای مفهومی به پیادهسازی عملی گذر کنند و در مورد اجزای مختلف خطوط لوله ML با استفاده از Apache Spark آموزش ببینند. اگرچه یک پیوند Github در این کتاب ارائه شده است که در آن خواننده می تواند موارد عملی را با استفاده از آن پایگاه های کد امتحان کند.
Since 1964, from the beginning of automation and intelligence towards machines, the applications of machine learning (ML) have made tremendous progress during the last two decades. But still, there is a large scope of improvement for fast and accurate decisions. The aim of the present book is to make the readers aware of day-to-day activities that make life smarter and cosier with the use of ML applications using Apache Spark. Initially, there was a single processing framework used in ML to solve the critical problems. Due to the standalone processing, the training and testing of models usually takes more time and requires more resources. Also, the problem becomes more complex and time-consuming for big data (high dimension and data volume of features) in ML. Therefore, a promising inmemory analytics layer needs to be introduced, such as Apache Spark, for handling and training the heavy intelligence model in an optimised manner. Generally, there are two types of distributed frameworks, like Apache Hadoop and Apache Spark. Due to some limitations in Hadoop, most MNCs later adopted Apache Spark. This book contains comprehensive and lucid details from scratch to production level implementation of a distributed framework, which the readers will find useful. Also, readers will learn to easily transition from conceptual scenarios to practical implementation and get educated them about the various components of ML pipelines using Apache Spark. Although a Github link is provided in this book where the reader can try the practical stuff using those codebases.
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:
Download: Practical Machine Learning with Spark
نظرات کاربران