- عنوان کتاب: Big Data Processing Using Spark in Cloud
- نویسنده: Mamta Mittal. Valentina E. Balas
- حوزه: پردازش کلان داده, Spark
- سال انتشار: 2019
- تعداد صفحه: 274
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 8.49 مگابایت
کتاب ویرایششده «پردازش دادههای بزرگ با استفاده از Spark در Cloud» ضمن شروع با اصول اولیه Scala و چارچوب هسته Spark، به عمق Spark میپردازد و سپس فریمهای داده Spark، یادگیری ماشین با استفاده از MLlib، تجزیه و تحلیل گراف با استفاده از نمودار X و زمان واقعی را بررسی میکند. پردازش با Apache Kafka، AWS Kinesis و Azure Event Hub. ما همچنین Spark را با استفاده از PySpark و R. بررسی خواهیم کرد، دانشی را که تاکنون در مورد Spark آموختهایم به کار میگیریم، و روی مجموعه دادههای واقعی کار میکنیم و ابتدا تحلیلهای اکتشافی انجام میدهیم، سپس به مدلسازی پیشبینیکننده در مجموعه دادههای مسکن بوستون میرویم و سپس حرکت میکنیم. برای ایجاد سیستم توصیهکننده مبتنی بر محتوای خبری با استفاده از NLP و MLlib، سیستم توصیهکننده فیلمهای مبتنی بر فیلتر مشارکتی و رتبه صفحه با استفاده از GraphX. این کتاب همچنین نحوه تنظیم پارامترهای Spark برای سناریوهای تولید و نحوه نوشتن برنامه های کاربردی قوی در Apache Spark با استفاده از Scala در محیط رایانش ابری را مورد بحث قرار می دهد.
The edited book “Big Data Processing using Spark in Cloud” takes deep into Spark while starting with the basics of Scala and core Spark framework, and then explore Spark data frames, machine learning using MLlib, graph analytics using graph X, and real-time processing with Apache Kafka, AWS Kinesis, and Azure Event Hub. We will also explore Spark using PySpark and R., apply the knowledge that so far we have learnt about Spark, and will work on real datasets and do some exploratory analytics first, then move on to predictive modeling on Boston Housing Datasets, and then move forward to build news content-based recommender system using NLP and MLlib, collaborative filtering-based movies recommender system, and page rank using GraphX. This book also discusses how to tune Spark parameters for production scenarios and how to write robust applications in Apache Spark using Scala in cloud computing environment.
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:
Download: Big Data Processing Using Spark in Cloud
نظرات کاربران