مجله علمی تفریحی بیبیس
0

دانلود کتاب الگوریتم‌های داده با دستورالعمل‌های Spark و الگوهای طراحی برای افزایش مقیاس با استفاده از PySpark

بازدید 637
  • عنوان کتاب: Data Algorithms with Spark / Recipes and Design Patterns for Scaling Up using PySpark
  • نویسنده: Mahmoud Parsian
  • حوزه:Spark , PySpark
  • سال انتشار: 2022
  • تعداد صفحه: 438
  • زبان اصلی: انگلیسی
  • نوع فایل: pdf
  • حجم فایل: 12.88 مگابایت

Spark به استاندارد واقعی برای تجزیه و تحلیل داده های در مقیاس بزرگ تبدیل شده است. من از زمان آغاز به کار آن در نه سال پیش، از Spark استفاده کرده و آن را آموزش می‌دهم و پیشرفت‌های فوق‌العاده‌ای را در فرآیندهای استخراج، تبدیل، بارگذاری (ETL)، توسعه الگوریتم توزیع‌شده و تجزیه و تحلیل داده‌ها در مقیاس بزرگ دیده‌ام. من شروع به استفاده از Spark با جاوا کردم، اما متوجه شدم که در حالی که کد بسیار پایدار است، شما باید خطوط طولانی کد بنویسید، که ممکن است غیرقابل خواندن باشد. برای این کتاب، تصمیم گرفتم از PySpark (یک API پایتون برای Spark) استفاده کنم، زیرا بیان قدرت Spark در پایتون آسان‌تر است: کد کوتاه، قابل خواندن و قابل نگهداری است. PySpark قدرتمند است اما استفاده از آن ساده است و می توانید هر ETL یا الگوریتم توزیع شده را در آن با مجموعه ای از تبدیل ها و اقدامات ساده بیان کنید.

Spark has become the de facto standard for large-scale data analytics. I have been using and teaching Spark since its inception nine years ago, and I have seen tremendous improvements in Extract, Transform, Load (ETL) processes, distributed algorithm development, and large-scale data analytics. I started using Spark with Java, but I found that while the code is pretty stable, you have to write long lines of code, which can become unreadable. For this book, I decided to use PySpark (a Python API for Spark) because it is easier to express the power of Spark in Python: the code is short, readable, and maintainable. PySpark is powerful but simple to use, and you can express any ETL or distributed algorithm in it with a simple set of transformations and actions.

این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:

Download: Data Algorithms with Spark

نظرات کاربران

  •  چنانچه دیدگاه شما توهین آمیز باشد تایید نخواهد شد.
  •  چنانچه دیدگاه شما جنبه تبلیغاتی داشته باشد تایید نخواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.