- عنوان کتاب: Simplify Big Data Analytics with Amazon EMR
- نویسنده: Sakti-Mishra
- حوزه: کلان داده
- سال انتشار: 2022
- تعداد صفحه: 430
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 11.0 مگابایت
با افزایش استفاده از خدمات مرتبط با اینترنت، رایانه ها و محصولات هوشمند، میزان داده های تولید شده توسط آنها نیز به طور تصاعدی افزایش یافته است. دادههای تولید شده توسط آنها برای رسیدگی به مشکلات تجاری بسیار ارزشمند است، زیرا میتوانید دادهها را تجزیه و تحلیل کنید تا بینشهایی به دست آورید که میتواند به تصمیمگیری سریعتر و پیشبینی رشد کسبوکار کمک کند. این مجموعه دادهها به اندازهای بزرگ و پیچیده هستند که فناوریهای سنتی پردازش دادهها نمیتوانند آنها را به طور کارآمد مدیریت کنند، و به همین دلیل است که چارچوبهای پردازش توزیعشده مانند Hadoop و Spark تکامل یافتهاند. Amazon Elastic MapReduce (EMR) یک پیشنهاد مدیریت شده برای خدمات اکوسیستم Hadoop ارائه می دهد، به طوری که کسب و کارها می توانند روی ساخت خطوط لوله تجزیه و تحلیل تمرکز کنند و در مدیریت زیرساخت ها در زمان صرفه جویی کنند. این امر آمازون EMR را به بهترین گزینه برای حجم کاری Hadoop، Spark و کلان داده تبدیل می کند. با ادامه رشد حجم داده ها، تجزیه و تحلیل داده های بزرگ به یک مهارت رایج تبدیل می شود که همه برای موفقیت در حرفه یا تجارت خود به آن نیاز دارند. قبل از EMR، آزمایش بارهای کاری Hadoop یا Spark گران بود زیرا برای راه اندازی به خوشه هایی از سرورها نیاز دارند. اما با مدل پرداختی آمازون EMR، میتوانید خوشههای کوچک را به سرعت بچرخانید، آنها را در صورت نیاز مقیاسبندی کنید، و پس از پایان کار، آنها را خاتمه دهید. سازمانهایی که میخواهند با آمازون EMR شروع کنند یا در حال برنامهریزی برای انتقال حجمهای کاری موجود Hadoop به EMR هستند، و همچنین فارغالتحصیلان تازه وارد کالج که میخواهند در EMR مهارت بیشتری کسب کنند، این کتاب را بسیار مفید میدانند و میتوانند عمیقاً در EMR مختلف غواصی کنند. ویژگی ها و الگوهای معماری
As the usage of internet-related services, computers, and smart products increases, the amount of data produced by them has also increased exponentially. The data produced by them is extremely valuable for addressing business problems, as you can analyze the data to derive insights that can help in faster decision making and forecasting business growth. These datasets are large and complex enough that traditional data processing technologies can’t handle them efficiently, and that is why distributed processing frameworks such as Hadoop and Spark evolved. Amazon Elastic MapReduce (EMR) provides a managed offering for Hadoop ecosystem services, so that businesses can focus on building analytics pipelines and save time on managing infrastructure. This makes Amazon EMR the top choice for Hadoop, Spark, and big data workloads. As the amount of data continues to grow, big data analytics will become a common skill that everybody will need to have to be successful in their career or business. Before EMR, it was expensive to try out Hadoop or Spark workloads as they require clusters of servers for setup. But with Amazon EMR’s pay-as-you-go model, you can spin up small clusters quickly, scale them as needed, and terminate them when the job finishes. Organizations that want to get started with Amazon EMR or are planning to migrate existing Hadoop workloads to EMR, as well as college-fresh graduates who want to upskill in EMR, will find this book very useful and will be able to dive deep into different EMR features and architecture patterns.
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:
نظرات کاربران