مجله علمی تفریحی بیبیس
0

دانلود کتاب داده های بزرگ آسان ساخته شده است – راهنمای کاری مجموعه ابزار کامل Hadoop

بازدید 657
  • عنوان کتاب: Big Data Made Easy / A Working Guide to the Complete Hadoop Toolset
  • نویسنده: Michael Frampton
  • حوزه: بیگ دیتا, hadoop
  • سال انتشار: 2015
  • تعداد صفحه: 381
  • زبان اصلی: انگلیسی
  • نوع فایل: pdf
  • حجم فایل: 14.5 مگابایت

اگر می خواهید در مورد مجموعه ابزار مبتنی بر داده های بزرگ Hadoop بیاموزید، Big Data Made Easy برای شما مناسب است. این یک نمای کلی از Hadoop و ابزارهایی که می توانید با آن استفاده کنید ارائه می دهد. من نمونه‌های Hadoop در این کتاب را بر اساس CentOS، نسخه محبوب و آسان لینوکس در دسترس قرار داده‌ام. هر یک از نمونه های عملی آن رویکردی گام به گام برای نصب و اجرا دارد. چه نیاز مبرم به یادگیری در مورد Hadoop داشته باشید یا فقط کنجکاو باشید، Big Data Made Easy نقطه شروعی را ارائه می دهد و منحنی یادگیری ملایمی را از طریق لایه های کاربردی داده های بزرگ مبتنی بر Hadoop ارائه می دهد. با شروع مجموعه ای از سرورها و تنها با نصب CentOS، من شما را از طریق مراحل دانلود، نصب، استفاده و بررسی خطا راهنمایی می کنم. این کتاب موضوعات زیر را پوشش می دهد: نصب Hadoop (V1 و V2) جمع آوری داده های مبتنی بر وب (Nutch, Solr, Gora, HBase) برنامه نویسی Map Reduce (جاوا, Pig, Perl, Hive) زمان بندی (Fair) و زمان‌بندی‌های ظرفیت، Oozie) تحرک داده (فرمان‌های Hadoop، Sqoop، Flume، Storm) مانیتورینگ (Hue، Nagios، Ganglia) مدیریت خوشه Hadoop (Ambari، CDH) QLve (تجزیه و تحلیل، Imp، S Spark) ETL (Pentaho, Talend) گزارش (Splunk, Talend) با رسیدن به پایان هر مبحث، پس از اتمام نصب هر نمونه، عمق دانش خود را افزایش داده و یک سیستم کلان داده مبتنی بر Hadoop ایجاد خواهید کرد. . مهم نیست که نقش شما در دنیای فناوری اطلاعات چیست، درک پتانسیل ابزارهای مبتنی بر Hadoop با کار کردن با این نمونه‌ها به بهترین وجه به دست می‌آید. پس از کار در توسعه، پشتیبانی و آزمایش سیستم های مبتنی بر انبار داده، می توانم ببینم که بسیاری از جنبه های سیستم انبار داده به خوبی به سیستم های کلان داده ترجمه می شوند. من سعی کرده ام این کتاب را با توجه به موضوعات ذکر شده در بالا کاربردی و منظم نگه دارم. بیش از ذخیره سازی و پردازش را پوشش می دهد. همچنین موضوعاتی مانند جمع آوری و جابجایی داده ها، برنامه ریزی و نظارت، تجزیه و تحلیل و مدیریت، و ETL و گزارش را در نظر می گیرد. این کتاب برای کسانی است که به دنبال معرفی عملی دنیای ابزارهای داده بزرگ Hadoop مبتنی بر لینوکس هستند. دانش Hadoop را فرض نمی کند، اما به دانش لینوکس و SQL نیاز دارد. استفاده از هر دستور در نقطه ای که استفاده می شود توضیح داده می شود.

If you would like to learn about the big data Hadoop-based toolset, then Big Data Made Easy is for you. It provides a wide overview of Hadoop and the tools you can use with it. I have based the Hadoop examples in this book on CentOS, the popular and easily accessible Linux version; each of its practical examples takes a step-by-step approach to installation and execution. Whether you have a pressing need to learn about Hadoop or are just curious, Big Data Made Easy will provide a starting point and offer a gentle learning curve through the functional layers of Hadoopbased big data. Starting with a set of servers and with just CentOS installed, I lead you through the steps of downloading, installing, using, and error checking. The book covers following topics: • Hadoop installation (V1 and V2) • Web-based data collection (Nutch, Solr, Gora, HBase) • Map Reduce programming (Java, Pig, Perl, Hive) • Scheduling (Fair and Capacity schedulers, Oozie) • Moving data (Hadoop commands, Sqoop, Flume, Storm) • Monitoring (Hue, Nagios, Ganglia) • Hadoop cluster management (Ambari, CDH) • Analysis with SQL (Impala, Hive, Spark) • ETL (Pentaho, Talend) • Reporting (Splunk, Talend) As you reach the end of each topic, having completed each example installation, you will be increasing your depth of knowledge and building a Hadoop-based big data system. No matter what your role in the IT world, appreciation of the potential in Hadoop-based tools is best gained by working along with these examples. Having worked in development, support, and testing of systems based in data warehousing, I could see that many aspects of the data warehouse system translate well to big data systems. I have tried to keep this book practical and organized according to the topics listed above. It covers more than storage and processing; it also considers such topics as data collection and movement, scheduling and monitoring, analysis and management, and ETL and reporting. This book is for anyone seeking a practical introduction to the world of Linux-based Hadoop big data tools. It does not assume knowledge of Hadoop, but it does require some knowledge of Linux and SQL. Each command use is explained at the point it is utilized.

این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:

Download: Big Data Made Easy

نظرات کاربران

  •  چنانچه دیدگاه شما توهین آمیز باشد تایید نخواهد شد.
  •  چنانچه دیدگاه شما جنبه تبلیغاتی داشته باشد تایید نخواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

بیشتر بخوانید