- عنوان: Data Science & Big Data Analytics
- نویسنده: EMC Education Services
- حوزه: تحلیل داده
- سال انتشار: 2015
- تعداد صفحه: 435
- زبان اصلی انگلیسی
- نوع فایل: pdf
- حجم فایل: 9.03 مگابایت
کلان داده فرصتهای جدید قابل توجهی را برای سازمانها ایجاد میکند تا از با ارزشترین داراییشان یعنی اطلاعات، ارزشهای جدید به دست آورند و مزیت رقابتی ایجاد کنند. برای کسبوکارها، دادههای بزرگ به افزایش کارایی، کیفیت و محصولات و خدمات شخصیشده کمک میکند و سطح رضایت و سود مشتری را بهبود میبخشد. برای تلاشهای علمی، تجزیه و تحلیل دادههای بزرگ، راههای جدید تحقیق را با نتایج بالقوه غنیتر و بینشهای عمیقتر از آنچه قبلاً در دسترس بود، فراهم میکند. در بسیاری از موارد، تجزیه و تحلیل داده های بزرگ، داده های ساختاریافته و بدون ساختار را با فیدها و پرس و جوهای بلادرنگ یکپارچه می کند و مسیرهای جدیدی را برای نوآوری و بینش باز می کند. این کتاب رویکرد یک پزشک را به برخی از تکنیک ها و ابزارهای کلیدی مورد استفاده در تجزیه و تحلیل داده های بزرگ ارائه می دهد. دانش این روشها به افراد کمک میکند تا مشارکتکنندگان فعال پروژههای تجزیه و تحلیل دادههای بزرگ باشند. محتوای کتاب برای کمک به سهامداران متعدد طراحی شده است: تحلیلگران کسب و کار و داده که به دنبال افزودن مهارت های تجزیه و تحلیل داده های بزرگ به مجموعه خود هستند. متخصصان پایگاه داده و مدیران گروه های هوش تجاری، تجزیه و تحلیل یا داده های بزرگ که به دنبال غنی سازی مهارت های تحلیلی خود هستند. و فارغ التحصیلان کالج در حال بررسی علم داده به عنوان یک زمینه شغلی هستند. مطالب در دوازده فصل تنظیم شده است. فصل اول خواننده را با حوزه داده های بزرگ، محرک های تجزیه و تحلیل پیشرفته و نقش دانشمند داده آشنا می کند. فصل دوم یک چرخه عمر پروژه تحلیلی را ارائه میکند که برای ویژگیها و چالشهای خاص تحلیل فرضیه محور با دادههای بزرگ طراحی شده است. فصل 3 به بررسی تکنیک های آماری اساسی در زمینه محیط نرم افزار تحلیلی منبع باز R می پردازد. این فصل همچنین اهمیت تجزیه و تحلیل داده های اکتشافی را از طریق تجسم ها برجسته می کند و مفاهیم کلیدی توسعه و آزمایش فرضیه را بررسی می کند. فصلهای 4 تا 9 طیف وسیعی از روشهای تحلیلی پیشرفته، از جمله خوشهبندی، طبقهبندی، تحلیل رگرسیون، سریهای زمانی و تحلیل متن را مورد بحث قرار میدهند. فصل های 10 و 11 بر فناوری ها و ابزارهای خاصی تمرکز دارند که از تجزیه و تحلیل پیشرفته با داده های بزرگ پشتیبانی می کنند. به طور خاص، پارادایم MapReduce و نمونه سازی آن در اکوسیستم Hadoop، و همچنین موضوعات پیشرفته در SQL و تجزیه و تحلیل متن در پایگاه داده، تمرکز این فصل ها را تشکیل می دهند. فصل 12 راهنمایی در مورد عملیاتی کردن پروژه های تجزیه و تحلیل داده های بزرگ ارائه می دهد. این فصل بر ایجاد نتایج نهایی، تبدیل یک پروژه تحلیلی به دارایی مداوم عملیات یک سازمان و ایجاد خروجی های بصری واضح و مفید بر اساس داده ها تمرکز دارد.
Big Data is creating significant new opportunities for organizations to derive new value and create competitive advantage from their most valuable asset: information. For businesses, Big Data helps drive efficiency, quality, and personalized products and services, producing improved levels of customer satisfaction and profit. For scientific efforts, Big Data analytics enable new avenues of investigation with potentially richer results and deeper insights than previously available. In many cases, Big Data analytics integrate structured and unstructured data with realtime feeds and queries, opening new paths to innovation and insight. This book provides a practitioner’s approach to some of the key techniques and tools used in Big Data analytics. Knowledge of these methods will help people become active contributors to Big Data analytics projects. The book’s content is designed to assist multiple stakeholders: business and data analysts looking to add Big Data analytics skills to their portfolio; database professionals and managers of business intelligence, analytics, or Big Data groups looking to enrich their analytic skills; and college graduates investigating data science as a career field. The content is structured in twelve chapters. The first chapter introduces the reader to the domain of Big Data, the drivers for advanced analytics, and the role of the data scientist. The second chapter presents an analytic project lifecycle designed for the particular characteristics and challenges of hypothesis-driven analysis with Big Data. Chapter 3 examines fundamental statistical techniques in the context of the open source R analytic software environment. This chapter also highlights the importance of exploratory data analysis via visualizations and reviews the key notions of hypothesis development and testing. Chapters 4 through 9 discuss a range of advanced analytical methods, including clustering, classification, regression analysis, time series and text analysis. Chapters 10 and 11 focus on specific technologies and tools that support advanced analytics with Big Data. In particular, the MapReduce paradigm and its instantiation in the Hadoop ecosystem, as well as advanced topics in SQL and in-database text analytics form the focus of these chapters. Chapter 12 provides guidance on operationalizing Big Data analytics projects. This chapter focuses on creating the final deliverables, converting an analytics project to an ongoing asset of an organization’s operation, and creating clear, useful visual outputs based on the data.
این کتاب را میتوانید بصورت رایگان از لینک زیر دانلود نمایید.
Download: Data Science & Big Data Analytics
نظرات کاربران