- عنوان کتاب: Fundamentals of Data Science
- نویسنده: Jugal K. Kalita
- حوزه: علوم داده
- سال انتشار: 2024
- تعداد صفحه: 336
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 12.3 مگابایت
علم داده یک حوزه مطالعاتی در حال تکامل است که به طور گسترده در حل مشکلات زندگی واقعی که ماهیت تجربی دارند استفاده می شود. این فقط در مورد یادگیری ماشین، آمار یا پایگاه داده نیست. در عوض، این یک مطالعه جامع از موضوعاتی است که به استخراج دانش جدید از دادهها، شروع با تهیه دادهها، استفاده از مدلهای یادگیری هوشمند مناسب و تفسیر نتیجه کمک میکند. مدلهای اعمالشده «یک اندازه مناسب برای همه» نیستند و با ماهیت دادهها و برنامههای مورد بررسی متفاوت هستند. این کتاب مفاهیم پایه و همچنین پیشرفته در علم داده را همراه با برنامه های کاربردی واقعی ارائه می دهد. ما معتقدیم این کتاب به دانش آموزان، محققان و متخصصان در سطوح مختلف درک خوبی از علوم داده، یادگیری ماشین، داده کاوی بزرگ و تجزیه و تحلیل. نیاز شدید و فزاینده به دانشمندان داده در صنعت، تقاضا برای مواد مطالعاتی گسترده و قابل درک را ایجاد کرده است که مفاهیم اساسی را تا کاربردهای پیشرفته مفاهیم علوم داده در حوزه های مختلف پوشش می دهد. این کتاب شامل بحثهایی در مورد رویکردهای نظری و عملی در علم داده است که هدف آن ایجاد درک کاملی از این زمینه با هدف نهایی کشف دانش جدید است. این شامل یک بحث عمیق در مورد برخی از موضوعات ضروری برای پروژه های علم داده است. با مقدمه ای بر انواع داده ها، منابع و خطوط لوله تولید شروع می شود. این یک بحث مفصل از مراحل و تکنیک های مختلف آماده سازی داده ها است. سپس داده های آماده شده از طریق تکنیک های تحلیل داده های پیش بینی و توصیفی تجزیه و تحلیل می شوند. این کتاب شامل ارائه سیستماتیک بسیاری از الگوریتمهای یادگیری پیشبینیکننده و توصیفی است، از جمله پیشرفتهای اخیر که با موفقیت مجموعه دادههای بزرگ را با دقت بالا مدیریت کردهاند. این یک بحث مفصل در مورد تکنیک های یادگیری ماشینی و روش های ارزیابی ارائه می دهد. چندین فصل تحلیل رگرسیون، تکنیک های طبقه بندی، شبکه های عصبی مصنوعی و مدل های یادگیری عمیق را پوشش می دهد. فصل تجزیه و تحلیل خوشهای با معیارهای مجاورت مختلف شروع میشود و پس از آن مقدمهای بر چندین تکنیک خوشهبندی ارائه میشود. این فصل همچنین تکنیکهای دو خوشهبندی را با معیارهای اعتبارسنجی خوشهای پوشش میدهد. فصل مربوط به تداعی-قاعده کردن، ایده اصلی کاوی مجموعه آیتم های مکرر، و یک مبحث جدید در مورد کاوی ارتباط کیفی و همبستگی را معرفی می کند. یکی از ویژگی های منحصر به فرد این کتاب فصلی در مورد تجزیه و تحلیل داده های بزرگ و یادگیری گروهی به عنوان موضوعات مورد تاکید است. یک فصل اختصاصی در مورد نحوه پیاده سازی Data Sciencemethods با استفاده از کتابخانه های محبوب پایتون نیز در فصل ماقبل آخر گنجانده شده است. این کتاب نه تنها برای مبتدیان مفید خواهد بود، بلکه تبدیل به یک کتاب راهنما برای کسانی خواهد شد که قبلاً در علم داده، داده کاوی و حوزه های مرتبط کار می کنند. کتاب در 13 فصل تنظیم شده است. فصل 1 مفاهیم اساسی علم داده را معرفی می کند. فصل 2 به انواع داده ها، فرمت های ذخیره سازی، منابع داده و تکنیک های تولید داده می پردازد. بحث مفصلی در مورد تکنیک های آماده سازی یا پیش پردازش داده ها در فصل 3 ارائه شده است. مفهوم اساسی یادگیری ماشین در فصل 4 ارائه شده است. فصل 5 به تجزیه و تحلیل رگرسیون اختصاص دارد. فصل 6 با موضوع طبقه بندی است. شبکههای عصبی مصنوعی (ANN) و یادگیری عمیق در حال حاضر تکنیکهای محبوب و مؤثری هستند و در فصل 7 مورد بحث قرار گرفتهاند. تکنیک های انتخاب ویژگی ارائه شده در فصل 8 نحوه یافتن مجموعه ویژگی های “بهینه” را مورد بحث قرار می دهد. فصل 9 به تجزیه و تحلیل خوشه ای می پردازد. آموزش گروهی یک موضوع منحصر به فرد است که در فصل 10 معرفی شده است. انجمن-قاعده، یکی دیگر از تکنیک های تجزیه و تحلیل داده ها، در فصل 11 معرفی شده است. تجزیه و تحلیل داده های بزرگ یکی دیگر از موضوعات منحصر به فرد است که در فصل 12 ارائه شده است. در نهایت، کتاب با یک فصل مهم به پایان می رسد. در مورد کاربردهای علم داده در زندگی واقعی و یک آموزش عملی مختصر در مورد علم داده با استفاده از پایتون.
Data science is an evolving area of study that is extensively used in solving real-life problems that are empirical in nature. It is not just about machine learning, statistics, or databases. Instead, it is a comprehensive study of topics that help extract novel knowledge from data, starting with preparing the data, applying suitable intelligent learning models, and interpreting the outcome. Themodels applied are not “one-size-fits-all” and vary with the nature of the data and the applications under consideration. This book presents basic as well as advanced concepts in Data Science, along with real-life applications.We believe this book will provide students, researchers, and professionals at multiple levels with a good understanding of Data Science,Machine Learning, Big DataMining, and analytics. The overwhelming and growing need for data scientists in the industry has created the demand for extensive, easy-to-understand study materials that cover basic concepts to state-of-the-art applications of the concepts of Data Science in different domains. This book includes discussions of theoretical and practical approaches in Data Science, aiming to produce a solid understanding of the field with the ultimate aim of novel knowledge discovery. It contains an indepth discussion on some essential topics for Data Science projects. It starts with an introduction to data types, sources, and generation pipelines. It presents a detailed discussion of various data-preparation steps and techniques. Prepared data are then analyzed through predictive and descriptive data-analysis techniques. The book includes a systematic presentation of many predictive and descriptive learning algorithms, including recent developments that have successfully handled large datasets with high accuracy. It presents a detailed discussion ofMachine-Learning techniques and evaluation methods. Several chapters cover regression analysis, classification techniques, artificial neural networks, and deep-learning models. The cluster-analysis chapter starts with various proximity measures, followed by an introduction to several clustering techniques. The chapter also covers biclustering techniques with cluster-validation measures. The chapter on association-rulemining introduces the basic idea of frequent itemset mining, and a new topic on qualitative and correlation association mining. A unique feature of this book is a chapter on Big Data analysis and Ensemble Learning as emphasized topics. A dedicated chapter on how Data Sciencemethods can be implemented using popular Python libraries is also included in the penultimate chapter. This book will not only be useful for beginners, it will also become a handbook for those already working in Data Science, DataMining, and related areas. The book is organized into 13 chapters. Chapter 1 introduces the basic concepts of Data Science. Chapter 2 deals with data types, storage formats, data sources, and datageneration techniques. A detailed discussion of data preparation or preprocessing techniques is presented in Chapter 3. The basic concept of Machine Learning is presented in Chapter 4. Chapter 5 is dedicated to Regression Analysis. Chapter 6 is on the topic of Classification. Artificial Neural Networks (ANN) and Deep Learning are currently popular and effective techniques, and are discussed in Chapter 7. Classification requires a “best set” of features to work optimally. Feature-Selection techniques presented in Chapter 8 discuss howto find the “optimal” feature set. Chapter 9 deals with Cluster Analysis. Ensemble Learning is a unique topic introduced in Chapter 10. Association-rulemining, another data-analytics technique, is introduced in Chapter 11. Big Data analysis is another unique topic that is presented in Chapter 12. Finally, the book ends with a significant chapter on applications of Data Science in real life and a brief hands-on tutorial on Data Science using Python.
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:
Download: Fundamentals of Data Science
نظرات کاربران