مجله علمی تفریحی بیبیس
0

دانلود کتاب مقدمه ای بر علم داده

بازدید 800
  • عنوان کتاب: Introduction to Data Science
  • نویسنده: Gaoyan Ou,
  • حوزه: علوم داده
  • سال انتشار: 2024
  • تعداد صفحه: 445
  • زبان اصلی: انگلیسی
  • نوع فایل: pdf
  • حجم فایل: 32.9 مگابایت

علم داده یک رشته نوظهور است که بر پرورش استعدادهای داده های بزرگ با توانایی بین رشته ای تأکید دارد. چنین استعدادهایی باید دارای سه توانایی زیر باشند: توانایی نظری (مانند توانایی درک و استفاده از الگوریتم‌ها و مدل‌ها)، توانایی عملی (مانند توانایی پردازش داده‌های واقعی) و توانایی کاربردی (مانند توانایی استفاده از داده‌های بزرگ حل مشکلات عملی در صنایع خاص). تربیت چنین استعدادهایی مستلزم همکاری نزدیک بین رشته های ریاضی، آمار، علوم کامپیوتر و سایر رشته ها و همچنین همکاری نزدیک با شرکای صنعتی و صاحبان داده است. دوره های علوم داده نیز باید روش های جدید ترکیب تئوری و عمل را مانند دوره های فیزیک، شیمی و زیست شناسی اتخاذ کنند. برای اکثر دوره های علوم داده، ما به یک پلتفرم آزمایشی نیاز داریم که مشکلات عملی، مجموعه داده ها، و همچنین پردازش داده ها و ابزارهای تحلیلی اولیه را ارائه دهد. به منظور مقابله با چالش‌های آموزش معلمان، ساخت برنامه‌های درسی و توسعه منابع آموزشی، مؤسسه تحقیقات داده‌های بزرگ پکن کالج کلان داده بویا را تأسیس کرد تا زیرساخت‌های مورد نیاز برای پرورش استعدادهای کلان داده را ایجاد کند. این زیرساخت ها شامل برنامه درسی جدید، کتاب های درسی، بسترهای آزمایشی و روش های آموزشی و غیره است. در سال های اخیر، کالج کلان داده بویا با موفقیت یک سیستم کامل برنامه درسی کلان داده را ایجاد کرده است. دوره ها به سه بخش تقسیم می شوند: دروس پایه، دروس اصلی و دروس انتخابی. دروس فاندامنتال شامل مبانی ریاضی تجزیه و تحلیل کلان داده، پایه پایتون برای مدیریت داده های بزرگ و داده ها و … دروس اصلی شامل جمع آوری داده ها و خزنده وب، پاکسازی داده ها، تجسم داده ها، مقدمه ای بر علم داده، یادگیری ماشین و محاسبات توزیع شده و غیره انتخابی است. دوره ها شامل یادگیری عمیق، نمودار دانش، متن کاوی، علوم داده های سلامت، علوم داده های حمل و نقل و علوم داده های مالی و غیره. کالج کلان داده بویا یک پلتفرم آزمایشی علم داده به نام iDataCourse ساخته است که به طور گسترده توسط دانشگاه های چین مورد استفاده قرار گرفته است. مقدمه بر علم داده اولین کتاب درسی کالج کلان داده بویا است. هدف آن معرفی جامع مدل ها و الگوریتم ها در علم داده از نقطه نظر فنی است. این کتاب به طور سیستماتیک محتوای نظری پایه علم داده شامل پیش پردازش داده ها، روش های اساسی تجزیه و تحلیل داده ها، پردازش مسائل خاص (مانند تجزیه و تحلیل متن)، یادگیری عمیق و سیستم های توزیع شده را معرفی می کند. علاوه بر این، این کتاب تعداد زیادی از مطالعات موردی را برای تمرین کاربردی تجزیه و تحلیل داده ها ارائه می دهد. دانش آموزان می توانند آموزش عملی انجام دهند و با داده ها در پلت فرم iData-Course تعامل داشته باشند. مربیان می‌توانند تمرین‌های آنلاین را به عنوان تکلیف اختصاص دهند و گزارش‌های بازخورد را دریافت کنند، که حجم کار آنها را تا حد زیادی کاهش می‌دهد. خوانندگان می توانند برای دسترسی به این موارد و منابع عملی به iDataCourse مراجعه کنند. این کتاب حاصل همکاری است. Gaoyan Ou مسئول نوشتن پیش پردازش داده ها، مدل طبقه بندی، مدل مجموعه، استخراج قوانین انجمن، کاهش ابعاد، تجزیه و تحلیل متن، محاسبات توزیع شده و فصل های پیوست است. Zhanxing Zhu مسئول نوشتن مدل رگرسیون، مدل خوشه‌بندی، انتخاب ویژگی، الگوریتم EM، مدل گرافیکی احتمالی و فصل‌های یادگیری عمیق است. بن دونگ کتاب درسی را مرور کرد و پیشنهادهای ارزشمند بسیاری ارائه کرد. وینان ای مسئول برنامه ریزی و سازماندهی کتاب و همچنین بازنگری فصل ها و نوشتن مقدمه است. لی زو (از موسسه فناوری کامپیوتر وانگ ژوان دانشگاه پکن) و پنگ پنگ (از دانشکده علوم و مهندسی اطلاعات دانشگاه هونان) مسئول نوشتن اولین پیش نویس فصل تجزیه و تحلیل نمودار و شبکه هستند. Jiahao Yao، Xinhang Yu، Jia Chen و Wenjia Wang (دانشجویان رشته علوم داده از دانشگاه پکن) مسئول بررسی اولین پیش نویس کتاب هستند. Xiaodong Yan و Yang Gao (تحلیلگران داده کالج Boya Big Data) مسئول نوشتن موارد عملی هستند. Xiaotong Dai (طراح رابط کاربری Boya Big Data College) مسئول تولید بیشتر فیگورهای اصلی کتاب است.

Data science is an emerging discipline which emphasizes the cultivation of big data talents with interdisciplinary ability. Such talents should have the following three abilities: theoretical ability (such as the ability to understand and use algorithms and models), practical ability (such as the ability to process real data) and applicative ability (such as the ability to use big data to solve practical problems in specific industries). Training such talents requires close cooperation among the disciplines of mathematics, statistics, computer science and others, as well as close cooperation with industrial partners and data owners. Data science courses also need to adopt the new methods of combining theory and practice, just like physics, chemistry and biology courses. For most data science courses, we need an experimental platform that provides practical problems, datasets, as well as basic data processing and analytical tools. In order to meet the challenges of training teachers, constructing curricula and developing teaching resources, Beijing Institute of Big Data Research established Boya Big Data College to establish the infrastructures needed for the cultivation of big data talents. These infrastructures include new curriculum, textbooks, experimental platforms and instructional methods, etc. In recent years, Boya Big Data College has successfully established a complete big data curriculum system. Courses are divided into three modules: fundamental courses, core courses and elective courses. Fundamental courses include Mathematical Basis of Big Data Analysis, Python Basis for Big Data and Data Management, etc. Core courses include Data Acquisition and Web Crawler, Data Cleaning, Data Visualization, Introduction to Data Science, Machine Learning and Distributed Computing, etc. Elective courses include Deep Learning, Knowledge Graph, Text Mining, Health Data Science, Transportation Data Science and Financial Data Science, etc. Boya Big Data College has built a data science experimental platform named iDataCourse, which has been widely used by universities in China. Introduction to Data Science is the first textbook by Boya Big Data College. Its purpose is to comprehensively introduce models and algorithms in data science from a technical point of view. This book systematically introduces the basic theoretical content of data science, including data preprocessing, basic methods of data analysis, processing of special problems (such as text analysis), deep learning, and distributed systems. In addition, this book provides a large number of case studies for data analysis application practice. Students can conduct practical training and interact with data on the iData- Course platform. Instructors can assign the online practices as homework and receive feedback reports, greatly reducing their workload. Readers can visit iDataCourse to access these practical cases and resources. This book is the result of collaboration. Gaoyan Ou is responsible for writing the data preprocessing, classification model, ensemble model, association rule mining, dimensionality reduction, text analysis, distributed computing and appendix chapters. Zhanxing Zhu is responsible for writing the regression model, clustering model, feature selection, EM algorithm, probabilistic graphical model and deep learning chapters. Bin Dong reviewed the textbook and put forward many valuable suggestions. Weinan E is in charge of planning and organization the book, as well as revising the chapters, and for writing the introduction. Lei Zou (from the Wangxuan Institute of Computer Technology of Peking University) and Peng Peng (from the School of Information Science and Engineering of Hunan University) are responsible for writing the first draft of the graph and network analysis chapter. Jiahao Yao, Xinhang Yu, Jia Chen and Wenjia Wang (students majoring in data science from Peking University) are responsible for reviewing the first draft of the book. Xiaodong Yan and Yang Gao (data analysts of Boya Big Data College) are responsible for writing the practical cases. Xiaotong Dai (UI designer of Boya Big Data College) is responsible for producing most of the original figures in the book.

این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:

Download: Introduction to Data Science

نظرات کاربران

  •  چنانچه دیدگاه شما توهین آمیز باشد تایید نخواهد شد.
  •  چنانچه دیدگاه شما جنبه تبلیغاتی داشته باشد تایید نخواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

بیشتر بخوانید