- عنوان کتاب: Data Science from Scratch – First Principles with Python
- نویسنده: Joel Grus
- حوزه: علوم داده
- سال انتشار: 2019
- تعداد صفحه: 513
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 10.3 مگابایت
دانشمند داده را “جذاب ترین شغل قرن بیست و یکم” می نامند، احتمالاً توسط فردی که هرگز به ایستگاه آتش نشانی مراجعه نکرده است. با این وجود، علم داده حوزه داغ و رو به رشدی است و برای یافتن تحلیلگرانی که پیش بینی می کنند طی 10 سال آینده، به میلیاردها و میلیاردها دانشمند داده بیشتر از آنچه که در حال حاضر داریم نیاز خواهیم داشت، نیازی به جستجوی زیاد نیست. اما علم داده چیست؟ از این گذشته، اگر ندانیم علم داده چیست، نمیتوانیم دانشمندان داده تولید کنیم. با توجه به نمودار ون که تا حدودی در صنعت معروف است، علم داده در نقطه تلاقی این موارد قرار دارد: مهارت های هک، دانش ریاضی و آمار، تخصص اساسی اگرچه در ابتدا قصد داشتم کتابی بنویسم که هر سه مورد را پوشش دهد، به سرعت متوجه شدم که درمان کامل با “ تخصص اساسی» به ده ها هزار صفحه نیاز دارد. در آن زمان تصمیم گرفتم روی دو مورد اول تمرکز کنم. هدف من کمک به شما برای توسعه مهارت های هک است که برای شروع به انجام علم داده نیاز دارید. و هدف من این است که به شما کمک کنم با ریاضیات و آماری که در هسته علم داده قرار دارند راحت باشید. این یک آرزوی سنگین برای یک کتاب است. بهترین راه برای یادگیری مهارت های هک، هک کردن چیزها است. با خواندن این کتاب، درک خوبی از روشی که من چیزها را هک می کنم به دست خواهید آورد، که ممکن است لزوماً بهترین راه برای هک کردن چیزها نباشد. شما درک خوبی از برخی از ابزارهایی که من استفاده می کنم به دست خواهید آورد، که لزوماً بهترین ابزار برای استفاده شما نخواهند بود. شما درک خوبی از نحوه برخورد من با مشکلات داده بدست خواهید آورد، که ممکن است لزوماً بهترین راه برای شما برای برخورد با مشکلات داده نباشد. هدف (و امید) این است که مثالهای من به شما الهام میدهد تا کارها را به روش خودتان امتحان کنید. تمام کدها و داده های کتاب در GitHub برای شروع کار موجود است. به طور مشابه، بهترین راه برای یادگیری ریاضیات، انجام ریاضیات است. این قاطعانه یک کتاب ریاضی نیست، و در بیشتر موارد، ما «ریاضیات انجام نمیدهیم». با این حال، شما واقعاً نمی توانید علم داده را بدون درک احتمالات و آمار و جبر خطی انجام دهید. این بدان معنی است که، در صورت لزوم، به معادلات ریاضی، شهود ریاضی، بدیهیات ریاضی و نسخه های کارتونی ایده های بزرگ ریاضی می پردازیم. امیدوارم از شیرجه رفتن با من نترسید. در کل، من همچنین امیدوارم به شما این حس را بدهم که بازی با داده ها سرگرم کننده است، زیرا، خوب، بازی با داده ها سرگرم کننده است! (به خصوص در مقایسه با برخی از گزینه ها، مانند تهیه مالیات یا استخراج زغال سنگ.)
Data scientist has been called “the sexiest job of the 21st century,” presumably by someone who has never visited a fire station. Nonetheless, data science is a hot and growing field, and it doesn’t take a great deal of sleuthing to find analysts breathlessly prognosticating that over the next 10 years, we’ll need billions and billions more data scientists than we currently have. But what is data science? After all, we can’t produce data scientists if we don’t know what data science is. According to a Venn diagram that is somewhat famous in the industry, data science lies at the intersection of: Hacking skills Math and statistics knowledge Substantive expertise Although I originally intended to write a book covering all three, I quickly realized that a thorough treatment of “substantive expertise” would require tens of thousands of pages. At that point, I decided to focus on the first two. My goal is to help you develop the hacking skills that you’ll need to get started doing data science. And my goal is to help you get comfortable with the mathematics and statistics that are at the core of data science. This is a somewhat heavy aspiration for a book. The best way to learn hacking skills is by hacking on things. By reading this book, you will get a good understanding of the way I hack on things, which may not necessarily be the best way for you to hack on things. You will get a good understanding of some of the tools I use, which will not necessarily be the best tools for you to use. You will get a good understanding of the way I approach data problems, which may not necessarily be the best way for you to approach data problems. The intent (and the hope) is that my examples will inspire you to try things your own way. All the code and data from the book is available on GitHub to get you started. Similarly, the best way to learn mathematics is by doing mathematics. This is emphatically not a math book, and for the most part, we won’t be “doing mathematics.” However, you can’t really do data science without some understanding of probability and statistics and linear algebra. This means that, where appropriate, we will dive into mathematical equations, mathematical intuition, mathematical axioms, and cartoon versions of big mathematical ideas. I hope that you won’t be afraid to dive in with me. Throughout it all, I also hope to give you a sense that playing with data is fun, because, well, playing with data is fun! (Especially compared to some of the alternatives, like tax preparation or coal mining.)
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:
Download: Data Science from Scratch
نظرات کاربران