مجله علمی تفریحی بیبیس
0

دانلود کتاب راهنمای علوم داده پایتون

بازدید 1371
  • عنوان کتاب: Python Data Science Handbook
  • نویسنده: Jake VanderPlas
  • حوزه: برنامه نویسی پایتون
  • سال انتشار: 2023
  • تعداد صفحه: 591
  • زبان اصلی: انگلیسی
  • نوع فایل: pdf
  • حجم فایل: 19.6 مگابایت

این کتاب در مورد انجام علم داده با پایتون است که بلافاصله این سوال را مطرح می کند: علم داده چیست؟ مشخص کردن این تعریف بسیار سخت است، به خصوص با توجه به اینکه این اصطلاح چقدر فراگیر شده است. منتقدان صدادار آن را به‌عنوان یک برچسب زائد (بالاخره، چه علمی شامل داده‌ها نمی‌شود؟) یا یک کلمه ساده که فقط برای رزومه کاری وجود دارد و نظر استخدام‌کنندگان بیش از حد فناوری را جلب می‌کند، رد کرده‌اند. در ذهن من، این نقدها چیز مهمی را از دست می دهند. علم داده، علیرغم روکش هایپلادین آن، شاید بهترین برچسبی است که ما برای مجموعه مهارت های بین رشته ای داریم که در بسیاری از کاربردها در صنعت و دانشگاه اهمیت فزاینده ای پیدا می کنند. این قطعه بین رشته ای کلیدی است: به نظر من، بهترین تعریف موجود از علم داده توسط نمودار ون علم داده درو کانوی که برای اولین بار در سپتامبر 2010 در وبلاگ او منتشر شد، نشان داده شده است. در حالی که برخی از برچسب های تقاطع کمی زبانی هستند. -چنین، این نمودار جوهر آنچه را که فکر می کنم مردم وقتی می گویند «علم داده» را نشان می دهد: اساساً موضوعی بین رشته ای است. علم داده شامل سه حوزه متمایز و همپوشانی است: مهارت های آماردانی که می داند چگونه مجموعه داده ها را مدل سازی و خلاصه کند (که روز به روز بزرگتر می شوند). مهارت های یک دانشمند کامپیوتر که می تواند الگوریتم هایی را برای ذخیره، پردازش و تجسم موثر این داده ها طراحی و استفاده کند. و تخصص حوزه – چیزی که ما ممکن است به عنوان آموزش “کلاسیک” در یک موضوع در نظر بگیریم – هم برای فرمول بندی سوالات درست و هم برای قرار دادن پاسخ های آنها در متن ضروری است. با در نظر گرفتن این موضوع، من شما را تشویق می‌کنم که علم داده را نه به‌عنوان یک حوزه جدید از دانش برای یادگیری، بلکه مجموعه جدیدی از مهارت‌ها که می‌توانید در حوزه تخصصی فعلی خود به کار ببرید، در نظر بگیرید. چه در حال گزارش نتایج انتخابات، پیش‌بینی بازده سهام، بهینه‌سازی کلیک‌های تبلیغات آنلاین، شناسایی میکروارگانیسم‌ها در عکس‌های میکروسکوپی، جستجوی کلاس‌های جدیدی از اجرام نجومی یا کار با داده‌ها در هر زمینه دیگری باشید، هدف این کتاب این است که به شما این توانایی را بدهد که سوالات جدیدی در مورد حوزه موضوعی انتخابی خود بپرسید و پاسخ دهید. در تدریس خود هم در دانشگاه واشنگتن و هم در کنفرانس ها و جلسات مختلف با محوریت فناوری، یکی از رایج ترین سؤالاتی که شنیده ام این است: “چگونه باید پایتون را یاد بگیرم؟” افرادی که سؤال می‌کنند عموماً دانش‌آموزان، توسعه‌دهندگان یا محققین فنی هستند که اغلب دارای پیشینه قوی در نوشتن کد و استفاده از ابزارهای محاسباتی و عددی هستند. بیشتر این افراد به خودی خود نمی خواهند پایتون را یاد بگیرند، بلکه می خواهند این زبان را با هدف استفاده از آن به عنوان ابزاری برای علوم محاسباتی و داده فشرده یاد بگیرند. در حالی که مجموعه بزرگی از ویدیوها، پست‌های وبلاگ و آموزش‌ها برای این مخاطبان به صورت آنلاین در دسترس است، مدت‌هاست که از نبود یک پاسخ خوب واحد برای این سؤال ناامید شده‌ام. این چیزی است که الهام بخش این کتاب است. این کتاب به معنای مقدمه ای برای پایتون یا به طور کلی برنامه نویسی نیست. من فرض می‌کنم خواننده با زبان پایتون، از جمله تعریف توابع، تخصیص متغیرها، فراخوانی روش‌های اشیاء، کنترل جریان یک برنامه، و سایر وظایف اساسی آشنا است. در عوض، هدف آن کمک به کاربران پایتون است که یاد بگیرند از پشته علم داده پایتون – کتابخانه هایی مانند موارد ذکر شده در بخش زیر و ابزارهای مرتبط – برای ذخیره، دستکاری و به دست آوردن بینش موثر از داده ها استفاده کنند.

This is a book about doing data science with Python, which immediately begs the question: what is data science? It’s a surprisingly hard definition to nail down, especially given how ubiquitous the term has become. Vocal critics have variously dismissed it as a superfluous label (after all, what science doesn’t involve data?) or a simple buzzword that only exists to salt resumes and catch the eye of overzealous tech recruiters. In my mind, these critiques miss something important. Data science, despite its hypeladen veneer, is perhaps the best label we have for the cross-disciplinary set of skills that are becoming increasingly important in many applications across industry and academia. This cross-disciplinary piece is key: in my mind, the best existing definition of data science is illustrated by Drew Conway’s Data Science Venn Diagram, first published on his blog in September 2010. While some of the intersection labels are a bit tongue-in-cheek, this diagram captures the essence of what I think people mean when they say “data science”: it is fundamentally an interdisciplinary subject. Data science comprises three distinct and overlapping areas: the skills of a statistician who knows how to model and summarize datasets (which are growing ever larger); the skills of a computer scientist who can design and use algorithms to efficiently store, process, and visualize this data; and the domain expertise—what we might think of as “classical” training in a subject—necessary both to formulate the right questions and to put their answers in context. With this in mind, I would encourage you to think of data science not as a new domain of knowledge to learn, but a new set of skills that you can apply within your current area of expertise. Whether you are reporting election results, forecasting stock returns, optimizing online ad clicks, identifying microorganisms in microscope photos, seeking new classes of astronomical objects, or working with data in any other field, the goal of this book is to give you the ability to ask and answer new questions about your chosen subject area. In my teaching both at the University of Washington and at various tech-focused conferences and meetups, one of the most common questions I have heard is this: “How should I learn Python?” The people asking are generally technically minded students, developers, or researchers, often with an already strong background in writing code and using computational and numerical tools. Most of these folks don’t want to learn Python per se, but want to learn the language with the aim of using it as a tool for data-intensive and computational science. While a large patchwork of videos, blog posts, and tutorials for this audience is available online, I’ve long been frustrated by the lack of a single good answer to this question; that is what inspired this book. The book is not meant to be an introduction to Python or to programming in general; I assume the reader has familiarity with the Python language, including defining functions, assigning variables, calling methods of objects, controlling the flow of a program, and other basic tasks. Instead, it is meant to help Python users learn to use Python’s data science stack—libraries such as those mentioned in the following section, and related tools—to effectively store, manipulate, and gain insight from data.

این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:

Download: Python Data Science Handbook

نظرات کاربران

  •  چنانچه دیدگاه شما توهین آمیز باشد تایید نخواهد شد.
  •  چنانچه دیدگاه شما جنبه تبلیغاتی داشته باشد تایید نخواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.