- عنوان کتاب: The Kaggle Book -Master data science competitions with machine learning, GenAI, and LLMs, 2nd Edition
- نویسنده: Luca Massaron, Bojan Tunguz, Konrad Banachewicz
- حوزه: پلتفورم Kaggle
- سال انتشار: 2025
- تعداد صفحه: 1007
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 11.0 مگابایت
با سالها رقابت در Kaggle، ما در بسیاری از مسابقات فراز و نشیبهایی را تجربه کردهایم. در طول این مسیر طولانی، اغلب متوجه میشدیم که تلاشهایمان را بر فعالیتهای مختلف مرتبط با Kaggle متمرکز میکنیم. با گذشت زمان، ما نه تنها خود را وقف مسابقات کردیم، بلکه بر اساس خواستههای بازار علم داده و آرزوهای حرفهای خودمان، به ایجاد محتوا و کد نیز پرداختیم. پس از نقطهای خاص در سفرمان، احساس کردیم که تجربه ترکیبی ما و اشتیاق سوزانمان برای مسابقات میتواند واقعاً به سایر شرکتکنندگانی که تازه شروع کردهاند یا میخواهند الهام بگیرند و تصمیم به شروع بگیرند، کمک کند و به آنها امکان دسترسی به تخصص ضروری مورد نیاز برای شروع سفر خود در مسابقات علم داده را بدهد. سپس تصمیم گرفتیم روی کتابی در مورد Kaggle با یک هدف کار کنیم: ارائه بهترین نکات برای رقابتپذیری و مواجهه با اکثر مشکلاتی که ممکن است هنگام شرکت در Kaggle و همچنین سایر مسابقات علوم داده با آنها مواجه شوید، در یک مکان واحد. ارائه پیشنهادات کافی برای اینکه هر کسی بتواند حداقل به سطح متخصص در هر رشته Kaggle برسد: مسابقات، مجموعه دادهها، دفترچه یادداشتها یا بحثها. ارائه نکاتی در مورد چگونگی بهرهبرداری حداکثری از Kaggle و بهرهبرداری از این تجربه برای رشد حرفهای در علوم داده. جمعآوری مهمترین دیدگاهها در مورد تجربه شرکت در مسابقات در یک منبع واحد با مصاحبه با اساتید و استادان بزرگ Kaggle و گوش دادن به داستانها و پیشنهادات آنها. به طور خلاصه، ما کتابی نوشتهایم که نشان میدهد چگونه میتوان با موفقیت در مسابقات شرکت کرد و از تمام فرصتهایی که Kaggle ارائه میدهد، بهره برد. در اینجا ویرایش دوم این کتاب را با فصلها و محتوای بهروز شده ارائه میدهیم. هدف این کتاب ارائه کمکهای بیشتر در چشماندازی در حال تحول است، جایی که در کنار مسابقات تثبیتشدهی دادههای جدولی، سریهای زمانی، بینایی کامپیوتر و NLP، تعداد فزایندهای از مسابقات حول محور AutoML و مدلهای قدرتمند زبان بزرگ (LLM) وجود دارد. این مسابقات LLM جدیدتر نیاز به مهارتهایی در مدلهای تنظیم دقیق مانند Llama، Mistral، Gemma، Qwen و DeepSeek برای وظایف خاص دارند. همانند نسخه قبلی، این کتاب نیز به عنوان یک مرجع عملی برای صرفهجویی در زمان و تلاش شما در نظر گرفته شده است، به لطف انتخاب بسیاری از نکات و ترفندهای مسابقه که یادگیری و یافتن آنها در اینترنت یا انجمنهای Kaggle دشوار است. با این وجود، این کتاب خود را به ارائه کمکهای عملی محدود نمیکند. همچنین تلاش میکند تا به شما کمک کند تا بفهمید چگونه با شرکت در مسابقات، حرفه خود را در علم داده ارتقا دهید. لطفاً توجه داشته باشید که این کتاب علم داده را از پایه آموزش نمیدهد. ما توضیحات مفصلی در مورد رگرسیون خطی، جنگلهای تصادفی یا توابع تقویتکننده گرادیان ارائه نمیدهیم. در عوض، ما بر نحوه استفاده مؤثر از این روشها برای دستیابی به بهترین نتایج در مسائل مربوط به داده تمرکز میکنیم. ما انتظار داریم خوانندگان ما پایه محکمی در مباحث علم داده و حداقل مهارت اولیه در استفاده از پایتون داشته باشند. اگر هنوز در علم داده مبتدی هستید، باید این کتاب را با سایر کتابهای درسی علم داده، یادگیری ماشین و یادگیری عمیق تکمیل کنید و در دورههای آنلاین، مانند دورههای ارائه شده توسط خود Kaggle یا دورههای آنلاین باز گسترده (MOOC) مانند edX یا Coursera، آموزش ببینید. اگر میخواهید دانش علم داده خود را از طریق تجربه عملی تقویت کنید، خود را با مسائل جذاب داده به چالش بکشید و همزمان شبکهای از دانشمندان داده همکار به همان اندازه پرشور خود بسازید، قطعاً این کتاب برای شما مناسب است.
Having competed on Kaggle for so many years, we have experienced highs and lows in many competitions. While on this long journey, we often found ourselves refocusing our efforts on different activities related to Kaggle. Over time, we devoted ourselves not only to competitions but also to creating content and code based on the demands of the data science market and our own professional aspirations. After a certain point in our journey, we started to feel that our combined experience and still-burning passion for competitions could really help other participants who have just begun or who would like to get inspired and make the decision to start, by giving them access to the essential expertise they need to begin their own journey in data science competitions. We then decided to work on a book on Kaggle with a purpose: To offer, in a single place, the best tips for being competitive and approaching most of the problems you may find when participating in Kaggle as well as other data science competitions To offer enough suggestions to allow anyone to reach at least the Expert level in any Kaggle discipline: Competitions, Datasets, Notebooks, or Discussions To provide tips on how to get the most out of Kaggle and leverage this experience for professional growth in data science To gather the most significant perspectives on the experience of participating in competitions in a single source by interviewing Kaggle Masters and Grandmasters and listening to their stories and suggestions In short, we have wrien a book that demonstrates how to participate in competitions successfully and take advantage of all the opportunities Kaggle offers. We present here the second edition of this book, with updated chapters and content. It aims to provide even more help in an evolving landscape where, alongside the established tabular data, time series, computer vision, and NLP competitions, there is a growing number of competitions revolving around AutoML and powerful Large Language Models (LLMs). These newer LLM competitions require skills in fine-tuning models like Llama, Mistral, Gemma, Qwen, and DeepSeek for specific tasks. As in the previous edition, this book is also intended as a practical reference to save you time and effort, thanks to its selection of many competition tips and tricks that are hard to learn about and find on the internet or on Kaggle forums. Nevertheless, the book doesn’t limit itself to providing practical help; it also aspires to help you figure out how to boost your career in data science by participating in competitions. Please note that this book does not teach data science from the ground up. We do not provide detailed explanations of linear regression, random forests, or gradient-boosting functions. Instead, we focus on how to use these methods effectively to achieve the best results in data-related problems. We expect our readers to have a solid foundation in data science topics and at least a basic proficiency in Python usage. If you are still a data science beginner, you must supplement this book with other data science, machine learning, and deep learning textbooks and train on online courses, such as those offered by Kaggle itself or by Massive Open Online Courses (MOOCs) such as edX or Coursera. If you want to practically strengthen your data science knowledge through hands-on experience, challenge yourself with intriguing data problems, and simultaneously build a network of fellow data scientists as passionate as you are, then this is definitely the book for you.
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:
Download: The Kaggle Book

نظرات کاربران