- عنوان کتاب: Data Science First -Using Language Models in AI-Enabled Applications
- نویسنده: John Hawkins
- حوزه: علوم داده
- سال انتشار: 2026
- تعداد صفحه: 498
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 6.92 مگابایت
مدلهای زبان بزرگ (LLM) یک مرز غیرمعمول در توسعه هوش مصنوعی (AI) هستند. به لطف چتباتهای تجاری مانند ChatGPT، Claude، Gemini، Perplexity و Grok، این مدلها از حباب بحثهای فنی خارج شدهاند و در عرض چند سال کوتاه به مفهومی آشنا برای تقریباً هر انسانی روی کره زمین تبدیل شدهاند. مهندسان یادگیری ماشین و دانشمندان داده به کار با تکنیکهایی عادت دارند که افراد بسیار کمی در مورد آنها شنیدهاند. بنابراین، این یک نوع سازگاری است که تمام دنیا در مورد حوزه شما با پاسخهایی از اشتیاق وجدآمیز گرفته تا ترس مطلق و بدبینی صحبت کنند. از برخی جهات، این هیجان موجه است. ما به طور همزمان از موانع متعدد در هوش مصنوعی عبور کردهایم و در طیف وسیعی از وظایف پیشرفت سریعی داشتهایم. اما در عین حال، روشی که ما با یادگیری ماشین به طور قابل اعتمادی مشکلات را حل میکنیم، اساساً تغییر نکرده است. وظیفه دشوار بسیاری از افراد فنی در حال حاضر، تعیین روش صحیح برای گنجاندن مدلهای زبانی در روشهای کار و راهحلهایی است که میسازند، در حالی که نظرات افراطی مدیران غیرفنی خود را دور نگه میدارند. هدف این کتاب کمک به شما در حل این مشکلات است. این کتاب کاربردهای بالقوه مدلهای زبانی را توضیح میدهد، روشهای زیادی برای ارزیابی آنها را مورد بحث قرار میدهد و الگوهای طراحی مناسب برای کاربردهای علم داده شما را توصیف میکند. برای دستیابی به اهداف این کتاب، باید چندین ایده مهم را بیان کنیم. ما کتاب را با سه فصل که زمینهساز هستند، شروع میکنیم. فصل اول منظور ما از اصطلاح مدل زبانی را توضیح میدهد و تاریخچه تحولاتی را که ما را به مدلهای زبانی بزرگ مدرن رسانده است، بررسی میکند. این فصل اصطلاحات اصلی زیادی را معرفی میکند و از طریق بحث در مورد معماریهای مدل و فرآیندهای آموزشی، قصد دارد شهودهایی در مورد اینکه مدلهای زبانی از انواع مختلف برای چه مواردی میتوانند استفاده شوند، ایجاد کند. چیزی که این فصل را دشوار میکند این است که پیشرفتهای مدلهای زبانی احتمالاً هنوز کامل نشدهاند. این فصل ناگزیر شامل برخی از مدلها یا تکنیکهایی خواهد بود که از زمان نوشتن این کلمات پدیدار شدهاند یا در آن زمان به سادگی از توجه من دور ماندهاند. با این حال، نوآوریهای اصلی پشت مدلهای زبانی در حال حاضر به اندازه کافی توسعه یافتهاند که میتوانیم الگوهای کاربردی را استخراج کنیم که احتمالاً مرتبط باقی خواهند ماند. فصل 2 طیف گستردهای از کتابخانهها، بستهها و مدلهای خاص را که در سراسر کتاب استفاده میشوند، مرور میکند. این موارد شامل رویکردهای متنباز و اختصاصی برای استفاده از مدلهای زبانی است و چارچوبهایی را ایجاد میکند که برای افرادی که برنامههای کاربردی را از یک لایه پایه از مدلهای زبانی مختلف میسازند، طراحی شدهاند. این فصل دوباره اصطلاحات و مفاهیم برنامهنویسی مهمی را معرفی میکند که در طول فصلهای کتاب، جایی که شروع به بررسی برنامههای کاربردی خاص میکنیم، استفاده میشوند. فصل پایانی از سه فصل مقدماتی، به برخی از اصول اصلی علم داده میپردازد که باید هنگام ساخت با مدلهای زبانی در نظر داشته باشید. ایده این فصل، معرفی یا بهروزرسانی این ایدههای علم داده است تا بر آنچه در مورد استفاده از این فناوری جدید مهم است، تأکید شود. نکته کلیدی این است که این مدلها خروجی تولید میکنند که اساساً تصادفی است و نیاز به تکنیکهای ارزیابی دارند که به دنبال کاهش تأثیر این تصادفی بودن بر کاربران برنامه شما هستند. سپس بقیه کتاب بر استراتژیهای کلی مختلف برای استفاده از مدلهای زبانی در کار علم داده تمرکز میکند و با ابتداییترین ایده استخراج و استفاده از بردارهای معنایی از متن خام شروع میشود. هر یک از این فصلهای استراتژی بر اساس ایدههای فصلهای قبلی بنا میشوند، تا زمانی که به دنبال روشهای پیچیده برای خودکارسازی بخشهایی از گردش کار علم داده شما یا ساخت برنامههای کاربردی علم داده سفارشی باشیم. خوانندگانی که با چشمانداز مدلهای زبانی و کار علوم داده آشناتر هستند، میتوانند در صورت علاقه، بین فصلها جابهجا شوند. به خوانندگانی که در کار با مدلهای زبانی به صورت برنامهنویسی یا مفاهیم علوم داده تازهکار هستند، توصیه میشود از فصلهای اولیه شروع کنند، زیرا این فصلها به درک فصلهای بعدی کمک زیادی خواهند کرد. تمام مثالهای این کتاب با استفاده از یک مک اپل یا به صورت اسکریپت در دستگاههای لینوکس مبتنی بر ابر ایجاد و اجرا شدهاند. مثالهای کد با استفاده از نسخههای مختلف پایتون ۳، از ۳.۱۰ تا ۳.۱۳، توسعه داده شدهاند. توصیه میکنیم برای اجرا و آزمایش همه مثالها، یک محیط مجازی ایجاد کنید تا مطمئن شوید که کتابخانههای مورد نیاز با تنظیمات موجود شما تداخل ندارند. مدیریت بستهها و محیطهای پایتون با استفاده از ابزارهای استاندارد pip و venv مورد بحث قرار گرفته است. در فرآیند نوشتن کتاب، من شخصاً برای هر دوی این کارها به استفاده از uv روی آوردهام. برای حفظ انسجام، این تغییر را از کتاب حذف کردهام. من خواننده را تشویق میکنم که uv را در نظر بگیرد و در صورت لزوم، تلاش کند تا مثالها را تطبیق دهد. در طول دوره تدوین کتاب، برخی از مدلهای اختصاصی مورد استفاده در
Large Language Models (LLMs) are an unusual frontier in the development of artificial intelligence (AI). Thanks to commercial chatbots like ChatGPT, Claude, Gemini, Perplexity, and Grok, they have escaped from the bubble of technical discussion and become a familiar concept to almost every human on the planet in the span of a few short years. Machine learning engineers and data scientists are accustomed to working with techniques that very few people have heard of. So, it is something of an adjustment to have the whole world talking about your field with responses ranging from ecstatic enthusiasm to abject fear and doom mongering. In some sense, this excitement is warranted. We have broken through multiple barriers in AI simultaneously and made rapid progress on a broad range of tasks. But at the same time, the way we reliably solve problems with machine learning has not fundamentally changed. The difficult task for many technical people at present is to determine the right way to incorporate language models into their ways of working and the solutions they build, while they keep at bay the extreme opinions of their non-technical managers. This book aims to help you solve those problems. It explains the potential applications of language models, discusses many ways to evaluate them, and describes appropriate design patterns for your data science applications. To achieve the goals of this book, we need to convey several important ideas. We start the book with three chapters that lay the groundwork. The first explains what we mean by the term language model and reviews the history of developments that brought us to modern large language models. This chapter introduces lots of core terminology, and through a discussion of model architectures and training processes, it aims to build some intuitions about what language models of different kinds can be used for. What makes this chapter difficult is that the advancements of language models are likely not yet complete. It will inevitably contain some omissions of models or techniques that have emerged since I wrote these words or simply escaped my attention at the time. However, the core innovations behind language models are already well developed enough that we can derive patterns of application which will likely remain relevant. Chapter 2 overviews a wide range of specific libraries, packages, and models that are used throughout the book. These include open-source and proprietary approaches to using language models and will build up to frameworks designed for people building applications from a base layer of different language models. This chapter again introduces important terminology and programming concepts that are used throughout the chapters of the book where we start looking at specific applications. The final of the three introductory chapters delves into some core data science principles that you should keep in mind when building with language models. The idea of this chapter is to introduce, or refresh, these data science ideas to emphasize what is important about using this new technology. Key to this is the observation that these models produce output that is fundamentally stochastic and require evaluation techniques that seek to mitigate the impact of this randomness on your application users. The remainder of the book then focuses on different general strategies for using language models in data science work, starting with the most primitive idea of extracting and using semantic vectors from raw text. Each of these strategy chapters builds on the ideas of previous chapters, until we are looking at sophisticated methods for automating parts of your data science workflow or building custom data science applications. Readers who are more familiar with the landscape of language models and data science work should feel free to move between the chapters as interest takes them. Those readers new to working with language models programmatically, or to data science concepts, are encouraged to start with the initial chapters, as they will greatly aid in comprehension of the later chapters. All examples in this book were created and executed using either an Apple Mac or executed as scripts on cloud-based Linux machines. The code examples have been developed using different versions of Python 3, ranging from 3.10 to 3.13. We recommend that you create a virtual environment for the execution and testing of all examples to ensure that the required libraries do not interfere with your existing setup. The management of Python packages and environments is discussed using the standard tools of pip and venv. In the process of writing the book, I have personally switched to using uv for both these tasks. For the sake of consistency, I have omitted that change from the book. I do encourage the reader to consider adopting uv and make the effort to adapt the examples where necessary. Through the course of the book’s development, some of the proprietary models used in the examples have been deprecated. This means you will not be able to use those exact models and will need to modify the scripts to use a more recent model. In our testing, this indicated some changes in performance, both improvements and degradations. This highlights one of the problems with choosing proprietary models for building robust systems—reliability requires using models that are under your control. Finally, we have used many different packages and frameworks in the examples of this book. The intention is not to encourage use of one platform over another, but to quickly demonstrate key ideas and patterns as simply as possible. The application design principles are more important that the specific libraries we are demonstrating.__
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:
Download: Data Science First





نظرات کاربران