0

دانلود کتاب علم داده در اولویت -استفاده از مدل‌های زبانی در برنامه‌های مبتنی بر هوش مصنوعی

بازدید 110
  • عنوان کتاب: Data Science First -Using Language Models in AI-Enabled Applications
  • نویسنده: John Hawkins
  • حوزه: علوم داده
  • سال انتشار: 2026
  • تعداد صفحه: 498
  • زبان اصلی: انگلیسی
  • نوع فایل: pdf
  • حجم فایل: 6.92 مگابایت

مدل‌های زبان بزرگ (LLM) یک مرز غیرمعمول در توسعه هوش مصنوعی (AI) هستند. به لطف چت‌بات‌های تجاری مانند ChatGPT، Claude، Gemini، Perplexity و Grok، این مدل‌ها از حباب بحث‌های فنی خارج شده‌اند و در عرض چند سال کوتاه به مفهومی آشنا برای تقریباً هر انسانی روی کره زمین تبدیل شده‌اند. مهندسان یادگیری ماشین و دانشمندان داده به کار با تکنیک‌هایی عادت دارند که افراد بسیار کمی در مورد آنها شنیده‌اند. بنابراین، این یک نوع سازگاری است که تمام دنیا در مورد حوزه شما با پاسخ‌هایی از اشتیاق وجدآمیز گرفته تا ترس مطلق و بدبینی صحبت کنند. از برخی جهات، این هیجان موجه است. ما به طور همزمان از موانع متعدد در هوش مصنوعی عبور کرده‌ایم و در طیف وسیعی از وظایف پیشرفت سریعی داشته‌ایم. اما در عین حال، روشی که ما با یادگیری ماشین به طور قابل اعتمادی مشکلات را حل می‌کنیم، اساساً تغییر نکرده است. وظیفه دشوار بسیاری از افراد فنی در حال حاضر، تعیین روش صحیح برای گنجاندن مدل‌های زبانی در روش‌های کار و راه‌حل‌هایی است که می‌سازند، در حالی که نظرات افراطی مدیران غیرفنی خود را دور نگه می‌دارند. هدف این کتاب کمک به شما در حل این مشکلات است. این کتاب کاربردهای بالقوه مدل‌های زبانی را توضیح می‌دهد، روش‌های زیادی برای ارزیابی آنها را مورد بحث قرار می‌دهد و الگوهای طراحی مناسب برای کاربردهای علم داده شما را توصیف می‌کند. برای دستیابی به اهداف این کتاب، باید چندین ایده مهم را بیان کنیم. ما کتاب را با سه فصل که زمینه‌ساز هستند، شروع می‌کنیم. فصل اول منظور ما از اصطلاح مدل زبانی را توضیح می‌دهد و تاریخچه تحولاتی را که ما را به مدل‌های زبانی بزرگ مدرن رسانده است، بررسی می‌کند. این فصل اصطلاحات اصلی زیادی را معرفی می‌کند و از طریق بحث در مورد معماری‌های مدل و فرآیندهای آموزشی، قصد دارد شهودهایی در مورد اینکه مدل‌های زبانی از انواع مختلف برای چه مواردی می‌توانند استفاده شوند، ایجاد کند. چیزی که این فصل را دشوار می‌کند این است که پیشرفت‌های مدل‌های زبانی احتمالاً هنوز کامل نشده‌اند. این فصل ناگزیر شامل برخی از مدل‌ها یا تکنیک‌هایی خواهد بود که از زمان نوشتن این کلمات پدیدار شده‌اند یا در آن زمان به سادگی از توجه من دور مانده‌اند. با این حال، نوآوری‌های اصلی پشت مدل‌های زبانی در حال حاضر به اندازه کافی توسعه یافته‌اند که می‌توانیم الگوهای کاربردی را استخراج کنیم که احتمالاً مرتبط باقی خواهند ماند. فصل 2 طیف گسترده‌ای از کتابخانه‌ها، بسته‌ها و مدل‌های خاص را که در سراسر کتاب استفاده می‌شوند، مرور می‌کند. این موارد شامل رویکردهای متن‌باز و اختصاصی برای استفاده از مدل‌های زبانی است و چارچوب‌هایی را ایجاد می‌کند که برای افرادی که برنامه‌های کاربردی را از یک لایه پایه از مدل‌های زبانی مختلف می‌سازند، طراحی شده‌اند. این فصل دوباره اصطلاحات و مفاهیم برنامه‌نویسی مهمی را معرفی می‌کند که در طول فصل‌های کتاب، جایی که شروع به بررسی برنامه‌های کاربردی خاص می‌کنیم، استفاده می‌شوند. فصل پایانی از سه فصل مقدماتی، به برخی از اصول اصلی علم داده می‌پردازد که باید هنگام ساخت با مدل‌های زبانی در نظر داشته باشید. ایده این فصل، معرفی یا به‌روزرسانی این ایده‌های علم داده است تا بر آنچه در مورد استفاده از این فناوری جدید مهم است، تأکید شود. نکته کلیدی این است که این مدل‌ها خروجی تولید می‌کنند که اساساً تصادفی است و نیاز به تکنیک‌های ارزیابی دارند که به دنبال کاهش تأثیر این تصادفی بودن بر کاربران برنامه شما هستند. سپس بقیه کتاب بر استراتژی‌های کلی مختلف برای استفاده از مدل‌های زبانی در کار علم داده تمرکز می‌کند و با ابتدایی‌ترین ایده استخراج و استفاده از بردارهای معنایی از متن خام شروع می‌شود. هر یک از این فصل‌های استراتژی بر اساس ایده‌های فصل‌های قبلی بنا می‌شوند، تا زمانی که به دنبال روش‌های پیچیده برای خودکارسازی بخش‌هایی از گردش کار علم داده شما یا ساخت برنامه‌های کاربردی علم داده سفارشی باشیم. خوانندگانی که با چشم‌انداز مدل‌های زبانی و کار علوم داده آشناتر هستند، می‌توانند در صورت علاقه، بین فصل‌ها جابه‌جا شوند. به خوانندگانی که در کار با مدل‌های زبانی به صورت برنامه‌نویسی یا مفاهیم علوم داده تازه‌کار هستند، توصیه می‌شود از فصل‌های اولیه شروع کنند، زیرا این فصل‌ها به درک فصل‌های بعدی کمک زیادی خواهند کرد. تمام مثال‌های این کتاب با استفاده از یک مک اپل یا به صورت اسکریپت در دستگاه‌های لینوکس مبتنی بر ابر ایجاد و اجرا شده‌اند. مثال‌های کد با استفاده از نسخه‌های مختلف پایتون ۳، از ۳.۱۰ تا ۳.۱۳، توسعه داده شده‌اند. توصیه می‌کنیم برای اجرا و آزمایش همه مثال‌ها، یک محیط مجازی ایجاد کنید تا مطمئن شوید که کتابخانه‌های مورد نیاز با تنظیمات موجود شما تداخل ندارند. مدیریت بسته‌ها و محیط‌های پایتون با استفاده از ابزارهای استاندارد pip و venv مورد بحث قرار گرفته است. در فرآیند نوشتن کتاب، من شخصاً برای هر دوی این کارها به استفاده از uv روی آورده‌ام. برای حفظ انسجام، این تغییر را از کتاب حذف کرده‌ام. من خواننده را تشویق می‌کنم که uv را در نظر بگیرد و در صورت لزوم، تلاش کند تا مثال‌ها را تطبیق دهد. در طول دوره تدوین کتاب، برخی از مدل‌های اختصاصی مورد استفاده در

Large Language Models (LLMs) are an unusual frontier in the development of artificial intelligence (AI). Thanks to commercial chatbots like ChatGPT, Claude, Gemini, Perplexity, and Grok, they have escaped from the bubble of technical discussion and become a familiar concept to almost every human on the planet in the span of a few short years. Machine learning engineers and data scientists are accustomed to working with techniques that very few people have heard of. So, it is something of an adjustment to have the whole world talking about your field with responses ranging from ecstatic enthusiasm to abject fear and doom mongering. In some sense, this excitement is warranted. We have broken through multiple barriers in AI simultaneously and made rapid progress on a broad range of tasks. But at the same time, the way we reliably solve problems with machine learning has not fundamentally changed. The difficult task for many technical people at present is to determine the right way to incorporate language models into their ways of working and the solutions they build, while they keep at bay the extreme opinions of their non-technical managers. This book aims to help you solve those problems. It explains the potential applications of language models, discusses many ways to evaluate them, and describes appropriate design patterns for your data science applications. To achieve the goals of this book, we need to convey several important ideas. We start the book with three chapters that lay the groundwork. The first explains what we mean by the term language model and reviews the history of developments that brought us to modern large language models. This chapter introduces lots of core terminology, and through a discussion of model architectures and training processes, it aims to build some intuitions about what language models of different kinds can be used for. What makes this chapter difficult is that the advancements of language models are likely not yet complete. It will inevitably contain some omissions of models or techniques that have emerged since I wrote these words or simply escaped my attention at the time. However, the core innovations behind language models are already well developed enough that we can derive patterns of application which will likely remain relevant. Chapter 2 overviews a wide range of specific libraries, packages, and models that are used throughout the book. These include open-source and proprietary approaches to using language models and will build up to frameworks designed for people building applications from a base layer of different language models. This chapter again introduces important terminology and programming concepts that are used throughout the chapters of the book where we start looking at specific applications. The final of the three introductory chapters delves into some core data science principles that you should keep in mind when building with language models. The idea of this chapter is to introduce, or refresh, these data science ideas to emphasize what is important about using this new technology. Key to this is the observation that these models produce output that is fundamentally stochastic and require evaluation techniques that seek to mitigate the impact of this randomness on your application users. The remainder of the book then focuses on different general strategies for using language models in data science work, starting with the most primitive idea of extracting and using semantic vectors from raw text. Each of these strategy chapters builds on the ideas of previous chapters, until we are looking at sophisticated methods for automating parts of your data science workflow or building custom data science applications. Readers who are more familiar with the landscape of language models and data science work should feel free to move between the chapters as interest takes them. Those readers new to working with language models programmatically, or to data science concepts, are encouraged to start with the initial chapters, as they will greatly aid in comprehension of the later chapters. All examples in this book were created and executed using either an Apple Mac or executed as scripts on cloud-based Linux machines. The code examples have been developed using different versions of Python 3, ranging from 3.10 to 3.13. We recommend that you create a virtual environment for the execution and testing of all examples to ensure that the required libraries do not interfere with your existing setup. The management of Python packages and environments is discussed using the standard tools of pip and venv. In the process of writing the book, I have personally switched to using uv for both these tasks. For the sake of consistency, I have omitted that change from the book. I do encourage the reader to consider adopting uv and make the effort to adapt the examples where necessary. Through the course of the book’s development, some of the proprietary models used in the examples have been deprecated. This means you will not be able to use those exact models and will need to modify the scripts to use a more recent model. In our testing, this indicated some changes in performance, both improvements and degradations. This highlights one of the problems with choosing proprietary models for building robust systems—reliability requires using models that are under your control. Finally, we have used many different packages and frameworks in the examples of this book. The intention is not to encourage use of one platform over another, but to quickly demonstrate key ideas and patterns as simply as possible. The application design principles are more important that the specific libraries we are demonstrating.__

این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:

Download: Data Science First

نظرات کاربران

  •  چنانچه دیدگاه شما توهین آمیز باشد تایید نخواهد شد.
  •  چنانچه دیدگاه شما جنبه تبلیغاتی داشته باشد تایید نخواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

X