0

دانلود کتاب مدل‌های زبان بزرگ، بخش‌های سخت

بازدید 87
  • عنوان کتاب: Large Language Models The Hard Parts
  • نویسنده: Thársis T. P. Souza and Jonathan K. Regenstein
  • حوزه: مدل زبانی بزرگ
  • سال انتشار: 2026
  • تعداد صفحه: 510
  • زبان اصلی: انگلیسی
  • نوع فایل: pdf
  • حجم فایل: 12.8 مگابایت

عنوان جایگزین برای این کتاب می‌توانست LLMهایی باشند که بدرفتاری می‌کنند. اگر سابقه‌ای در مدل‌سازی مالی دارید، ممکن است متوجه شباهت آن با اثر برجسته امانوئل درمن، مدل‌ها، بدرفتاری، شده باشید.1 همانطور که درمن در مورد برخورد با مدل‌های مالی به عنوان بازنمایی‌های کامل واقعیت هشدار داد، این کتاب نیز قصد دارد محدودیت‌ها و مشکلات مدل‌های زبان بزرگ (LLM) را در کاربردهای عملی برجسته کند. LLMها نیز مانند مدل‌های مالی که نتوانستند پیچیدگی رفتار انسان و پویایی بازار را به تصویر بکشند، محدودیت‌های ذاتی دارند. آن‌ها می‌توانند واقعیت‌ها را توهم کنند، با استدلال منطقی مشکل داشته باشند و در خروجی‌های طولانی نتوانند ثبات را حفظ کنند. پاسخ‌های آن‌ها، اگرچه اغلب قانع‌کننده هستند، اما تقریب‌های احتمالی مبتنی بر داده‌های آموزشی هستند تا درک واقعی، حتی اگر انسان‌ها اصرار داشته باشند که آن‌ها را به عنوان «ماشین‌هایی که می‌توانند استدلال کنند» در نظر بگیرند. در سال‌های اخیر، LLMها به عنوان یک نیروی متحول‌کننده در فناوری ظهور کرده‌اند. از ChatGPT و Gemini گرفته تا Claude و Mistral، این سیستم‌ها تخیل عموم را به خود جلب کرده‌اند و هجومی از برنامه‌های مبتنی بر هوش مصنوعی را برانگیخته‌اند. با این حال، در پس این انقلاب فناوری، چشم‌انداز پیچیده‌ای از چالش‌هایی نهفته است که توسعه‌دهندگان، دانشمندان داده و رهبران فنی باید از آنها عبور کنند. ما این کتاب را نوشتیم زیرا نسبت به قدرت و امکانات LLMها خوش‌بین هستیم، اما در مورد سختی استقرار موفقیت‌آمیز، گسترده و قابل اعتماد آنها واقع‌بین هستیم. این کتاب بر آگاهی‌بخشی به چالش‌های کلیدی LLM و بهره‌برداری از راه‌حل‌های متن‌باز برای غلبه بر آنها تمرکز دارد. این کتاب، دیدگاهی انتقادی در مورد پیاده‌سازی ارائه می‌دهد که با مثال‌های عملی و تکرارپذیر پایتون پشتیبانی می‌شود. در پایان کتاب، خوانندگان به ابزارهای متن‌بازی که برای تبدیل شدن به چیزی بیش از کاربران LLMها نیاز دارند، مجهز خواهند شد و این ابزارها ما را در موقعیتی قرار می‌دهند که در جهانی که به سرعت در حال تغییر است و فرصتی برای حرکت و ساخت بسیار سریع ارائه می‌دهد، پیشرفت کنیم. مهارت‌های موجود در این کتاب – ارزیابی، ایمنی، زمینه، هم‌ترازی، خروجی‌های ساختاریافته، تولید افزوده بازیابی (RAG)، تنظیم دقیق – همان چیزی است که «من با LLMها بازی کردم» را از «من یک برنامه مبتنی بر LLM قابل اعتماد ساختم که سازمان من به آن وابسته است» متمایز می‌کند.

An alternative title for this book could have been LLMs Behaving Badly. If you come from a background in financial modeling, you may have noticed the parallel with Emanuel Derman’s seminal work Models. Behaving. Badly.1 Just as Derman cautioned against treating financial models as perfect representations of reality, this book aims to highlight the limitations and pitfalls of large language models (LLMs) in practical applications. Like financial models that failed to capture the complexity of human behavior and market dynamics, LLMs have inherent constraints. They can hallucinate facts, struggle with logical reasoning, and fail to maintain consistency in long outputs. Their responses, while often convincing, are probabilistic approximations based on training data rather than true understanding, even though humans insist on treating them as “machines that can reason.” In recent years, LLMs have emerged as a transformative force in technology. From ChatGPT and Gemini to Claude and Mistral, these systems have captured the public’s imagination and sparked a gold rush of AI-powered applications. However, beneath this technological revolution lies a complex landscape of challenges that developers, data scientists, and technical leaders must navigate. We wrote this book because we’re optimistic about the power and possibilities of LLMs but realistic about how hard it is to deploy them successfully, widely, and reliably. This book focuses on bringing awareness to key LLM challenges and harnessing open source solutions to overcome them. It offers a critical perspective on implementation, backed by practical and reproducible Python examples. By the book’s end, readers will be armed with the open source tools they need to become more than users of LLMs, and those tools will put us in a position to thrive in a world that is changing rapidly and offering the chance to move and build very quickly. The skills in this book—evaluation, safety, context, alignment, structured outputs, retrieval augmented generation (RAG), fine-tuning—are what differentiate “I played with LLMs” from “I built a reliable LLM-based application that my organization depends on.”

این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:

Download: Large Language Models

نظرات کاربران

  •  چنانچه دیدگاه شما توهین آمیز باشد تایید نخواهد شد.
  •  چنانچه دیدگاه شما جنبه تبلیغاتی داشته باشد تایید نخواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

X