0

دانلود کتاب RAG از اصول اولیه – مهندسی سیستم‌های تولید افزوده بازیابی با پایتون، LangChain و LlamaIndex

بازدید 111
  • عنوان کتاب: RAG from First Principles – Engineering retrieval-augmented generation systems with Python, LangChain, and LlamaIndex
  • نویسنده: Jia Huang
  • حوزه: RAG AI
  • سال انتشار: 2026
  • تعداد صفحه: 586
  • زبان اصلی: انگلیسی
  • نوع فایل: pdf
  • حجم فایل: 8.95 مگابایت

تولید افزوده بازیابی (RAG) به سرعت به یکی از مهمترین رویکردها برای ساخت سیستم‌های هوش مصنوعی قابل اعتماد و هوشمند تبدیل شده است. RAG با ترکیب مدل‌های زبانی بزرگ با بازیابی دانش خارجی، برنامه‌ها را قادر می‌سازد تا پاسخ‌هایی دقیق‌تر، زمینه‌ای‌تر و مبتنی بر داده‌های سازمانی تولید کنند. در این کتاب، شما خط لوله کامل RAG را از اصول اولیه بررسی خواهید کرد، که با مبانی جاسازی‌ها، ذخیره‌سازی برداری و پایگاه‌های داده برداری شروع می‌شود و سپس به بهینه‌سازی بازیابی پیشرفته و استراتژی‌های تولید پاسخ می‌پردازد. این کتاب نه تنها نحوه کار مفهومی سیستم‌های RAG را توضیح می‌دهد، بلکه نحوه پیاده‌سازی آنها را در محیط‌های عملی و آماده تولید نیز توضیح می‌دهد. شما ابتدا یاد خواهید گرفت که چگونه نمایش‌های برداری ایجاد و مدیریت می‌شوند، از جمله نحوه ذخیره، نمایه‌سازی و بازیابی کارآمد جاسازی‌ها با استفاده از پایگاه‌های داده برداری مانند Milvus و چارچوب‌هایی مانند LlamaIndex. این کتاب معماری سیستم‌های ذخیره‌سازی برداری، روش‌های نمایه‌سازی مانند FLAT و IVF و بده‌بستان‌های مربوط به جستجوی شباهت و بازیابی در مقیاس بزرگ را توضیح می‌دهد. از آنجا، شما تکنیک‌های پردازش پیش از بازیابی، از جمله ساخت پرس‌وجو، ترجمه پرس‌وجو، گردش‌های کاری متن به SQL، فیلتر کردن فراداده و مسیریابی پرس‌وجو را کشف خواهید کرد که به سوالات زبان طبیعی امکان تعامل یکپارچه با منابع داده ساختاریافته و بدون ساختار را می‌دهد. پس از ایجاد مبانی بازیابی، این کتاب بر بهبود کیفیت بازیابی از طریق استراتژی‌های بهینه‌سازی شاخص تمرکز دارد. شما یاد خواهید گرفت که چگونه با استفاده از بازیابی پنجره جمله، قطعه‌بندی والد-فرزند، شاخص‌گذاری سلسله مراتبی و تکنیک‌های گسترش متن با LlamaIndex و LangChain، خطوط لوله بازیابی دقیق‌تری طراحی کنید. این فصل‌ها بر تصمیمات مهندسی عملی تأکید دارند که دقت بازیابی را بهبود می‌بخشند و در عین حال زمینه کافی برای تولید را حفظ می‌کنند. از طریق مثال‌های کد دقیق و توضیحات معماری، خواهید فهمید که چگونه هنگام ساخت برنامه‌های RAG با کیفیت بالا، بین دانه‌بندی قطعات، یادآوری متنی و مقیاس‌پذیری تعادل برقرار کنید. در نهایت، کتاب مرحله تولید پاسخ سیستم‌های RAG را بررسی می‌کند و مهندسی سریع، تجزیه خروجی ساختاریافته، بهبود واقعیت و تکنیک‌های کنترل تولید را پوشش می‌دهد. شما یاد خواهید گرفت که چگونه مدل‌های زبانی بزرگ را با استفاده از قالب‌ها، مثال‌ها، استراتژی‌های بررسی واقعیت و تجزیه‌کننده‌های ساختاریافته در LangChain و LlamaIndex هدایت کنید. این کتاب همچنین در مورد انتخاب مدل‌های تولید، استفاده از APIها و مدل‌های مستقر محلی و استراتژی‌های بهینه‌سازی پیشرفته مانند Self-RAG و رویکردهای پالایش تکراری بحث می‌کند. در پایان این کتاب، شما قادر خواهید بود سیستم‌های RAG سرتاسری را طراحی، بهینه‌سازی و مستقر کنید که بازیابی، استدلال و تولید را در برنامه‌های کاربردی هوش مصنوعی مقیاس‌پذیر مناسب برای موارد استفاده سازمانی در دنیای واقعی ادغام می‌کنند.

Retrieval-augmented generation ( RAG ) has rapidly become one of the most important approaches for building reliable and intelligent AI systems. By combining large language models with external knowledge retrieval, RAG enables applications to generate responses that are more accurate, contextual, and grounded in enterprise data. In this book, you will explore the complete RAG pipeline from first principles, beginning with the foundations of embeddings, vector storage, and vector databases, before moving into advanced retrieval optimization and response generation strategies. The book explains not only how RAG systems work conceptually, but also how they are implemented in practical, production-ready environments. You will first learn how vector representations are created and managed, including how embeddings are stored, indexed, and retrieved efficiently using vector databases such as Milvus and frameworks like LlamaIndex. The book explains the architecture of vector storage systems, indexing methods such as FLAT and IVF, and the trade-offs involved in similarity search and large-scale retrieval. From there, you will discover pre-retrieval processing techniques, including query construction, query translation, Text-to-SQL workflows, metadata filtering, and query routing, enabling natural language questions to interact seamlessly with structured and unstructured data sources. Once the retrieval foundations are established, the book focuses on improving retrieval quality through index optimization strategies. You will learn how to design more accurate retrieval pipelines using sentence-window retrieval, parent-child chunking, hierarchical indexing, and context-expansion techniques with both LlamaIndex and LangChain. These chapters emphasize practical engineering decisions that improve retrieval precision while preserving sufficient context for generation. Through detailed code examples and architectural explanations, you will understand how to balance chunk granularity, contextual recall, and scalability when building high-quality RAG applications. Finally, the book explores the response generation stage of RAG systems, covering prompt engineering, structured output parsing, factuality improvement, and generation control techniques. You will learn how to guide large language models using templates, examples, fact-checking strategies, and structured parsers in LangChain and LlamaIndex. The book also discusses the selection of generation models, the use of APIs and locally deployed models, and advanced optimization strategies such as Self-RAG and iterative refinement approaches. By the end of this book, you will be able to design, optimize, and deploy end-to-end RAG systems that integrate retrieval, reasoning, and generation into scalable AI applications suitable for real-world enterprise use cases.

این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:

Download: RAG from First Principles

نظرات کاربران

  •  چنانچه دیدگاه شما توهین آمیز باشد تایید نخواهد شد.
  •  چنانچه دیدگاه شما جنبه تبلیغاتی داشته باشد تایید نخواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

X