- عنوان کتاب: RAG from First Principles – Engineering retrieval-augmented generation systems with Python, LangChain, and LlamaIndex
- نویسنده: Jia Huang
- حوزه: RAG AI
- سال انتشار: 2026
- تعداد صفحه: 586
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 8.95 مگابایت
تولید افزوده بازیابی (RAG) به سرعت به یکی از مهمترین رویکردها برای ساخت سیستمهای هوش مصنوعی قابل اعتماد و هوشمند تبدیل شده است. RAG با ترکیب مدلهای زبانی بزرگ با بازیابی دانش خارجی، برنامهها را قادر میسازد تا پاسخهایی دقیقتر، زمینهایتر و مبتنی بر دادههای سازمانی تولید کنند. در این کتاب، شما خط لوله کامل RAG را از اصول اولیه بررسی خواهید کرد، که با مبانی جاسازیها، ذخیرهسازی برداری و پایگاههای داده برداری شروع میشود و سپس به بهینهسازی بازیابی پیشرفته و استراتژیهای تولید پاسخ میپردازد. این کتاب نه تنها نحوه کار مفهومی سیستمهای RAG را توضیح میدهد، بلکه نحوه پیادهسازی آنها را در محیطهای عملی و آماده تولید نیز توضیح میدهد. شما ابتدا یاد خواهید گرفت که چگونه نمایشهای برداری ایجاد و مدیریت میشوند، از جمله نحوه ذخیره، نمایهسازی و بازیابی کارآمد جاسازیها با استفاده از پایگاههای داده برداری مانند Milvus و چارچوبهایی مانند LlamaIndex. این کتاب معماری سیستمهای ذخیرهسازی برداری، روشهای نمایهسازی مانند FLAT و IVF و بدهبستانهای مربوط به جستجوی شباهت و بازیابی در مقیاس بزرگ را توضیح میدهد. از آنجا، شما تکنیکهای پردازش پیش از بازیابی، از جمله ساخت پرسوجو، ترجمه پرسوجو، گردشهای کاری متن به SQL، فیلتر کردن فراداده و مسیریابی پرسوجو را کشف خواهید کرد که به سوالات زبان طبیعی امکان تعامل یکپارچه با منابع داده ساختاریافته و بدون ساختار را میدهد. پس از ایجاد مبانی بازیابی، این کتاب بر بهبود کیفیت بازیابی از طریق استراتژیهای بهینهسازی شاخص تمرکز دارد. شما یاد خواهید گرفت که چگونه با استفاده از بازیابی پنجره جمله، قطعهبندی والد-فرزند، شاخصگذاری سلسله مراتبی و تکنیکهای گسترش متن با LlamaIndex و LangChain، خطوط لوله بازیابی دقیقتری طراحی کنید. این فصلها بر تصمیمات مهندسی عملی تأکید دارند که دقت بازیابی را بهبود میبخشند و در عین حال زمینه کافی برای تولید را حفظ میکنند. از طریق مثالهای کد دقیق و توضیحات معماری، خواهید فهمید که چگونه هنگام ساخت برنامههای RAG با کیفیت بالا، بین دانهبندی قطعات، یادآوری متنی و مقیاسپذیری تعادل برقرار کنید. در نهایت، کتاب مرحله تولید پاسخ سیستمهای RAG را بررسی میکند و مهندسی سریع، تجزیه خروجی ساختاریافته، بهبود واقعیت و تکنیکهای کنترل تولید را پوشش میدهد. شما یاد خواهید گرفت که چگونه مدلهای زبانی بزرگ را با استفاده از قالبها، مثالها، استراتژیهای بررسی واقعیت و تجزیهکنندههای ساختاریافته در LangChain و LlamaIndex هدایت کنید. این کتاب همچنین در مورد انتخاب مدلهای تولید، استفاده از APIها و مدلهای مستقر محلی و استراتژیهای بهینهسازی پیشرفته مانند Self-RAG و رویکردهای پالایش تکراری بحث میکند. در پایان این کتاب، شما قادر خواهید بود سیستمهای RAG سرتاسری را طراحی، بهینهسازی و مستقر کنید که بازیابی، استدلال و تولید را در برنامههای کاربردی هوش مصنوعی مقیاسپذیر مناسب برای موارد استفاده سازمانی در دنیای واقعی ادغام میکنند.
Retrieval-augmented generation ( RAG ) has rapidly become one of the most important approaches for building reliable and intelligent AI systems. By combining large language models with external knowledge retrieval, RAG enables applications to generate responses that are more accurate, contextual, and grounded in enterprise data. In this book, you will explore the complete RAG pipeline from first principles, beginning with the foundations of embeddings, vector storage, and vector databases, before moving into advanced retrieval optimization and response generation strategies. The book explains not only how RAG systems work conceptually, but also how they are implemented in practical, production-ready environments. You will first learn how vector representations are created and managed, including how embeddings are stored, indexed, and retrieved efficiently using vector databases such as Milvus and frameworks like LlamaIndex. The book explains the architecture of vector storage systems, indexing methods such as FLAT and IVF, and the trade-offs involved in similarity search and large-scale retrieval. From there, you will discover pre-retrieval processing techniques, including query construction, query translation, Text-to-SQL workflows, metadata filtering, and query routing, enabling natural language questions to interact seamlessly with structured and unstructured data sources. Once the retrieval foundations are established, the book focuses on improving retrieval quality through index optimization strategies. You will learn how to design more accurate retrieval pipelines using sentence-window retrieval, parent-child chunking, hierarchical indexing, and context-expansion techniques with both LlamaIndex and LangChain. These chapters emphasize practical engineering decisions that improve retrieval precision while preserving sufficient context for generation. Through detailed code examples and architectural explanations, you will understand how to balance chunk granularity, contextual recall, and scalability when building high-quality RAG applications. Finally, the book explores the response generation stage of RAG systems, covering prompt engineering, structured output parsing, factuality improvement, and generation control techniques. You will learn how to guide large language models using templates, examples, fact-checking strategies, and structured parsers in LangChain and LlamaIndex. The book also discusses the selection of generation models, the use of APIs and locally deployed models, and advanced optimization strategies such as Self-RAG and iterative refinement approaches. By the end of this book, you will be able to design, optimize, and deploy end-to-end RAG systems that integrate retrieval, reasoning, and generation into scalable AI applications suitable for real-world enterprise use cases.
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:
Download: RAG from First Principles





نظرات کاربران