- عنوان کتاب: Multimodal, Real-Time AI Agent Systems
- نویسنده: Heiko Hotz, Sokratis Kartakis
- حوزه: عامل هوش مصنوعی
- سال انتشار: 2026
- تعداد صفحه: 252
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 11.1 مگابایت
احتمالاً اصطلاح «عامل هوش مصنوعی» را همه جا دیدهاید، که اغلب به عنوان پدیده بزرگ بعدی در هوش مصنوعی توصیف میشود. اما این اصطلاح در واقع به چه معناست؟ فراتر از هیاهوی تبلیغاتی، یک عامل واقعاً چگونه «در اعماق» کار میکند؟ این فصل برای پاسخ به این سؤالات طراحی شده است و شما را به یک سفر عملی از پایه میبرد. ما با بررسی پنج مرحله متمایز تکامل عامل، با ایدههای بنیادی از دوران پیش از هوش مصنوعی مولد، شروع خواهیم کرد. سپس به ظهور مدلهای بنیادی، افزودن دانش با RAG و تولد عاملهایی که میتوانند عمل کنند، خواهیم پرداخت. با این پیشینه تاریخی، تعریف جدید و محکمی از آنچه یک عامل واقعاً هست، ارائه خواهیم داد و از یک کلمه ساده و کلیشهای به یک مفهوم مهندسی ملموس خواهیم رسید. وقتی تعریف خود را پیدا کردیم، دست به کار میشویم. ما شما را با اجزای اصلی یک عامل آشنا میکنیم و به شما نشان میدهیم که چگونه منطق آن را از ابتدا بسازید. در نهایت، ما ابتدا با دادن حافظه به عاملها برای مکالمات پیچیده و چند نوبتی، و سپس با دیدن اینکه چگونه این حوزه به چرخه کامل خود برای هماهنگسازی سیستمهای چند عامله قدرتمند رسیده است، چشماندازی را که دههها پیش آغاز شده بود، محقق خواهیم کرد. نحوه تعامل ما با هوش مصنوعی در حال تغییر اساسی است. ما از هوش مصنوعی به عنوان یک چتبات غیرفعال که به سادگی به سوالات ما پاسخ میدهد، فراتر میرویم و به سمت هوش مصنوعی به عنوان یک شریک فعال که کارها را از طرف ما انجام میدهد، حرکت میکنیم. این تکامل از یک مکالمهگر ساده به یک بازیگر پیچیده، چیزی است که دنیای جدید و هیجانانگیز عاملهای هوش مصنوعی را تعریف میکند. همانطور که بررسی خواهیم کرد و همانطور که در شکل 1-1 میبینید، این سفر پنج مرحله مجزا دارد. ما با عاملهای قدیمی قبل از تولد هوش مصنوعی مولد شروع کردیم، به مدلهای بنیادی قدرتمند (FM) که به دستورات پاسخ میدهند، رسیدیم، آنها را با دانش تخصصی با استفاده از بازیابی افزوده نسل (RAG) ارتقا دادیم و به عاملهای واقعی رسیدیم که میتوانند اقدام کنند، که اکنون در سیستمهای چند عامله مشارکتی هماهنگ میشوند. بیایید هر مرحله را مرور کنیم.
You’ve likely seen the term ‘AI Agent’ popping up everywhere, often described as the next big thing in artificial intelligence. But what does that term actually mean? Beyond the hype, how does an agent really work “under the hood”? This chapter is designed to answer those questions by taking you on a practical journey from the ground up. We’ll begin by exploring the five distinct stages of agent evolution, starting with the foundational ideas from the pre-generative AI era. We’ll then move through the rise of Foundation Models, the addition of knowledge with RAG, and the birth of agents that can act. With that historical context, we’ll establish a new, robust definition of what an agent truly is, moving beyond a simple buzzword to a concrete engineering concept. Once we have our definition, we’ll get our hands dirty. We’ll walk you through the core components of an agent and show you how to build the logic for one from scratch. Finally, we’ll scale up, first by giving agents memory for complex, multi-turn conversations, and then by seeing how the field has come full circle to orchestrate powerful multi-agent systems, fulfilling a vision that started decades ago. The way we interact with artificial intelligence is undergoing a fundamental shift. We’re moving beyond AI as a passive chatbot that simply answers our questions and toward AI as an active partner that gets things done on our behalf. This evolution from a simple conversationalist to a complex actor is what defines the exciting new world of AI Agents. As we’ll explore, and as you can see in Figure 1-1, this journey has five distinct stages. We began with legacy agents before the birth of Generative AI, moved on to powerful Foundation Models (FMs) that respond to prompts, enhanced them with specialized knowledge using Retrieval Augmented Generation (RAG), and arrived at true Agents that can take action, which are now being orchestrated into collaborative multi-agent systems. Let’s walk through each step.
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:
Download: Multimodal, Real-Time AI Agent Systems





نظرات کاربران