- عنوان کتاب: Agentic Reliability Engineering
- نویسنده: David Jambor
- حوزه: عامل هوش مصنوعی
- سال انتشار: 2026
- تعداد صفحه: 371
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 0.97 مگابایت
قابلیت اطمینان هرگز تا این حد مهم و شکننده نبوده است. سیستمهای مدرن بزرگتر، توزیعشدهتر و وابستهتر از هر نقطهای در تاریخ خود هستند. آنها دائماً تغییر میکنند. آنها ابرها، مناطق، فروشندگان، تیمها و مناطق زمانی را در بر میگیرند. آنها به همان اندازه که توسط تصمیمات فنی شکل میگیرند، توسط تصمیمات سازمانی نیز شکل میگیرند. سالهاست که ما با ابزارهای بهتر، اتوماسیون عمیقتر و پاسخ سریعتر به این پیچیدگی پاسخ دادهایم. این رویکردها ارزش واقعی را ارائه دادهاند. آنها همچنین به محدودیتهای خود رسیدهاند. این بخش از کتاب برای توضیح دلیل آن وجود دارد. مهندسی قابلیت اطمینان به طور سنتی در مقیاس انسانی ساخته شده است. انسانها داشبوردها را مشاهده میکنند، سیگنالها را تفسیر میکنند، خرابیها را تشخیص میدهند و تصمیم میگیرند که در مرحله بعد چه کاری انجام دهند. اتوماسیون از این کار پشتیبانی میکند، اما مرکز ثقل همچنان قضاوت انسانی است. در مقیاس کوچک، این روش کار میکند. در مقیاس متوسط، با نظم و انضباط کار میکند. در مقیاس مدرن، به طور فزایندهای شکننده میشود. مشکل کمبود هوش یا تلاش نیست. بلکه بار شناختی است. سیستمها اکنون سیگنالهای بیشتری نسبت به آنچه انسانها میتوانند به طور منطقی در زمان واقعی تفسیر کنند، تولید میکنند. وابستگیها سریعتر از مدلهای ذهنی تغییر میکنند. حوادث به طور فزایندهای از ترکیبی از تغییرات به جای خرابیهای منفرد پدیدار میشوند. در این محیط، درخواست از انسانها برای باقی ماندن به عنوان موتور اصلی تصمیمگیری دیگر پایدار نیست. این به معنای بیاهمیت شدن انسانها نیست. بلکه به این معنی است که نقش آنها باید تغییر کند. مهندسی قابلیت اطمینان عاملمحور از یک مشاهده ساده شروع میشود. اگر سیستمها برای مدیریت صرفاً از طریق توجه انسان بسیار پیچیده هستند، پس قابلیت اطمینان باید در خود سیستم طراحی شود. نه به عنوان اسکریپت یا قوانین ایستا، بلکه به عنوان آگاهی، استدلال، یادگیری و اقدام محدود مداوم. این تغییر سوالات جدیدی را مطرح میکند. – منظور از اینکه یک سیستم وضعیت خود را درک کند چیست؟ – چگونه قصد، اعتماد و محدودیتها را به گونهای رمزگذاری کنیم که ماشینها بتوانند به آن احترام بگذارند؟ – چه مبانی باید وجود داشته باشد تا خودمختاری به جای خطرناک بودن، ایمن باشد؟ بخش اول در مورد پاسخ صادقانه به این سوالات است. این بخش عمداً با راهحلها شروع نمیشود. با محدودیتها شروع میشود.
Reliability has never been more important, and never more fragile. Modern systems are larger, more distributed, and more interdependent than at any point in their history. They change constantly. They span clouds, regions, vendors, teams, and time zones. They are shaped as much by organisational decisions as by technical ones. For years, we have responded to this complexity with better tooling, deeper automation, and faster response. Those approaches have delivered real value. They are also reaching their limits. This part of the book exists to explain why. Reliability engineering has traditionally been built around human scale. Humans observe dashboards, interpret signals, diagnose failures, and decide what to do next. Automation supports that work, but the centre of gravity remains human judgement. At small scale, this works. At moderate scale, it works with discipline. At modern scale, it becomes increasingly brittle. The problem is not a lack of intelligence or effort. It is cognitive load. Systems now generate more signals than humans can reasonably interpret in real time. Dependencies shift faster than mental models can keep up. Incidents increasingly emerge from combinations of changes rather than single failures. In this environment, asking humans to remain the primary decision engine is no longer sustainable. This does not mean humans become irrelevant. It means their role must change. Agentic Reliability Engineering starts from a simple observation. If systems are too complex to be managed purely through human attention, then reliability must be designed into the system itself. Not as scripts or static rules, but as continuous awareness, reasoning, learning, and bounded action. That shift introduces new questions. -What does it mean for a system to understand its own state? -How do we encode intent, trust, and constraints in a way machines can respect? -What foundations must exist before autonomy is safe rather than dangerous? Part I is about answering those questions honestly. This part deliberately does not start with solutions. It starts with limits.
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:
Download: Agentic Reliability Engineering





نظرات کاربران