- عنوان کتاب: Introduction to Foundation Models
- نویسنده: Pin-Yu Chen , Sijia Liu
- حوزه: مدل زبانی
- سال انتشار: 2025
- تعداد صفحه: 307
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 7.63 مگابایت
در ژوئن ۲۰۲۲، ما (پین-یو چن، سیجیا لیو و سایاک پاول) احساس کردیم که مدلهای بنیادی و هوش مصنوعی مولد در شرف ایجاد تغییرات بیسابقه و انقلابی در فناوری و جامعه ما هستند و تصمیم گرفتیم یک آموزش در NeurIPS ارائه دهیم تا محققان و متخصصان را در مورد این تحقیق و فناوری نوظهور هوش مصنوعی و پیامدهای آن برای استحکام و ایمنی آموزش دهیم. دو ماه بعد، آموزش ما با عنوان «استحکام بنیادی مدلهای بنیادی» پذیرفته شد و قرار است در ۵ دسامبر ۲۰۲۲ ارائه شود. در آن زمان، جهان هنوز در حال بهبودی از بحران کووید بود و NeurIPS 2022 اولین کنفرانس NeurIPS بود که پس از کووید، امکان حضور فیزیکی را فراهم میکرد. برای تطبیق با حالت کنفرانس ترکیبی، از ما خواسته شد که آموزش خود را تا اکتبر ۲۰۲۲ ضبط کنیم. در مطالب خود، به درستی پیشبینی کردیم که تکثیر مدلهای بنیادی، خطرات و چالشهای فزایندهای را در استحکام، امنیت و ایمنی به همراه خواهد داشت که بعداً به عنوان بخشی از موضوع گسترده ایمنی، حاکمیت و ارزیابی ریسک هوش مصنوعی شناخته شد. حدود یک هفته قبل از انتشار رسمی آموزش ما و تاریخ شروع NeurIPS 2022، ChatGPT توسط OpenAI در 30 نوامبر 2022 راهاندازی شد. در کنفرانس، ما فقط چند زمزمه و سوال واقعی در مورد “آیا نام ChatGPT را شنیدهاید؟” شنیدیم. چه کسی فکر میکرد که در آگوست 2024، تعداد کاربران ChatGPT در سراسر جهان بیش از 180 میلیون نفر باشد؟ با در نظر گرفتن چنین تصادفی، ما احساس کردیم که باید آموزش خود را به یک کتاب گسترش دهیم، اصول اولیه مدلهای بنیادی و هوش مصنوعی مولد را خلاصه کنیم و بر استحکام و ایمنی این مدلهای مرزی و فناوری هوش مصنوعی تأکید کنیم. این کتاب شامل سه بخش است. بخش اول (فصلهای 1 تا 4) اصول مدلهای بنیادی را ارائه میدهد، بخش دوم (فصلهای 5 تا 11) شامل مباحث پیشرفته در حالتهای بنیادی است و بخش سوم (فصلهای 12 تا 18) ایمنی و اعتماد در مدلهای بنیادی را ارائه میدهد. نمادهای ریاضی در هر فصل تعریف و توضیح داده خواهند شد. ما مروری بر هر بخش به شرح زیر ارائه میدهیم: • در بخش اول، فصل 1 مروری بر مدلهای بنیادی و هوش مصنوعی مولد ارائه میدهد. فصل 2 پیشینه فنی شبکههای عصبی را ارائه میدهد. فصل 3 به یادگیری و تعمیم ترانسفورماتورها میپردازد. فصل 4 یادگیری درون متنی با ترانسفورماتورها را رسمی میکند. • در بخش دوم، فصل 5 تکنیکهای خودکارسازی بصری را معرفی میکند. فصل 6، LLMهای بنیادی با حریم خصوصی را معرفی میکند. فصل 7 روشهای تنظیم دقیق با حافظه کارآمد را توضیح میدهد. فصل 8 نشان میدهد که چگونه LLMها را میتوان برای وظایف یادگیری ماشین سری زمانی دوباره برنامهریزی کرد. فصل 9 نشان میدهد که چگونه LLMها را میتوان برای وظایف گفتاری دوباره استفاده کرد. فصل 10 نحوه استفاده از مجموعه دادههای مصنوعی را برای محک زدن مدلهای بنیادی معرفی میکند. فصل 11، یادگیریزدایی ماشین را برای مدلهای بنیادی توضیح میدهد. • در بخش سوم، فصل 12 ارزیابی جامعی از قابلیت اعتماد LLMها ارائه میدهد. فصل 13 حملات و دفاعهای فرار از زندان برای LLMها را معرفی میکند. فصل 14 خطرات ایمنی را هنگام تنظیم دقیق LLMها ارائه میدهد. فصل ۱۵ تکنیکهای واترمارک برای LLMها را معرفی میکند. فصل ۱۶ تشخیص قوی متن تولید شده توسط هوش مصنوعی را ارائه میدهد. فصل ۱۷ خطرات در پشتی در مدلهای انتشار را توضیح میدهد. فصل ۱۸ روشهای تیم قرمز برای مدلهای انتشار را ارائه میدهد. نویسندگان بهویژه مایلند از پاول دروگاس در اشپرینگر به خاطر تشویق و صبرشان در اجازه دادن به ما برای انتشار کتابی در چنین زمینهای که به سرعت در حال تغییر و رشد است، تشکر کنند. برخی از بخشهای کتاب بر اساس انتشاراتی است که توسط نویسندگان این کتاب به طور مشترک نوشته شده است. ما مایلیم از همکاران تحقیقاتی خود قدردانی کنیم. در نهایت، مایلیم از خانوادهها، همکاران و دوستانمان به خاطر حمایتشان تشکر کنیم.
Back in June 2022, we (Pin-Yu Chen, Sijia Liu, and Sayak Paul) sensed that foundational models and generative AI were about to bring unprecedented and revolutionary changes to our technology and society, and we decided to propose a tutorial at NeurIPS to educate researchers and practitioners about this emerging AI research and technology and its implications for robustness and safety. Two months later, our tutorial, “Foundational Robustness of Foundation Models,” was accepted and to be presented on December 5, 2022. At that time, the world was still recovering from the Covid crisis, and NeurIPS 2022 was the first NeurIPS conference to allow physical attendance after Covid. To accommodate the hybrid conference mode, we were asked to record our tutorial by October 2022. In our materials, we correctly predicted that the proliferation of foundation models would bring increased risks and challenges in robustness, security, and safety, later known as part of the broad topic of AI safety, governance, and risk assessment. About a week before the official release of our tutorial and the start date of NeurIPS 2022, ChatGPT was launched by OpenAI on November 30, 2022. At the conference, we heard only a few whispers and genuine inquiries about “Have you heard of ChatGPT?” Who would have thought that in August 2024, the number of ChatGPT users worldwide would be more than 180 million? With such a coincidence in mind, we felt compelled to expand our tutorial into a book, summarizing the basics of foundation models and generative AI, and emphasizing the robustness and safety of these frontier models and AI technology. This book consists of three parts. Part I (Chaps.1 to 4) provides the fundamentals of foundation models, Part II (Chaps.5 to 11) includes advanced topics in founda-tion modes, and Part III (Chaps.12 to 18) presents safety and trust in foundation models. The mathematical notations will be defined and explained in each chapter. We provide an overview of each part as follows: • In Part I, Chap.1 provides an overview of foundation models and generative AI. Chapter 2 presents the technical background of neural networks. Chapter 3 delves into the learning and generalization of transformers. Chapter 4 formalizes in-context learning with transformers. • In Part II, Chap.5 introduces automated visual prompting techniques. Chapter 6 introduces prompting LLMs with privacy. Chapter 7 elucidates memory-efficient fine-tuning methods. Chapter 8 shows how LLMs can be reprogrammed for time-series machine learning tasks. Chapter 9 shows how LLMs can be reused for speech tasks. Chapter 10 introduces how synthetic datasets can be used to benchmark foundation models. Chapter 11 elucidates machine unlearning for foundation models. • In Part III, Chap.12 provides a comprehensive evaluation of the trustworthiness of LLMs. Chapter 13 introduces jailbreak attacks and defenses for LLMs. Chapter 14 presents safety risks when fine-tuning LLMs. Chapter 15 introduces watermarking techniques for LLMs. Chapter 16 presents robust detection of AI-generated text. Chapter 17 elucidates backdoor risks in diffusion models. Chapter 18 presents red-teaming methods for diffusion models. The authors would especially like to thank Paul Drougas at Springer for his encouragement and patience in allowing us to publish a book in such a rapidly changing and growing field. Some parts of the book are based on publications co-authored by the authors of this book. We would like to express our gratitude to our research collaborators. Finally, we would like to thank our families, colleagues, and friends, for their support.
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:
Download: Introduction to Foundation Models
نظرات کاربران