مجله علمی تفریحی بیبیس
0

دانلود کتاب مقدمه‌ای بر مدل‌های فونداسیون

  • عنوان کتاب: Introduction to Foundation Models
  • نویسنده: Pin-Yu Chen , Sijia Liu
  • حوزه: مدل زبانی
  • سال انتشار: 2025
  • تعداد صفحه: 307
  • زبان اصلی: انگلیسی
  • نوع فایل: pdf
  • حجم فایل: 7.63 مگابایت

در ژوئن ۲۰۲۲، ما (پین-یو چن، سیجیا لیو و سایاک پاول) احساس کردیم که مدل‌های بنیادی و هوش مصنوعی مولد در شرف ایجاد تغییرات بی‌سابقه و انقلابی در فناوری و جامعه ما هستند و تصمیم گرفتیم یک آموزش در NeurIPS ارائه دهیم تا محققان و متخصصان را در مورد این تحقیق و فناوری نوظهور هوش مصنوعی و پیامدهای آن برای استحکام و ایمنی آموزش دهیم. دو ماه بعد، آموزش ما با عنوان «استحکام بنیادی مدل‌های بنیادی» پذیرفته شد و قرار است در ۵ دسامبر ۲۰۲۲ ارائه شود. در آن زمان، جهان هنوز در حال بهبودی از بحران کووید بود و NeurIPS 2022 اولین کنفرانس NeurIPS بود که پس از کووید، امکان حضور فیزیکی را فراهم می‌کرد. برای تطبیق با حالت کنفرانس ترکیبی، از ما خواسته شد که آموزش خود را تا اکتبر ۲۰۲۲ ضبط کنیم. در مطالب خود، به درستی پیش‌بینی کردیم که تکثیر مدل‌های بنیادی، خطرات و چالش‌های فزاینده‌ای را در استحکام، امنیت و ایمنی به همراه خواهد داشت که بعداً به عنوان بخشی از موضوع گسترده ایمنی، حاکمیت و ارزیابی ریسک هوش مصنوعی شناخته شد. حدود یک هفته قبل از انتشار رسمی آموزش ما و تاریخ شروع NeurIPS 2022، ChatGPT توسط OpenAI در 30 نوامبر 2022 راه‌اندازی شد. در کنفرانس، ما فقط چند زمزمه و سوال واقعی در مورد “آیا نام ChatGPT را شنیده‌اید؟” شنیدیم. چه کسی فکر می‌کرد که در آگوست 2024، تعداد کاربران ChatGPT در سراسر جهان بیش از 180 میلیون نفر باشد؟ با در نظر گرفتن چنین تصادفی، ما احساس کردیم که باید آموزش خود را به یک کتاب گسترش دهیم، اصول اولیه مدل‌های بنیادی و هوش مصنوعی مولد را خلاصه کنیم و بر استحکام و ایمنی این مدل‌های مرزی و فناوری هوش مصنوعی تأکید کنیم. این کتاب شامل سه بخش است. بخش اول (فصل‌های 1 تا 4) اصول مدل‌های بنیادی را ارائه می‌دهد، بخش دوم (فصل‌های 5 تا 11) شامل مباحث پیشرفته در حالت‌های بنیادی است و بخش سوم (فصل‌های 12 تا 18) ایمنی و اعتماد در مدل‌های بنیادی را ارائه می‌دهد. نمادهای ریاضی در هر فصل تعریف و توضیح داده خواهند شد. ما مروری بر هر بخش به شرح زیر ارائه می‌دهیم: • در بخش اول، فصل 1 مروری بر مدل‌های بنیادی و هوش مصنوعی مولد ارائه می‌دهد. فصل 2 پیشینه فنی شبکه‌های عصبی را ارائه می‌دهد. فصل 3 به یادگیری و تعمیم ترانسفورماتورها می‌پردازد. فصل 4 یادگیری درون متنی با ترانسفورماتورها را رسمی می‌کند. • در بخش دوم، فصل 5 تکنیک‌های خودکارسازی بصری را معرفی می‌کند. فصل 6، LLMهای بنیادی با حریم خصوصی را معرفی می‌کند. فصل 7 روش‌های تنظیم دقیق با حافظه کارآمد را توضیح می‌دهد. فصل 8 نشان می‌دهد که چگونه LLMها را می‌توان برای وظایف یادگیری ماشین سری زمانی دوباره برنامه‌ریزی کرد. فصل 9 نشان می‌دهد که چگونه LLMها را می‌توان برای وظایف گفتاری دوباره استفاده کرد. فصل 10 نحوه استفاده از مجموعه داده‌های مصنوعی را برای محک زدن مدل‌های بنیادی معرفی می‌کند. فصل 11، یادگیری‌زدایی ماشین را برای مدل‌های بنیادی توضیح می‌دهد. • در بخش سوم، فصل 12 ارزیابی جامعی از قابلیت اعتماد LLMها ارائه می‌دهد. فصل 13 حملات و دفاع‌های فرار از زندان برای LLMها را معرفی می‌کند. فصل 14 خطرات ایمنی را هنگام تنظیم دقیق LLMها ارائه می‌دهد. فصل ۱۵ تکنیک‌های واترمارک برای LLMها را معرفی می‌کند. فصل ۱۶ تشخیص قوی متن تولید شده توسط هوش مصنوعی را ارائه می‌دهد. فصل ۱۷ خطرات در پشتی در مدل‌های انتشار را توضیح می‌دهد. فصل ۱۸ روش‌های تیم قرمز برای مدل‌های انتشار را ارائه می‌دهد. نویسندگان به‌ویژه مایلند از پاول دروگاس در اشپرینگر به خاطر تشویق و صبرشان در اجازه دادن به ما برای انتشار کتابی در چنین زمینه‌ای که به سرعت در حال تغییر و رشد است، تشکر کنند. برخی از بخش‌های کتاب بر اساس انتشاراتی است که توسط نویسندگان این کتاب به طور مشترک نوشته شده است. ما مایلیم از همکاران تحقیقاتی خود قدردانی کنیم. در نهایت، مایلیم از خانواده‌ها، همکاران و دوستانمان به خاطر حمایتشان تشکر کنیم.

Back in June 2022, we (Pin-Yu Chen, Sijia Liu, and Sayak Paul) sensed that foundational models and generative AI were about to bring unprecedented and revolutionary changes to our technology and society, and we decided to propose a tutorial at NeurIPS to educate researchers and practitioners about this emerging AI research and technology and its implications for robustness and safety. Two months later, our tutorial, “Foundational Robustness of Foundation Models,” was accepted and to be presented on December 5, 2022. At that time, the world was still recovering from the Covid crisis, and NeurIPS 2022 was the first NeurIPS conference to allow physical attendance after Covid. To accommodate the hybrid conference mode, we were asked to record our tutorial by October 2022. In our materials, we correctly predicted that the proliferation of foundation models would bring increased risks and challenges in robustness, security, and safety, later known as part of the broad topic of AI safety, governance, and risk assessment. About a week before the official release of our tutorial and the start date of NeurIPS 2022, ChatGPT was launched by OpenAI on November 30, 2022. At the conference, we heard only a few whispers and genuine inquiries about “Have you heard of ChatGPT?” Who would have thought that in August 2024, the number of ChatGPT users worldwide would be more than 180 million? With such a coincidence in mind, we felt compelled to expand our tutorial into a book, summarizing the basics of foundation models and generative AI, and emphasizing the robustness and safety of these frontier models and AI technology. This book consists of three parts. Part I (Chaps.1 to 4) provides the fundamentals of foundation models, Part II (Chaps.5 to 11) includes advanced topics in founda-tion modes, and Part III (Chaps.12 to 18) presents safety and trust in foundation models. The mathematical notations will be defined and explained in each chapter. We provide an overview of each part as follows: • In Part I, Chap.1 provides an overview of foundation models and generative AI. Chapter 2 presents the technical background of neural networks. Chapter 3 delves into the learning and generalization of transformers. Chapter 4 formalizes in-context learning with transformers. • In Part II, Chap.5 introduces automated visual prompting techniques. Chapter 6 introduces prompting LLMs with privacy. Chapter 7 elucidates memory-efficient fine-tuning methods. Chapter 8 shows how LLMs can be reprogrammed for time-series machine learning tasks. Chapter 9 shows how LLMs can be reused for speech tasks. Chapter 10 introduces how synthetic datasets can be used to benchmark foundation models. Chapter 11 elucidates machine unlearning for foundation models. • In Part III, Chap.12 provides a comprehensive evaluation of the trustworthiness of LLMs. Chapter 13 introduces jailbreak attacks and defenses for LLMs. Chapter 14 presents safety risks when fine-tuning LLMs. Chapter 15 introduces watermarking techniques for LLMs. Chapter 16 presents robust detection of AI-generated text. Chapter 17 elucidates backdoor risks in diffusion models. Chapter 18 presents red-teaming methods for diffusion models. The authors would especially like to thank Paul Drougas at Springer for his encouragement and patience in allowing us to publish a book in such a rapidly changing and growing field. Some parts of the book are based on publications co-authored by the authors of this book. We would like to express our gratitude to our research collaborators. Finally, we would like to thank our families, colleagues, and friends, for their support.

این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:

Download: Introduction to Foundation Models

نظرات کاربران

  •  چنانچه دیدگاه شما توهین آمیز باشد تایید نخواهد شد.
  •  چنانچه دیدگاه شما جنبه تبلیغاتی داشته باشد تایید نخواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

بیشتر بخوانید

X
آموزش نقاشی سیاه قلم کانال ایتا