مجله علمی تفریحی بیبیس
0

دانلود کتاب مدلسازی مرتب با R – چارچوبی برای مدل سازی در Tidyverse

بازدید 926
  • عنوان کتاب: Tidy Modeling with R / A Framework for Modeling in the Tidyverse
  • نویسنده: Max Kuhn and Julia Silge
  • حوزه: زبان مدل سازی
  • سال انتشار: 2022
  • تعداد صفحه: 626
  • زبان اصلی: انگلیسی
  • نوع فایل: pdf
  • حجم فایل: 20.0 مگابایت

به Tidy Modeling با R خوش آمدید! این کتاب راهنمای استفاده از مجموعه ای از نرم افزارهای زبان برنامه نویسی R برای مدل سازی به نام tidymodels است و دو هدف اصلی دارد: اول و مهمتر از همه، این کتاب مقدمه ای عملی در مورد نحوه استفاده از این بسته های R خاص برای ایجاد مدل ها ارائه می دهد. . ما بر روی گویش R به نام tidyverse تمرکز می کنیم که با فلسفه ای سازگار و انسان محور طراحی شده است و نشان می دهد که چگونه می توان از بسته های tidyverse و tidymodels برای تولید مدل های آماری و یادگیری ماشینی با کیفیت بالا استفاده کرد. دوم، این کتاب به شما نشان می‌دهد که چگونه روش‌های خوب و روش‌های آماری را توسعه دهید. در صورت امکان، نرم افزار، اسناد و سایر مواد ما سعی می کنند از مشکلات رایج جلوگیری کنند. در فصل 1، ما یک طبقه بندی برای مدل ها را ترسیم می کنیم و نشان می دهیم که نرم افزار خوب برای مدل سازی چگونه است. ایده‌ها و نحو از tidyverse، که در فصل 2 معرفی (یا مرور) می‌کنیم، مبنایی برای رویکرد tidymodels به این چالش‌های روش‌شناسی و عملی است. فصل 3 یک تور سریع از توابع مدل سازی پایه معمولی R ارائه می دهد و نیازهای برآورده نشده در آن ناحیه را خلاصه می کند. پس از آن، این کتاب به بخش‌هایی تقسیم می‌شود و با مبانی مدل‌سازی با اصول داده‌های مرتب شروع می‌شود. فصل‌های 4 تا 9 یک مجموعه داده نمونه را در مورد قیمت خانه معرفی می‌کنند و نحوه استفاده از بسته‌های اصولی مدل‌های منظم را نشان می‌دهند: دستور العمل‌ها، ازگیل، گردش کار، معیار، و موارد دیگر. بخش بعدی کتاب با جزئیات بیشتر در مورد روند ایجاد یک مدل موثر پیش می رود. فصل های 10-15 بر ایجاد تخمین های خوب از عملکرد و همچنین تنظیم فراپارامترهای مدل تمرکز دارند. در نهایت، آخرین بخش این کتاب، فصل های 16 تا 21 سایر موضوعات مهم برای ساخت مدل را پوشش می دهد. ما در مورد رویکردهای پیشرفته‌تر مهندسی ویژگی‌ها مانند کاهش ابعاد و رمزگذاری پیش‌بینی‌کننده‌های با کاردینالیته بالا، و همچنین نحوه پاسخ به سؤالات درباره اینکه چرا یک مدل پیش‌بینی‌های خاصی انجام می‌دهد و چه زمانی به پیش‌بینی‌های مدل خود اعتماد کنیم، بحث می‌کنیم. ما فرض نمی کنیم که خوانندگان تجربه گسترده ای در ساخت مدل و آمار داشته باشند. برخی از دانش های آماری مورد نیاز است، مانند نمونه گیری تصادفی، واریانس، همبستگی، رگرسیون خطی پایه و سایر موضوعاتی که معمولاً در دوره های آمار پایه کارشناسی یا تجزیه و تحلیل داده ها یافت می شوند. ما فرض می کنیم که خواننده حداقل کمی با dplyr، ggplot2 و عملگر %>% “pipe” در R آشنا است و علاقه مند به استفاده از این ابزارها در مدل سازی است. برای کاربرانی که هنوز این دانش پیش‌زمینه R را ندارند، کتاب‌هایی مانند R for Data Science توسط Wickham and Grolemund (2016) را توصیه می‌کنیم. بررسی و تجزیه و تحلیل داده ها بخش مهمی از هر فرآیند مدل است. این کتاب به عنوان یک مرجع جامع در مورد تکنیک های مدل سازی در نظر گرفته نشده است. ما منابع دیگری را برای کسب اطلاعات بیشتر در مورد روش های آماری پیشنهاد می کنیم. برای پیشینه کلی در مورد رایج ترین نوع مدل، مدل خطی، ما Fox (2008) را پیشنهاد می کنیم. برای مدل های پیش بینی، کوهن و جانسون (2013) و کوهن و جانسون (2020) منابع خوبی هستند. برای روش‌های یادگیری ماشین، Goodfellow، Bengio و Courville (2016) یک منبع عالی (اما رسمی) اطلاعات است. در برخی موارد، مدل‌هایی را که از آنها استفاده می‌کنیم، با جزئیات توضیح می‌دهیم، اما به روشی که ریاضیات کمتری دارد و امیدواریم شهودی‌تر باشد.

Welcome to Tidy Modeling with R! This book is a guide to using a collection of software in the R programming language for model building called tidymodels, and it has two main goals: First and foremost, this book provides a practical introduction to how to use these specific R packages to create models. We focus on a dialect of R called the tidyverse that is designed with a consistent, human-centered philosophy and demonstrate how the tidyverse and the tidymodels packages can be used to produce high quality statistical and machine learning models. Second, this book will show you how to develop good methodology and statistical practices. Whenever possible, our software, documentation, and other materials attempt to prevent common pitfalls. In Chapter 1, we outline a taxonomy for models and highlight what good software for modeling is like. The ideas and syntax of the tidyverse, which we introduce (or review) in Chapter 2, are the basis for the tidymodels approach to these challenges of methodology and practice. Chapter 3 provides a quick tour of conventional base R modeling functions and summarizes the unmet needs in that area. After that, this book is separated into parts, starting with the basics of modeling with tidy data principles. Chapters 4–9 introduce an example data set on house prices and demonstrate how to use the fundamental tidymodels packages: recipes, parsnip, workflows, yardstick, and others. The next part of the book moves forward with more details on the process of creating an effective model. Chapters 10–15 focus on creating good estimates of performance as well as tuning model hyperparameters. Finally, the last section of this book, Chapters 16–21 cover other important topics for model building. We discuss more advanced feature engineering approaches like dimensionality reduction and encoding high-cardinality predictors, as well as how to answer questions about why a model makes certain predictions and when to trust your model predictions. We do not assume that readers have extensive experience in model building and statistics. Some statistical knowledge is required, such as random sampling, variance, correlation, basic linear regression, and other topics that are usually found in a basic undergraduate statistics or data analysis course. We do assume that the reader is at least slightly familiar with dplyr, ggplot2, and the %>% “pipe” operator in R, and is interested in applying these tools to modeling. For users who don’t yet have this background R knowledge, we recommend books such as R for Data Science by Wickham and Grolemund (2016). Investigating and analyzing data is an important part of any model process. This book is not intended to be a comprehensive reference on modeling techniques; we suggest other resources to learn more about the statistical methods themselves. For general background on the most common type of model, the linear model, we suggest Fox (2008). For predictive models, Kuhn and Johnson (2013) and Kuhn and Johnson (2020) are good resources. For machine learning methods, Goodfellow, Bengio, and Courville (2016) is an excellent (but formal) source of information. In some cases, we do describe the models we use in some detail, but in a way that is less mathematical, and hopefully more intuitive.

این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:

Download: Tidy Modeling with R

نظرات کاربران

  •  چنانچه دیدگاه شما توهین آمیز باشد تایید نخواهد شد.
  •  چنانچه دیدگاه شما جنبه تبلیغاتی داشته باشد تایید نخواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

بیشتر بخوانید