- عنوان: Pandas-Workout/MEAP-v11
- نویسنده: Reuven-M.-Lerner
- حوزه: برنامهنویسی پایتون، Pandas
- تعداد صفحه: 314
- سال انتشار: 2022
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 9.69 مگابایت
اگر تجربهای با پانداها دارید، میدانید که ما معمولاً با دادهها در جداول دو بعدی، معروف به «فریمهای داده» با ردیفها و ستونها کار میکنیم. اما هر ستون در یک قاب داده از یک “سری” ساخته شده است، یک ساختار داده یک بعدی، به این معنی که شما می توانید یک قاب داده را مجموعه ای از سری ها در نظر بگیرید. این دیدگاه بهویژه زمانی مفید است که بدانید چه روشهایی در یک سری در دسترس هستند، زیرا بیشتر آن روشها در چارچوبهای داده نیز در دسترس هستند – فقط بهجای دریافت یک نتیجه، یک نتیجه برای هر ستون در قاب داده دریافت میکنیم. به عنوان مثال، روش میانگین، زمانی که برای یک سری اعمال می شود، میانگین مقادیر موجود در سری را برمی گرداند. اگر میانگین را در یک قاب داده فراخوانی کنید، پانداها روش میانگین را در هر ستون فراخوانی میکنند و مجموعهای از مقادیر میانگین را برمیگردانند. علاوه بر این، آن مقادیر خود به صورت یک سری برگردانده میشوند، که میتوانید روشهای بیشتری را روی آنها فراخوانی کنید. درک عمیق سریها میتواند به روشهای دیگری نیز مفید باشد: سریها اغلب برای بازیابی عناصر منتخب یک سری دیگر یا حتی یک قاب داده کامل، با استفاده از عملکرد «شاخص بولین» یا «نمایه ماسک» که معمولاً در پانداها استفاده میشود، استفاده میشوند. . با توجه به اینکه هر چند وقت یکبار میخواهیم بخشهای خاصی از یک قاب داده را بازیابی کنیم، دانستن بهترین روش استفاده از این عملکرد مهم است. در نهایت، یکی از ابزارهای مهم و قدرتمندی که ما به عنوان کاربران پاندا در اختیار داریم، ایندکس است. در فصلهای بعدی به نمایهها با عمق بیشتری نگاه خواهیم کرد، اما دانستن نحوه تنظیم و اصلاح یک شاخص، و همچنین بازیابی مقادیر با استفاده از مقادیر منحصر به فرد و غیر منحصر به فرد، تقریباً هر بار که از پانداها استفاده میکنید مفید است. بنابراین، این فصل به شما کمک می کند تا نحوه استفاده موثر از شاخص ها را بهتر درک کنید.
If you have any experience with pandas, then you know that we typically work with data in two-dimensional tables, known as “data frames,” with rows and columns. But each column in a data frame is built from a “series,” a one-dimensional data structure, which means that you can think of a data frame as a collection of series. This perspective is particularly useful once you learn what methods are available on a series, because most of those methods are also available on data frames—only instead of getting a single result, we’ll get one result for each column in the data frame. For example, the mean method, when applied to a series, returns the mean of the values in the series. If you invoke mean on a data frame, then pandas will invoke the mean method on each column, returning a collection of mean values. Moreover, those values are themselves returned as a series, on which you can invoke further methods. Deep understanding of series can be useful in other ways, too: Series are often used to retrieve selected elements of another series, or even of an entire data frame, using the “boolean index” or “mask index” functionality that’s commonly used in pandas. Given how often we want to retrieve specific parts of a data frame, knowing how best to use this functionality is important. Finally, one of the most important and powerful tools we have as pandas users is the index. We’ll look at indexes in greater depth in later chapters, but knowing how to set and modify an index, as well as retrieve values using unique and non-unique values, comes in handy just about every time you use pandas. This chapter will thus help you to better understand how to use indexes effectively.
این کتاب را میتوانید بصورت رایگان از لینک زیر دانلود نمایید.
Download: Pandas-Workout
نظرات کاربران