مجله علمی تفریحی بیبیس
0

دانلود کتاب برچسب گذاری داده ها در یادگیری ماشین با پایتون

بازدید 2276
  • عنوان کتاب: Data Labeling in Machine Learning with Python
  • نویسنده: Vijaya Kumar Suda
  • حوزه: یادگیری ماشین, پایتون
  • سال انتشار: 2022
  • تعداد صفحه: 397
  • زبان اصلی: انگلیسی
  • نوع فایل: pdf
  • حجم فایل: 8.13 مگابایت

در عصر مبتنی بر داده امروزی که روزانه بیش از 2.5 کوینتیلیون بایت داده به اشکال مختلف مانند متن، تصویر، صدا و ویدئو تولید می‌شود، داده‌ها سنگ بنای انقلاب هوش مصنوعی هستند. با این حال، اکثر داده‌های دنیای واقعی موجود برای آموزش مدل‌های یادگیری ماشینی تحت نظارت فاقد برچسب هستند، یا با داده‌های برچسب‌دار محدودی مواجه می‌شویم. این یک چالش مهم است، زیرا داده های برچسب گذاری شده برای آموزش هر مدل یادگیری ماشینی نظارت شده و تنظیم دقیق مدل های زبان بزرگ در عصر هوش مصنوعی ضروری است. برای رسیدگی به کمبود داده‌های برچسب‌گذاری‌شده و تسهیل آماده‌سازی داده‌های برچسب‌گذاری‌شده برای آموزش مدل‌های یادگیری ماشینی تحت نظارت و تنظیم دقیق مدل‌های زبان بزرگ، این کتاب روش‌های مختلفی را برای برچسب‌گذاری داده‌های برنامه‌ای با استفاده از کتابخانه‌ها و روش‌های پایتون، از جمله یادگیری نیمه‌نظارت‌شده و بدون نظارت، معرفی می‌کند. این کتاب شما را در فرآیند بارگیری و تجزیه و تحلیل داده‌های جدولی، تصاویر، ویدئوها، صدا و متن با استفاده از کتابخانه‌های مختلف پایتون، OpenAI API، LangChain و یادگیری ماشینی Azure راهنمایی می‌کند. این روش تکنیک‌هایی مانند نظارت ضعیف، شبه برچسب‌گذاری و خوشه‌بندی K-means را برای طبقه‌بندی و برچسب‌گذاری بررسی می‌کند، در حالی که روش‌های تقویت داده‌ها را برای افزایش دقت ارائه می‌دهد. این کتاب با استفاده از Azure OpenAI API و LangChain، اتوماسیون تجزیه و تحلیل داده ها را با استفاده از زبان طبیعی بدون نیاز به کسب هیچ گونه مهارت برنامه نویسی نشان می دهد. همچنین شامل طبقه‌بندی و برچسب‌گذاری داده‌های متنی با استفاده از OpenAI و مدل‌های زبان بزرگ (LLM) می‌شود. این کتاب طیف گسترده ای از ابزارهای حاشیه نویسی داده منبع باز را به همراه یادگیری ماشینی Azure پوشش می دهد و مزایا و معایب این ابزارها را با هم مقایسه می کند. نمونه های دنیای واقعی از صنایع مختلف برای نشان دادن کاربرد این روش ها در داده های جدولی، متنی، تصویری، ویدئویی و صوتی گنجانده شده است. با نتیجه گیری این کتاب، شما مهارت هایی را برای کشف انواع مختلف داده ها با استفاده از Python و OpenAI LLM به دست خواهید آورد. شما یاد خواهید گرفت که چگونه داده ها را با برچسب ها آماده کنید، چه برای آموزش مدل های یادگیری ماشینی یا باز کردن اطلاعات بینش در مورد داده ها برای استفاده در موارد استفاده تجاری در صنایع. این کتاب برای مهندسان مشتاق هوش مصنوعی، مهندسان یادگیری ماشین، دانشمندان داده و مهندسان داده است که می خواهند در مورد روش ها و الگوریتم های برچسب گذاری داده ها برای آموزش مدل بیاموزند. علاقه مندان به داده و توسعه دهندگان پایتون می توانند از این کتاب برای یادگیری در مورد کاوش داده ها و حاشیه نویسی با استفاده از کتابخانه های پایتون استفاده کنند.

In today’s data-driven era, where more than 2.5 quintillion bytes of data are produced daily in various forms such as text, image, audio, and video, data stands as the cornerstone of the AI revolution. However, the majority of real-world data available for training supervised machine learning models lacks labels, or we encounter limited labeled data. This presents a significant challenge, as labeled data is essential for training any supervised machine learning model and fine-tuning large language models in the age of generative AI. To address the scarcity of labeled data and facilitate the preparation of labeled data for training supervised machine learning models and fine-tuning large language models, this book introduces various methods for programmatic data labeling using Python libraries and methods, including semisupervised and unsupervised learning. This book guides you through the process of loading and analyzing tabular data, images, videos, audio, and text using various Python libraries, the OpenAI API, LangChain, and Azure Machine Learning. It explores techniques such as weak supervision, pseudo-labeling, and K-means clustering for classification and labeling, while also providing data augmentation methods to enhance accuracy. Utilizing the Azure OpenAI API and LangChain, the book demonstrates the automation of data analysis using natural language without the need to acquire any programming skills. It also encompasses the classification and data labeling of text data using OpenAI and large language models (LLMs). This book covers a wide variety of open source data annotation tools, along with Azure Machine Learning, and compares the pros and cons of these tools. Real-world examples from various industries are incorporated to illustrate the application of these methods to tabular, text, image, video, and audio data. By the conclusion of this book, you will have acquired the skills to explore different types of data using Python and OpenAI LLMs. You will have learned how to prepare data with labels, whether for training machine learning models or unlocking insights about the data to leverage for business use cases across industries. This book is for aspiring AI engineers, machine learning engineers, data scientists, and data engineers who want to learn about data labeling methods and algorithms for model training. Data enthusiasts and Python developers will be able to use this book to learn about data exploration and annotation using Python libraries.

این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:

Download: Data Labeling in Machine Learning with Python

نظرات کاربران

  •  چنانچه دیدگاه شما توهین آمیز باشد تایید نخواهد شد.
  •  چنانچه دیدگاه شما جنبه تبلیغاتی داشته باشد تایید نخواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

بیشتر بخوانید