- عنوان کتاب: Web Scraping with Python
- نویسنده: Ryan Mitchell
- حوزه: برنامه نویسی پایتون
- سال انتشار: 2018
- تعداد صفحه: 306
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 6.49 مگابایت
برای کسانی که این مهارت را توسعه نداده اند، برنامه نویسی کامپیوتر می تواند نوعی جادو به نظر برسد. اگر برنامه نویسی جادویی است، خراش دادن وب یک جادوگری است: استفاده از جادو برای شاهکارهای بسیار چشمگیر و مفید – اما به طرز شگفت انگیزی بدون دردسر -. در سالهایی که بهعنوان مهندس نرمافزار فعالیت میکردم، متوجه شدهام که تعداد کمی از روشهای برنامهنویسی هیجان برنامهنویسان و افراد غیرمتخصص را به طور یکسان مانند خراش دادن وب جذب میکنند. توانایی نوشتن یک ربات ساده که دادهها را جمعآوری میکند و آنها را در یک ترمینال پخش میکند یا آنها را در یک پایگاه داده ذخیره میکند، اگرچه دشوار نیست، اما هرگز نمیتواند هیجان و حس احتمالی خاصی را ایجاد کند، مهم نیست که قبلاً چند بار این کار را انجام داده باشید. . متأسفانه، وقتی با برنامه نویسان دیگر در مورد خراش دادن وب صحبت می کنم، سوء تفاهم و سردرگمی زیادی در مورد این عمل وجود دارد. برخی از افراد مطمئن نیستند که قانونی است (اینطور است)، یا نحوه رسیدگی به مشکلاتی مانند صفحات سنگین جاوا اسکریپت یا لاگین های مورد نیاز. بسیاری در مورد چگونگی شروع یک پروژه بزرگ خراش دادن وب یا حتی محل پیدا کردن داده هایی که به دنبال آن هستند سردرگم هستند. این کتاب به دنبال پایان دادن به بسیاری از این سؤالات رایج و تصورات غلط در مورد خراش دادن وب است، در حالی که راهنمای جامعی برای اکثر کارهای متداول خراش دادن وب ارائه می دهد. خراش دادن وب یک زمینه متنوع و سریع در حال تغییر است، و من سعی کرده ام مفاهیم سطح بالا و مثال های عینی را برای پوشش تقریباً هر پروژه جمع آوری داده ای که احتمالاً با آن مواجه می شوید ارائه دهم. در سراسر کتاب، نمونه کدهایی برای نشان دادن این مفاهیم ارائه شده است و به شما امکان می دهد آنها را امتحان کنید. خود نمونههای کد را میتوان با یا بدون انتساب استفاده و اصلاح کرد (اگرچه همیشه قدردانی میشود). تمام نمونه کدها برای مشاهده و دانلود در GitHub موجود است.
To those who have not developed the skill, computer programming can seem like a kind of magic. If programming is magic, web scraping is wizardry: the application of magic for particularly impressive and useful—yet surprisingly effortless—feats. In my years as a software engineer, I’ve found that few programming practices capture the excitement of both programmers and laymen alike quite like web scraping. The ability to write a simple bot that collects data and streams it down a terminal or stores it in a database, while not difficult, never fails to provide a certain thrill and sense of possibility, no matter how many times you might have done it before. Unfortunately, when I speak to other programmers about web scraping, there’s a lot of misunderstanding and confusion about the practice. Some people aren’t sure it’s legal (it is), or how to handle problems like JavaScript-heavy pages or required logins. Many are confused about how to start a large web scraping project, or even where to find the data they’re looking for. This book seeks to put an end to many of these common questions and misconceptions about web scraping, while providing a comprehensive guide to most common web scraping tasks. Web scraping is a diverse and fast-changing field, and I’ve tried to provide both highlevel concepts and concrete examples to cover just about any data collection project you’re likely to encounter. Throughout the book, code samples are provided to demonstrate these concepts and allow you to try them out. The code samples themselves can be used and modified with or without attribution (although acknowledgment is always appreciated). All code samples are available on GitHub for viewing and downloading.
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:
Download: Web Scraping with Python
نظرات کاربران