- عنوان کتاب: Production Ready Data Science: From Prototyping to Production with Python
- نویسنده: Khuyen Tran
- حوزه: برنامهنویسی داده محور
- تعداد صفحه: 276
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 4.77 مگابایت
این کتاب طیف گستردهای از مباحث ضروری برای ساخت برنامههای کاربردی علوم داده آماده برای تولید را پوشش میدهد. در اینجا مروری بر آنچه خواهید آموخت، آمده است: ۱. کنترل نسخه برای کد: سیستمهای کنترل نسخه مانند Git را بررسی کنید و یاد بگیرید که چگونه شیوههای کنترل نسخه را در کد خود اعمال کنید، که شما را قادر میسازد تغییرات را ردیابی کنید، با دیگران همکاری کنید و پایگاه کد خود را به طور موثر مدیریت کنید. ۲. مدیریت وابستگی: یاد بگیرید که چگونه وابستگیهای بسته پایتون را با استفاده از ابزارهایی مانند pip یا Poetry مدیریت کنید و محیطهای سازگار و قابل تکرار را برای پروژههای خود تضمین کنید. ۳. ماژولها و بستههای پایتون: بر ایجاد، سازماندهی و استفاده از ماژولها و بستههای پایتون برای ساختاردهی کارآمد کد خود و ارتقاء قابلیت استفاده مجدد تسلط پیدا کنید. ۴. متغیرها، توابع و کلاسهای پایتون: تکنیکهایی برای نوشتن کد تمیز و ماژولار با استفاده از متغیرها، توابع و کلاسها بیاموزید که امکان سازماندهی بهتر کد و قابلیت استفاده مجدد را فراهم میکند. ۵. تست واحد: یاد بگیرید که چگونه با استفاده از چارچوبهایی مانند pytest تستهای واحد مؤثر بنویسید، که شما را قادر میسازد اشکالات را زود تشخیص دهید، کیفیت کد را بهبود بخشید و تغییرات کد آینده را تسهیل کنید. ۶. پیکربندی پروژه: یاد بگیرید چگونه پارامترهای پیکربندی را از منطق کد جدا کنید، که امکان سفارشیسازی و استقرار آسانتر در محیطهای مختلف را فراهم میکند. ۷. ثبت وقایع و مدیریت استثنائات: یاد بگیرید چگونه پیامهای گزارش آموزندهای ایجاد کنید که به اشکالزدایی، عیبیابی و نظارت بر رفتار برنامه کمک میکنند. ۸. اعتبارسنجی دادهها: تکنیکهایی را برای اعتبارسنجی انواع دادهها، محدودهها، قالبها و سازگاری کشف کنید که شما را قادر میسازد خطوط لوله علوم داده قابل اعتمادتر و قویتری بسازید. ۹. کنترل نسخه برای دادهها: استراتژیها و ابزارهایی را برای نسخهبندی دادههای خود بیاموزید، از تکرارپذیری و قابلیت ردیابی در پروژههای علوم داده خود اطمینان حاصل کنید. ۱۰. پروژههای بستهبندی: نحوه ساختاردهی پروژه خود برای توزیع، ایجاد فایلهای راهاندازی و انتشار بسته خود در PyPI را کشف کنید و نصب و استفاده از کد خود را برای دیگران آسان کنید. ۱۱. ساخت یک خط لوله CI: یاد بگیرید چگونه یک ادغام مداوم (CI) را برای خودکارسازی تست کد و تولید مستندات راهاندازی کنید، کیفیت کد را تضمین کنید و توسعه مشارکتی را تسهیل کنید. ۱۲. بهترین روشهای Jupyter Notebook: تکنیکهای حرفهای برای ایجاد Jupyter Notebookهای ساختارمند، قابل تکرار و اشتراکگذاری، از جمله سازماندهی سلول، استفاده از markdown و ادغام کنترل نسخه.
The book covers a wide range of essential topics for building production-ready data science applications. Here’s an overview of what you’ll learn: 1. Version Control for Code: Explore version control systems like Git and learn how to apply version control practices to your code, enabling you to track changes, collaborate with others, and manage your codebase effectively. 2. Dependency Management: Learn how to handle Python package dependencies using tools like pip or poetry, ensuring consistent and reproducible environments for your projects. 3. Python Modules and Packages: Master the creation, organization, and use of Python modules and packages to structure your code efficiently and promote reusability. 4. Python Variables, Functions, and Classes: Learn techniques for writing clean and modular code using variables, functions, and classes, enabling better code organization and reusability. 5. Unit Testing: Learn how to write effective unit tests using frameworks like pytest, enabling you to catch bugs early, improve code quality, and facilitate future code changes. 6. Project Configuration: Learn how to separate configuration parameters from code logic, allowing for easier customization and deployment across different environments. 7. Logging and Exception Handling: Learn how to generate informative log messages that aid debugging, troubleshooting, and monitoring application behavior. 8. Data Validation: Discover techniques for validating data types, ranges, formats, and consistency, enabling you to build more reliable and robust data science pipelines. 9. Version Control for Data: Learn strategies and tools for versioning your data, ensuring reproducibility and traceability in your data science projects. 10. Packaging Projects: Discover how to structure your project for distribution, create setup files, and publish your package to PyPI, making it easy for others to install and use your code. 11. Building a CI Pipeline: Learn how to set up a Continuous Integration (CI) to automate code testing and documentation generation, ensuring code quality and facilitating collaborative development. 12. Jupyter Notebook Best Practices: Master techniques for creating well-structured, reproducible, and shareable Jupyter notebooks, including cell organization, markdown usage, and version control integration.
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:
Download: Production Ready Data Science

نظرات کاربران