- عنوان کتاب: Fundamentals of Data Engineering / Plan and Build Robust Data Systems
- نویسنده: Joe Reis Matt Housley
- حوزه: تحلیل داده, مهندسی داده
- سال انتشار: 2022
- تعداد صفحه: 446
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 8.73 مگابایت
هدف این کتاب پر کردن شکاف در محتوا و مواد مهندسی دادههای جاری است. در حالی که هیچ کمبودی در منابع فنی که به ابزارها و فناوریهای مهندسی دادههای خاص میپردازند وجود ندارد، مردم در تلاش برای درک چگونگی جمعآوری این مؤلفهها در یک کل منسجم که در دنیای واقعی کاربرد دارد، هستند. این کتاب نقاط چرخه عمر دادهها را به هم متصل میکند. این به شما نشان میدهد که چگونه فناوریهای مختلف را برای پاسخگویی به نیازهای مصرفکنندگان دادههای پاییندستی مانند تحلیلگران، دانشمندان داده و مهندسین یادگیری ماشین به هم پیوند دهید. این کتاب بهعنوان مکمل کتابهای O’Reilly است که جزئیات فناوریها، پلتفرمها و زبانهای برنامهنویسی خاص را پوشش میدهد. ایده بزرگ این کتاب چرخه عمر مهندسی داده است: تولید داده، ذخیره سازی، جذب، تبدیل و سرویس دهی. از زمان پیدایش دادهها، ما شاهد ظهور و سقوط فناوریهای خاص و محصولات فروشندههای بیشماری بودهایم، اما مراحل چرخه عمر مهندسی داده اساساً بدون تغییر باقی ماندهاند. با استفاده از این چارچوب، خواننده درک درستی برای استفاده از فناوریها در مسائل تجاری دنیای واقعی پیدا میکند. هدف ما در اینجا این است که اصولی را ترسیم کنیم که در دو محور قرار دارند. اول، ما می خواهیم مهندسی داده را به اصولی تقطیر کنیم که می تواند هر فناوری مرتبط را در بر گیرد. دوم، ما می خواهیم اصولی را ارائه کنیم که در آزمون زمان مقاومت کنند. ما امیدواریم که این ایدهها منعکسکننده درسهای آموختهشده از تحولات فناوری داده در بیست سال گذشته باشند و چارچوب ذهنی ما برای یک دهه یا بیشتر در آینده مفید باقی بماند. یک نکته قابل توجه است: ما بدون عذرخواهی رویکرد اول ابری را در پیش می گیریم. ما ابر را بهعنوان توسعهای اساساً دگرگونکننده میبینیم که برای دههها دوام خواهد آورد. اکثر سیستمهای داده داخلی و بارهای کاری در نهایت به میزبانی ابری منتقل میشوند. ما فرض میکنیم که زیرساختها و سیستمها زودگذر و مقیاسپذیر هستند و مهندسان داده به سمت استقرار خدمات مدیریتشده در فضای ابری متمایل میشوند. گفته می شود، بیشتر مفاهیم این کتاب به محیط های غیر ابری ترجمه می شوند.
This book aims to fill a gap in current data engineering content and materials. While there’s no shortage of technical resources that address specific data engineering tools and technologies, people struggle to understand how to assemble these components into a coherent whole that applies in the real world. This book connects the dots of the end-to-end data lifecycle. It shows you how to stitch together various technologies to serve the needs of downstream data consumers such as analysts, data scientists, and machine learning engineers. This book works as a complement to O’Reilly books that cover the details of particular technologies, platforms, and programming languages. The big idea of this book is the data engineering lifecycle: data generation, storage, ingestion, transformation, and serving. Since the dawn of data, we’ve seen the rise and fall of innumerable specific technologies and vendor products, but the data engineering lifecycle stages have remained essentially unchanged. With this framework, the reader will come away with a sound understanding for applying technologies to real-world business problems. Our goal here is to map out principles that reach across two axes. First, we wish to distill data engineering into principles that can encompass any relevant technology. Second, we wish to present principles that will stand the test of time. We hope that these ideas reflect lessons learned across the data technology upheaval of the last twenty years and that our mental framework will remain useful for a decade or more into the future. One thing to note: we unapologetically take a cloud-first approach. We view the cloud as a fundamentally transformative development that will endure for decades; most on-premises data systems and workloads will eventually move to cloud hosting. We assume that infrastructure and systems are ephemeral and scalable, and that data engineers will lean toward deploying managed services in the cloud. That said, most concepts in this book will translate to non-cloud environments.
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:
Download: Fundamentals of Data Engineering
نظرات کاربران