- عنوان کتاب: Data Governance with Unity Catalog on Databricks Implement Data and AI Governance with Databricks Data Intelligence Platform
- نویسنده: Kiran Sreekumar, Karthik Subbarao
- حوزه: جکمرانی داده
- سال انتشار: 2025
- تعداد صفحه: 385
- زبان اصلی: انگلیسی
- نوع فایل: pdf
- حجم فایل: 13.9 مگابایت
به مدیریت دادهها با Unity Catalog در Databricks خوش آمدید. در گذار فعلی از دههای که تحت سلطه تکامل فرمتهای فایل بود، دوره بعدی با اهمیت کاتالوگها شکل میگیرد. از زمان معرفی آن در سال 2021، Unity Catalog به عنوان جزء بنیادی پلتفرم هوش داده Databricks ظهور کرده است. منبع باز Unity Catalog امکانات جدیدی را برای نوآوری در مدیریت ایجاد کرده و بر محدودیتهای ابزار سنتی غلبه کرده است. با ادامه تغییر صنعت به سمت فناوریهای باز و قابل تعامل، Unity Catalog به عنوان یک کاتالوگ باز و قابل توسعه برجسته است. API باز آن و ادغام با فرمتهای فایل و برنامههای پیشرو در حوزه داده و هوش مصنوعی، انعطافپذیری بینظیری را فراهم میکند. Unity Catalog با تکیه بر این پایه، با پشتیبانی بومی از کاتالوگ Delta و Iceberg REST و جداول، نماها، فایلهای ذخیرهسازی ابری، مدلها و توابع هوش مصنوعی، یک کاتالوگ چندوجهی واقعی است که یک تجربه مدیریت داده یکپارچه را ارائه میدهد. وقتی برای اولین بار ایده این کتاب را به O’Reilly ارائه دادیم، Unity Catalog یک جزء اختصاصی پلتفرم Databricks بود. در طول نگارش کتاب، Unity Catalog متنباز شد و پیشرفتها و ویژگیهای جدید متعددی را در خود جای داد. با وجود اینکه معماری آن در طول زمان دستخوش تغییرات و تکامل قابل توجهی شده است، اصول اساسی و پیادهسازی مدیریت آن نسبتاً ثابت مانده است. با بیش از سه سال همکاری نزدیک با Unity Catalog، ما به اهمیت درک کامل مفاهیم اصلی آن پی بردیم. ما تشخیص دادیم که زمان مناسبی برای مستندسازی این عناصر بنیادی و همچنین ویژگیها و قابلیتهایی است که در حال حاضر در دسترس عموم هستند.
Welcome to Data Governance with Unity Catalog on Databricks. In the current transition from a decade dominated by the evolution of file formats, the next era is being shaped by the prominence of catalogs. Since its introduction in 2021, Unity Catalog has emerged as the foundational component of the Databricks Data Intelligence Platform. The open sourcing of Unity Catalog has unlocked new possibilities for governance innovation, overcoming traditional tool limitations. As the industry continues its shift toward open and interoperable technologies, Unity Catalog stands out as an open and extensible catalog. Its open API and integration with leading file formats and applications in the data and AI landscape enable unparalleled flexibility. Building on this foundation, with native support for Delta and Iceberg REST catalog and tables, views, cloud storage files, AI models, and functions, Unity Catalog is a true multimodal catalog that provides a unified data-management experience. When we first pitched the idea of this book to O’Reilly, Unity Catalog was a proprietary component of the Databricks Platform. Over the course of the book’s writing, Unity Catalog became open source and incorporated numerous enhancements and new features. Despite the architecture having undergone significant changes and evolution over time, the fundamental principles and governance implementation have remained relatively consistent. Having worked closely with Unity Catalog for over three years, we recognized the importance of solidly understanding its core concepts. We determined that the time was ripe to document these foundational elements, as well as the features and functionalities that are currently publicly available.
این کتاب را میتوانید از لینک زیر بصورت رایگان دانلود کنید:

نظرات کاربران