隨著資料量的增加和資料來源的多樣化,團隊面臨著實施全面的資料目錄解決方案的壓力。 Databricks Unity Catalog 是一個統一的治理解決方案,適用於任何雲端上 Lakehouse 中的所有資料和 AI 資產,包括檔案、表格、機器學習模型和儀表板。
該解決方案提供了一個用於分類
組織和管理異質資料來源的整合解決方案,使資料工程師、資料科學人員和分析師能夠更輕鬆地存取和使用他們所需的資料。
憑藉著資料發現、資料沿襲和治理功能等功能,Unity Catalog 讓團隊能夠充分發揮資料的潛力。
Unity Catalog 還提供哪些
其他功能?繼續閱讀以找出答案。
什麼是 Databricks Unity 目錄?
Databricks Unity Catalog 是 Lakehouse 中第一個資料與人工智慧的統一治理解決方案。團隊可以使用 Unity Catalog 跨任何雲端或平台管理結構化和非結構化資料、機器學習模型、筆記本、儀表板和檔案。
Unity Catalog 還使資料從業者能
夠安全地搜尋、存取和協作可信賴的資料和 AI 資產,利用 AI 來提高生產力並釋放 Lakehouse 環境的全部潛力。
單一治理框架加速了資 南非 WhatsApp 號碼數據 料和人工智慧的發展,同時簡化了監管合規性。
為什麼 Databricks 創建 Unity Catalog?
Databricks 創建了 Unity Catalog 作為其資料平台的資料儲存和處理方面的後續產品。接下來,該公司開始為兩個服務不足的領域開發組件:發現和治理。
目標是開發一個資料編目、發現和治理解決方案,該解決方案將與 Databricks 生態系統無縫集成,特別是在處理 Lakehouse 架構中的各種資產類型時。
Unity Catalog 於 2021 年中期推出
旨在解決資料治理挑戰。在其最初 此外區分行動處理和桌面處理也 發布的部落格文章中,Databricks 提到現有技術中缺乏對資料湖的精細安全控制。 2022 年 4 月,該解決方案針對 Azure 和 AWS 進行了有限發布,並於 2022 年 8 月發布了 GA 版本。
使用 Databricks Unity Catalog 的好處
Databricks 的目標是在其 Lakehouse 架構中結合兩個世界的優點:資料倉儲和資料湖。它適用於結構化和非結構化數據,支援各 清潔新聞 種工作負載,並可能使數據團隊的任何成員受益,從數據工程師到數據分析師再到機器學習工程師。
改善資料治理Unity Catalog 作為資
料治理層,具有用於資料搜尋和發現的複雜使用者介面。它打破了資料孤島並使整個組織的資料民主化。它可以幫助資料專家找到各種用例的相關資產,包括商業智慧、分析和機器學習。
更輕鬆的元資料管理
對於所有 Databricks 資料資產,包括表格、文件、儀表板和機器學習模型,Unity Catalog 提供單一元
資料管理和資料治理層該目錄包
括細粒度的存取控制、內建資料搜尋和自動資料沿襲(監控資料流以識別其來源)。
提高 Databricks 的安全性
Unity Catalog 提供集中式、細粒度的存取限制,讓您能夠將特定行和列限制為指定群組,進一步增強了 Databricks 兩平面基礎架構中內建的安全性。