Open Sourcing di Unity Catalog
Type
Video on-demand
Durata
5 minuti 31 secondi
Che cosa imparerai
In questo video, imparerai a conoscere Unity Catalog, il primo catalogo open source del settore per la governance dei dati e dell'IA su cloud, formati di dati e piattaforme di dati. Ecco i pilastri più importanti della visione di Unity Catalog:
- API open source e implementazione: È costruito sulla specifica OpenAPI e su un'implementazione di server open source sotto la Licenza Apache 2.0. È anche compatibile con l'API Spark Hive Metastore e l'API REST di Apache Iceberg™.
- Supporto multi-formato: È estensibile e supporta Delta Lake, Apache Iceberg tramite UniForm, Apache Parquet, CSV e tutti gli altri formati disponibili.
- Supporto multi-motore: Con le sue API aperte, Unity Catalog permette a praticamente tutti i motori di calcolo di leggere i dati catalogati.
- Multimodale: Supporta tutti i tuoi dati e asset di intelligenza artificiale, inclusi tabelle, file, funzioni e modelli di intelligenza artificiale.
- Ecosistema vibrante: Questo è uno sforzo comunitario e siamo estremamente entusiasti di essere supportati da Amazon Web Services, Microsoft Azure, Google Cloud, NVIDIA, Salesforce, DuckDB, LangChain, dbt Labs, Fivetran, Confluent, Unstructured, Onehouse, Immuta, Informatica e molti altri.
Il progetto è disponibile su GitHub oggi come primo passo nel nostro percorso verso la realizzazione della visione del Catalogo Unity in open source. Il Catalogo Unity è ospitato da LF AI & Data, una fondazione ombrello della Linux Foundation che supporta l'innovazione open source in intelligenza artificiale e dati, e siamo entusiasti di lavorare con le comunità open source nei prossimi anni per realizzare questa visione.