(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)
Google BigQuery를 위한 Lakehouse Federation의 일반 사용 가능성과 Oracle 및 Teradata를 위한 공개 미리보기를 발표하게 되어 기쁩니다. 이제 Unity Catalog를 통해 이러한 소스에서 데이터를 연결, 발견, 관리, 쿼리할 수 있습니다—이동이나 ETL 없이. 이는 데이터 접근을 더욱 쉽게 만들면서 개방적이고 상호 운용 가능한 레이크하우스 아키텍처를 보장합니다.
Lakehouse Federation은 사용자가 데이터를 복제하거나 전송하지 않고도 다양한 데이터베이스, 데이터 웨어하우스, 카탈로그 간에 데이터를 쿼리하고 분석할 수 있게 합니다. 외부 데이터 소스를 Unity Catalog에 직접 통합함으로써, 조직은 다음을 수행할 수 있습니다:
Lakehouse Federation은 MySQL, PostgreSQL, Teradata, Oracle, Amazon Redshift, Salesforce Data Cloud, Snowflake, Microsoft SQL Server, Azure Synapse (SQL Data Warehouse), Google BigQuery, Hive metastore 등 다양한 플랫폼을 지원하며, 더 많은 커넥터가 곧 추가될 예정입니다.
Google BigQuery를 위한 Lakehouse Federation의 GA 릴리스를 통해, 사용자는 이제 데이터 이동이나 복제 없이 BigQuery 데이터를 Databricks에 연결할 수 있습니다. 이를 통해 사용자는 GCP, Azure 또는 AWS의 Databricks 환경에서 BigQuery 데이터에 직접 작업을 실행하면서 Unity Catalog의 세분화된 거버넌스를 활용하여 보안 및 효율적인 데이터 관리를 할 수 있습니다.
이 통합은 다음을 가능하게 합니다:
BigQuery를 위한 Lakehouse Federation은 우리의 Google Cloud와 Azure 환경을 원활하게 연결했습니다. 데이터 이동이나 복제의 필요 없이, 이제 우리는 Azure에서 Databricks를 사용하여 BigQuery 데이터에 직접 Python 및 SQL 작업을 실행할 수 있으며, 이 모든 것은 Unity Catalog의 세밀한 거버넌스의 혜택을 받으면서 가능합니다. 이것은 우리의 멀티 클라우드 전략에 대한 게임 체인저로, 운영을 간소화하고 분석을 향상시킵니다— Lisa Fiege, 데이터 과학 엔지니어, Taylor Farms
Google BigQuery 커넥터는 이제 DBR 버전 16.1부터 시작하여 곧 Databricks SQL에서 사용 가능할 것입니다.
BigQuery를 위한 GA 발표 외에도, Databricks는 Teradata와 Oracle 커넥터를 공개 미리보 기로 소개하고 있습니다. 이 새로운 커넥터들은 사용자가 Lakehouse Federation의 범위를 더 많은 데이터 소스로 확장할 수 있게 해주어, 데이터 자산을 더욱 통합할 수 있게 합니다.
Google BigQuery, Oracle 및 Teradata를 위한 Lakehouse Federation 커넥터를 시작하는 방법에 대한 문서를 읽어보세요: