Azure Databricks

Microsoft Azure를 통해 제공되는 Databricks의 데이터와 AI 서비스는 단순한 오픈 레이크하우스에 모든 데이터를 저장하고 모든 분석 및 AI 워크로드를 통합합니다.

Azure Databricks는 Azure에 최적화되어 있으며, Azure Data Lake Storage, Azure Data Factory, Azure Machine Learning, Azure Synapse Analytics, Power BI 등의 Azure 서비스와 긴밀히 통합되어 단순한 오픈 레이크하우스에 모든 데이터를 저장하고 모든 분석 및 AI 워크로드를 통합합니다.

배경 이미지

심플

데이터, 분석 및 AI 통합
모든 데이터 사용 사례를 단일 플랫폼에서 지원

오픈

데이터 에코시스템 통합
오픈 소스, 표준 및 형식 지원

협업

데이터 팀 통합
모든 데이터 및 AI 워크플로에서 협업

Azure Databricks<br />교육 시리즈 3부작

Azure Databricks
교육 시리즈 3부작

Azure Databricks를 사용하여 데이터 레이크하우스 구축을 시작하고, 어떤 기능이 있는지, 애널리스트가 어떻게 SQL을 활용하여 레이크하우스에서 데이터를 쿼리할 수 있는지 알아보세요. Azure Databricks로 고객 제품 사용 데이터를 사용하여 머신 러닝(ML) 모델을 훈련하는 방법을 배우실 수 있습니다.

자세히 알아보기 →

Azure Databricks가 필요한 이유

Apache Spark™
워크로드 성능 50배 향상

최대 50배 빠르게 작동하고 고도로 최적화된 Spark를 사용하여 자동 확장 컴퓨팅 클러스터를 배포할 수 있습니다.

자세히 알아보기 →

매일 수백만 시간에 달하는
서버 시간

Azure Databricks는 34개 이상의 Azure 리전에서 고객사 수천 곳이 매일 수백만 시간에 달하는 서버 시간을 실행하고 있습니다.

자세히 알아보기 →

사용 편이성

Azure Portal에서 클릭 한 번으로 시작하면 Azure 보안 및 데이터 서비스를 기본적으로 통합할 수 있습니다. 협업 데이터 엔지니어링과 데이터 사이언스로 최대 25%까지 생산성을 향상할 수 있습니다.

자세히 알아보기 →

산업 사용 사례




금융 서비스

Swiss Re
데이터 엔지니어링, 데이터 사이언스 및 애널리스트들의 데이터 분석을 통합했습니다.
HSBC
Azure Databricks를 사용하여 디지털 결제 플랫폼을 구축했습니다.
ABN AMRO
협업, AI 인사이트 및 고급 자동 머신 러닝 기능을 지원하여 분석 워크플로를 개선했습니다.
자세히 알아보기 →

리테일

Albertsons
성장과 혁신을 지원하기 위한 유연한 옴니채널 플랫폼을 제공했습니다.
Runtastic
Azure Databricks를 중심으로 분석 엔진을 구축하여 전 세계 사용자들이 건강과 활력을 유지하도록 돕습니다.
John Keells Holdings
공유된 셀프 서비스 플랫폼에 안전하게 액세스할 수 있게 하여 팀 간 협업을 지원합니다.
자세히 알아보기 →

의료 서비스 및 생명 공학

Providence Health Care
Azure Databricks와 Azure Event Hubs를 사용하여 데이터 스트리밍 솔루션을 구축했습니다.
Rush University Medical Center
Azure 클라우드를 사용하여 의료 부문에서 더욱 높은 성과를 거두었습니다.
CVS Health
데이터 + AI를 활용하여 약국 경험을 개인화하고 성과를 개선하도록 지원합니다.
자세히 알아보기 →

Azure Databricks 이벤트 참여

Azure Databricks 이벤트 참여

Databricks, Microsoft 및 파트너사들이 Azure Databricks를 위한 이벤트를 개최합니다. Azure에서 가장 빠르게 성장하고 있는 데이터 + AI 서비스에 해 자세히 알아보려면 가까운 곳에서 열리는 이벤트에 참여해보세요! 주제와 형식은 다를 수 있으므로, 자세한 내용은 각 이벤트 페이지를 참조하세요.

자세히 알아보기 →

Azure에 최적화

Azure 데이터 스토어와 서비스를 전문 커넥터와 통합하여 환경 내에서 빠르게 데이터에 액세스하고 간단히 관리하세요. 손쉽게 보안 컨트롤을 설정하고, 환경을 관리하며, 모든 Azure 데이터를 처리할 수 있습니다.

로고

Azure Databricks

배경 이미지

추천 통합

Azure Active Directory의 SSO는 Azure Databricks에 로그인하기에 가장 좋은 방법입니다. Azure Databricks는 Azure AD의 자동화된 사용자 프로비저닝으로 새로운 사용자를 생성하여 적절한 수준의 액세스 권한을 제공하고, 사용자를 제거하여 액세스 권한 디프로비저닝 기능도 지원합니다.

Azure Databricks는 MLflow를 통해 Microsoft Azure 머신 러닝(AML)을 통합하여 중앙에서 ML 실험을 추적하고 Azure 컨테이너에 온디맨드 추론을 위한 모델을 배포합니다. Azure Databricks는 AML SDK를 통해 AML의 자동 머신 러닝 기능도 제공합니다.

고객이 레이크하우스 전략을 도입할 때 BI 도구로 데이터 레이크에서 직접 데이터를 효율적이고 안전하게 사용하는 기능을 중요하게 생각합니다. 이 기능을 활용하면 데이터 레이크에 저장된 데이터를 BI에 사용하기 위해 데이터 웨어하우스로 복사하는 기존의 플로에서 발생하는 추가적인 레이턴시, 컴퓨팅 및 스토리지 비용을 절감할 수 있습니다. Power BI의 Azure Databricks 커넥터는 데이터 레이크에 저장된 데이터에 더욱 안전한 인터랙티브 데이터 시각화 경험을 제공합니다

Azure Databricks를 Azure DevOps와 연결하면 지속적 통합 및 지속적 배포(CI/CD)를 지원하는 데 도움이 됩니다. Azure DevOps를 Git 제공자로 구성하고 통합 버전 관리 기능을 활용할 수 있습니다.

Azure Databricks의 기본 배포는 Azure 기반의 완전 관리형 서비스로, 가상 네트워크(VNet)를 포함합니다. 또한 Azure Databricks는 가상 네트워크 배포(VNet 주입)를 지원하며, 네트워크 보안 규칙에 대한 완전한 제어를 제공합니다.

Azure Event Hubs를 Azure Databricks에 연결하여, 라이브 스트리밍 데이터에서 인사이트를 얻고 메시지를 수신하는 즉시 처리할 수 있습니다. Event Hubs 및 Azure Databricks를 사용하면 IoT 기기나 웹사이트 클릭스트림을 통한 로그에서 초당 수백만 건의 이벤트를 스트리밍하고, 실시간에 가깝게 처리할 수 있습니다.

Azure Key Vault와의 통합으로 키, 비밀번호 등의 암호를 관리합니다. 기본적으로 모든 Azure Databricks 노트북과 결과는 서로 다른 암호화 키로 저장된 상태에서 암호화됩니다. 노트북과 결과를 직접 암호화하는 데 사용하는 키를 소유하고 관리하고자 할 경우, 사용자의 고유 키(BYOK)를 사용할 수 있습니다.











Azure Active Directory의 SSO는 Azure Databricks에 로그인하기에 가장 좋은 방법입니다. Azure Databricks는 Azure AD의 자동화된 사용자 프로비저닝으로 새로운 사용자를 생성하여 적절한 수준의 액세스 권한을 제공하고, 사용자를 제거하여 액세스 권한 디프로비저닝 기능도 지원합니다.

Azure Databricks 네이티브 ADLS 커넥터데이터 레이크에 여러 가지 액세스 수단을 제공합니다. Azure Active Directory Credential Passthrough로 Azure Databricks에 로그인하는 데 사용했던 것과 동일한 Azure AD 자격 증명을 사용하여 데이터 액세스 보안을 단순화할 수 있습니다. 데이터 액세스는 이미 설정한 ADLS 역할 및 액세스 제어 목록을 통해 제어합니다.

Azure Data Factory를 사용하여 Azure Databricks 작업을 매끄럽게 실행하고, 90여 개의 내장 데이터 소스 커넥터를 활용하여 모든 데이터 소스를 단일 데이터 레이크에 수집합니다. ADF는 기본 워크플로 제어, 데이터 변환, 파이프라인 예약, 데이터 통합 등의 기능을 제공하여 안정적인 데이터 파이프라인을 구현하도록 지원합니다.

Azure Databricks는 MLflow를 통해 Microsoft Azure 머신 러닝(AML)을 통합하여 중앙에서 ML 실험을 추적하고 Azure 컨테이너에 온디맨드 추론을 위한 모델을 배포합니다. Azure Databricks는 AML SDK를 통해 AML의 자동 머신 러닝 기능도 제공합니다.

Azure Databricks는 Azure 서비스와 통합되며, Microsoft의 빌드 웹 및 모바일 애플리케이션에서 분석, 비즈니스 인텔리전스(BI), 데이터 사이언스를 함께 제공합니다. Azure Databricks와 Azure Synapse 사이의 고성능 커넥터는 데이터 스트리밍 지원은 물론이고, 서비스 간 데이터 전송을 지원합니다.

고객이 레이크하우스 전략을 도입할 때 BI 도구로 데이터 레이크에서 직접 데이터를 효율적이고 안전하게 사용하는 기능을 중요하게 생각합니다. 이 기능을 활용하면 데이터 레이크에 저장된 데이터를 BI에 사용하기 위해 데이터 웨어하우스로 복사하는 기존의 플로에서 발생하는 추가적인 레이턴시, 컴퓨팅 및 스토리지 비용을 절감할 수 있습니다. Power BI의 Azure Databricks 커넥터는 데이터 레이크에 저장된 데이터에 더욱 안전한 인터랙티브 데이터 시각화 경험을 제공합니다

Azure Databricks를 Azure DevOps와 연결하면 지속적 통합 및 지속적 배포(CI/CD)를 지원하는 데 도움이 됩니다. Azure DevOps를 Git 제공자로 구성하고 통합 버전 관리 기능을 활용할 수 있습니다.

Azure Databricks의 기본 배포는 Azure 기반의 완전 관리형 서비스로, 가상 네트워크(VNet)를 포함합니다. 또한 Azure Databricks는 가상 네트워크 배포(VNet 주입)를 지원하며, 네트워크 보안 규칙에 대한 완전한 제어를 제공합니다.

Azure Event Hubs를 Azure Databricks에 연결하여, 라이브 스트리밍 데이터에서 인사이트를 얻고 메시지를 수신하는 즉시 처리할 수 있습니다. Event Hubs 및 Azure Databricks를 사용하면 IoT 기기나 웹사이트 클릭스트림을 통한 로그에서 초당 수백만 건의 이벤트를 스트리밍하고, 실시간에 가깝게 처리할 수 있습니다.

Azure Key Vault와의 통합으로 키, 비밀번호 등의 암호를 관리합니다. 기본적으로 모든 Azure Databricks 노트북과 결과는 서로 다른 암호화 키로 저장된 상태에서 암호화됩니다. 노트북과 결과를 직접 암호화하는 데 사용하는 키를 소유하고 관리하고자 할 경우, 사용자의 고유 키(BYOK)를 사용할 수 있습니다.

시작할 준비가
되셨나요?

시작하기데모 예약