데이터브릭스 데이터 인텔리전스 플랫폼은 탁월한 유연성을 제공하여 사용자가 거의 즉각적이고 수평적으로 확장 가능한 컴퓨팅 리소스에 액세스할 수 있습니다. 이렇게 쉽게 리소스를 생성할 수 있으므로, 이를 제대로 관리하지 않으면 클라우드 비용이 무분별하게 증가할 수 있습니다.
복잡한 기술 생태계에서 작업할 때는 미지의 요소를 사전에 파악하는 것이 플랫폼 안정성을 유지하고 비용을 통제하는 데 중요합니다. 통합 가시성은 생성되는 데이터를 기반으로 시스템을 분석하고 최적 화할 수 있는 방법을 제공합니다. 이는 모니터링과는 다른데, 모니터링은 알려진 문제를 추적하기보다는 새로운 패턴을 파악하는 데 중점을 둡니다.
태그 지정(Tagging): 태그를 사용하여 리소스와 요금을 분류하세요. 이를 통해 보다 세분화된 비용 할당이 가능합니다.
시스템 테이블: 시스템 테이블을 활용하여 자동화된 비용 추적과 비용 할당을 수행하세요.
클라우드 네이티브 비용 모니터링 도구: 이러한 도구를 활용하여 모든 리소스의 비용에 대한 인사이트를 얻으세요.
시스템 테이블은 시스템 카탈로그에 있는 고객 계정의 운영 데이터에 대해 데이터브릭스가 호스팅하여 제공하는 분석 저장소로, 뛰어난 통합 가시성 기능을 제공합니다. 계정 전체에 대한 과거 이력 관찰 기능을 제공하며 플랫폼 원격 분석에 대한 사용자 친화적인 테이블 형식의 정보를 포함합니다. 청구 사용량 데이터와 같은 주요 인사이트는 시스템 테이블(현재 DBU의 List Price만 포함)에서 사용할 수 있으며, 각 사용량 기록은 리소스의 청구 가능한 사용량의 시간별 집계를 나타냅니다.
시스템 테이블은 Unity Catalog에서 관리하며, 액세스하려면 Unity Catalog가 활성화된 워크스페이스가 필요합니다. 시스템 테이블에는 모든 워크스페이스의 데이터가 포함되지만 활성화된 워크스페이스에서만 쿼리할 수 있습니다. 시스템 테이블 활성화는 스키마 수준에서 이루어지며, 스키마를 활성화하면 해당 스키마의 모든 테이블이 활성화됩니다. 관리자는 API를 사용하여 새 스키마를 수동으로 활성화해야 합니다.
데이터브릭스 태그를 사용하면 리소스에 속성(키-값 쌍)을 적용하여 더 나은 정리, 검색 및 관리를 할 수 있습니다. 비용 추적과 비용 할당을 위해 팀은 데이터브릭스 Job과 컴퓨팅(클러스터, SQL 웨어하우스)에 태그를 지정하여 사용량과 비용을 추적하고 특정 팀이나 부서에 할당할 수 있습니다.
사용량과 비용 추적을 위해 다음 데이터브릭스 리소스에 태그를 적용할 수 있습니다:
이러한 태그가 적용되면 billable usage 시스템 테이블을 사용하여 자세한 비용 분석을 수행할 수 있습니다.
비용을 모니터링하고 조직의 비즈니스 단위 및 팀에 대한 데이터브릭스 사용량을 정확하게 귀속시키기 위해(예컨대 비용 할당을 위해) 워크스페이스 (및 관련 관리 리소스 그룹)과 컴퓨팅 리소스에 태그를 지정할 수 있습니다.
다음 표에서는 태그를 적용할 수 있는 Azure 데이터브릭스 개체를 자세히 설명합니다. 이러한 태그는 포털에서 액세스할 수 있는 자세한 비용 분석 보고서와 billable usage 시스템 테이블로 전파될 수 있습니다. Azure의 태그 전파와 제약 사항에 대해 자세한 내용을 확인하세요.
Azure Databricks Object | Tagging Interface (UI) | Tagging Interface (API) |
---|---|---|
Workspace | Azure Portal | Azure Resources API |
Pool | Pools UI in the Azure Databricks workspace | Instance Pool API |
All-purpose & Job compute | Compute UI in the Azure Databricks workspace | Clusters API |
SQL Warehouse | SQL warehouse UI in the Azure Databricks workspace | Warehouse API |
다음 표는 태그를 적용할 수 있는 AWS 데이터브릭스 개체를 자세히 설명합니다. 이러한 태그는 비용 분석을 위해 사용 로그와 AWS EC2 및 AWS EBS 인스턴스에 모두 전파될 수 있습니다. billable usage 데이터를 보려면 시스템 테이블(공개 미리 보기)을 사용할 것을 권장합니다. AWS의 태그 전파와 제약 사항에 대한 자세한 내용을 확인하세요.
AWS Databricks Object | Tagging Interface (UI) | Tagging Interface (API) |
---|---|---|
Workspace | N/A | Account API |
Pool | Pools UI in the Databricks workspace | Instance Pool API |
All-purpose & Job compute | Compute UI in the Databricks workspace | Clusters API |
SQL Warehouse | SQL warehouse UI in the Databricks workspace | Warehouse API |
다음 표는 태그를 적용할 수 있는 GCP 데이터브릭스 개체를 자세히 설명합니다. 이러한 태그/레이블은 컴퓨팅 리소스에 적용할 수 있습니다. GCP에서의 태그/레이블 전파와 제약 사항에 대한 자세한 내용을 확인하세요.
계정 콘솔의 데이터브릭스 billable usage 그래프는 개별 태그별로 사용량을 집계할 수 있습니다. 같은 페이지에서 다운로드한 billable usage CSV 보고서에는 기본 및 사용자 지정 태그도 포함됩니다. 태그는 GKE 및 GCE 레이블에도 전파됩니다.
GCP Databricks Object | Tagging Interface (UI) | Tagging Interface (API) |
---|---|---|
Pool | Pools UI in the Databricks workspace | Instance Pool API |
All-purpose & Job compute | Compute UI in the Databricks workspace | Clusters API |
SQL Warehouse | SQL warehouse UI in the Databricks workspace | Warehouse API |