Databricks는 대규모 데이터 작업을 효율적으로 처리하기 위한 개방형 통합 플랫폼으로 다른 솔루션에 비해 훨씬 저렴한 비용으로 수행할 수 있습니다. 데이터와 AI 분야의 혁신 기업으로서 기술을 끊임없이 발전시켜 고객에게 더 나은 성능과 효율성, 그리고 무엇보다 높은 투자 수익률(ROI)을 제공하는 새로운 방법을 지속적으로 모색하고 있습니다.
우리는 데이터 중심 기업입니다. 고 객사가 자사의 조직이 Databricks 플랫폼을 어떻게 활용하고 있는지 명확히 파악하고, Databricks에서 진행 중인 데이터 및 AI 프로젝트의 가치를 극대화할 수 있는 기회를 발견할 수 있기를 바랍니다.
사전 구축된 AI/BI 비용 대시보드를 활용하여 시스템 테이블의 청구 및 비용 데이터를 분석하는 과정을 살펴보겠습니다. 또한, 효과적인 태깅 기법을 적용하여 사용량 데이터를 체계적으로 정리하는 방법과 조직, 사업부, 프로젝트 단위로 지출을 효율적으로 관리하기 위한 예산 수립 전략을 함께 알아보겠습니다.
사용 현황을 파악하는 첫 단계는 관련 데이터에 접근하는 것입니다. Databricks는 시스템 테이블을 통해 사용 데이터를 제공합니다. 이는 Databricks가 호스팅하는 고객 계정의 운영 데이터 저장소입니다. 이 글에서는 특히 청구 시스템 테이블의 데이터 활용 방법에 중점을 두고 설명하겠습니다.
Databricks 사용량이 증가함에 따라, 팀, 프로젝트, 또는 부서별로 비용을 분류하여 가치를 쉽게 파악하고자 할 것입니다. 이를 위해 우리는 유연한 키:값 쌍을 생성할 수 있는 태그 사용을 권장합니다. 클러스터, SQL 웨어하우스, 작업(Jobs), 서버리스 워크로드 등에 태그를 적용할 수 있으며, 이는 Databricks 환경의 활동을 추적하는 가장 효과적인 방법입니다.
일반적으로 사업부와 프로젝트의 사용량을 추적하는 기본적인 키부터 시작하는 것이 좋습니다. 그 후 필요에 따라 데이터와 AI 이니셔티브를 최적화하기 위한 더 상세한 태그로 확장할 수 있습니다. 각 키에 대한 값을 사전에 정의하고, 정책을 통해 태그 키:값 쌍의 사용을 강제하며 미리 정의된 목록으로 태그 값을 관리하는 것이 중요합니다. 이렇게 구축된 태깅 시스템을 바탕으로 대시보드를 활용하여 태그 값별 사용량을 확인하고, 아직 태그가 지정되지 않은 작업을 식별할 수 있습니다. 이러한 체계적인 태깅 전략을 통해 비용을 효율적으로 관리하고 리소스 사용을 최적화할 수 있습니다.
태그 사용의 일관성과 정확성을 유지하기 위해 정책을 활용할 수 있습니다. 이러한 정책을 통해 새로운 객체 생성 시 반드시 태그를 지정하도록 요구사항을 설정할 수 있습니다. 이는 데이터 관리의 완전성을 보장하고 비용 추적의 정확도를 높이는 데 큰 도움이 됩니다.
비용 관리 대시보드와 Genie를 지속적으로 모니터링하는 것이 부담스러울 수 있다는 점을 잘 알고 있습니다. 이에 따라 우리는 예산(Budget) 설정 기능을 도입했습니다. 이 기능 을 통해 전체 조직, 특정 워크스페이스, 또는 태그를 사용하여 특정 사업 부서나 프로젝트에 예산을 할당할 수 있습니다. 이를 통해 비용 관리를 더욱 효율적이고 체계적으로 수행할 수 있습니다.
예산을 설정한 후에는 사용량이 계획된 수준을 초과할 경우 관련 팀원들에게 자동으로 이메일 알림을 보내도록 설정할 수 있습니다. 이러한 알림을 받으면 대시보드를 통해 초과 사용의 원인을 상세히 분석할 수 있습니다. 예를 들어, 어떤 프로젝트나 작업이 예상보다 많은 리소스를 사용했는지, 또는 특정 사용자의 활동이 비용 증가에 영향을 미쳤는지 등을 파악할 수 있습니다. 이를 통해 신속하고 효과적인 비용 관리가 가능해집니다.
비용 현황을 신속하게 파악할 수 있도록 사전 구축된 AI/BI 대시보드를 제공하고 있습니다. 이 대시보드를 통해 시간에 따른 사용량 변화를 한눈에 볼 수 있으며, 워크스페이스와 SKU별로 세부적인 분석이 가능합니다. 이는 특정 프로젝트의 비용이 급격히 증가하는 등 즉각적인 주의가 필요한 영역을 빠르게 식별하는 데 큰 도움이 됩니다. 이를 통해 효율적인 비용 관리와 리소스 최적화를 실현할 수 있습니다.
때로는 기본 대시보드만으로는 원하는 모든 정보를 얻기 어려울 수 있습니다. 이런 경우 AI/BI Genie가 도움이 될 수 있습니다. 이 도구는 자연어 인터페이스를 제공하여 사용자가 쉽게 질문하고 답변을 얻을 수 있도록 합니다. AI/BI Genie를 통해 지출 추세를 상세히 분석하고, 이상 현상을 신속하게 파 악하며, 비용 절감을 위한 맞춤형 권장 사항을 받을 수 있습니다. 이는 데이터에 기반한 더 깊이 있는 인사이트를 얻는 데 큰 도움이 됩니다.
Databricks 사용량을 최적화하기 위해 청구 데이터를 활용하고 있지 않다면, 지금이 시작하기 좋은 시점입니다. 효율적인 비용 관리를 위해 먼저 내장된 대시보드를 활용하여 현재의 사용 패턴을 파악하세요. 그 다음, 태깅 시스템을 구축하여 비용을 체계적으로 분류하고, 예산 설정을 통해 지출을 효과적으로 통제할 수 있습니다. 이러한 접근 방식으로 종합적인 비용 관리 전략을 수립할 수 있습니다. 더 자세한 안내나 맞춤형 전략이 필요하다면, 담당 계정 팀에 연락하여 심층적인 비용 관리 세션을 요청하세요. 전문가의 조언을 통해 더욱 효율적인 리소스 활용과 비용 최적화를 실현할 수 있습니다.
(한글화: 황경태) Original Post