Published: June 11, 2024
작성자: 미란다 루나, 켄 웡, 저스틴 탤벗, 아미르 호르마티, 차오 차이, 에리카 에를리, Reynold Xin, Matei Zaharia
오늘, 데이터의 의미를 심층적으로 이해하고 누구나 스스로 데이터를 분석할 수 있도록 처음부터 구축된 새로운 유형의 비즈니스 인텔리전스 제품인 Databricks AI/BI를 발표하게 되어 기쁘게 생각합니다. AI/BI는 ETL 파이프라인, 리니지, 기타 쿼리 등 데이터브릭스 플랫폼 전반의 전체 수명 주기에서 데이터에 대한 인사이트를 도출하는 복합 AI 시스템을 기반으로 구축되었습니다. 이는 두 가지 상호 보완적인 제품 경험을 지원합니다:
이러한 기능을 통해 AI/BI는 진정한 셀프 서비스 BI로 한 걸음 더 나아갈 수 있으며, 일반 사용자가 수행할 수 있는 분석의 범위가 크게 넓어집니다. 또한, 데이터브릭스 데이터 인텔리전스 플랫폼과 AI/BI의 통합을 통해 모든 데이터 규모에서 통합 거버넌스, 리니지 추적, 안전한 공유와 최고 수준의 성능을 보장합니다.
이 블로그에서는 데모를 넘어 GenAI가 BI에서 지금까지 어려움을 겪고 있는 이유에 대해 설명합니다. 그런 다음 AI/BI의 설계가 이러한 문제를 극복할 수 있다고 믿는 이유를 논의하고 실제 사례를 통해 이를 검증합니다.
지난 30년 동안 비즈니스 사용자는 데이터에 대한 질문에 답하기 위해 보고서와 대시보드를 제공받아 왔습니다. 그러나 비즈니스가 발전함에 따라, 이러한 사용자는 새로운 질문에 답하기 위해 새로운 비주얼리제이션을 만들기 위해 부족하고 업무가 과중한 데이터 전문가에게 의존하고 있습니다. 비즈니스 사용자와 데이터 팀은 수많은 대시보드를 생성하지만 여전히 많은 질문에 대한 답을 얻지 못하는 끝없는 순환에 갇혀 있습니다.
LLM에 대한 관심이 높아지면서 BI 업계에서는 이 문제를 해결하기 위해 AI 비서를 BI 도구에 통합하는 새로운 물결이 일기 시작했습니다. 안타깝게도 이러한 서비스는 개념상으로는 유망하고 인상적인 제품 데모를 만들 수 있지만, 현실에서는 실패하는 경향이 있습니다. 실제 데이터 분석의 지저분한 데이터, 모호한 언어, 미묘한 복잡성에 직면하면 이러한 "접합형(bolt-on)" AI 경험은 유용하고 정확한 답변을 제공하기 어렵습니다.
스키마 자체에는 비즈니스 프로세스와 메트릭의 정의, 복잡한 데이터를 처리하는 방법 등 많은 지식이 누락되어 있기 때문에 단순히 LLM 으로 데이터베이스 스키마를 가리키고 텍스트를 SQL로 변환(text-to-SQL)하는 것만으로는 충분하지 않습니다. 다른 접근 방식은 이러한 이해를 공식적인 의미론적 모델로 포착하는 것이지만, 상당한 사전 투자가 필요하고 모든 뉘앙스를 포착할 수 없으며 데이터와 비즈니스 프로세스가 진화함에 따라 최신 상태로 유지하기가 비현실적입니다.
"