데이터 인텔리전스(Data Intelligence)
데이터 인텔리전스는 인공지능(AI) 시스템을 사용하여 조직의 데이터를 학습, 이해 및 추론하는 과정을 말하며, 이를 통해 맞춤형 AI 애 플리케이션을 개발하고, 조직 전반에 걸쳐 데이터 접근을 더욱 용이하게 만들 수 있습니다.
자세히 보기
데이터 인텔리전스는 어떻게 작동하나요?
데이터 인텔리전스는 생성형 AI와 기존 AI 모델을 모두 활용하여 조직의 엔터프라이즈 데이터와 그 활용을 종합적으로 이해합니다. 데이터 카탈로그, SQL 쿼리, BI 대시보드, 노트북, 데이터 파이프라인, 문서 등 조직의 데이터 자산 전체에서 포착된 신호를 학습합니다. 이러한 접근 방식을 통해 비즈니스의 개념, 의미 및 고유한 데이터 환경에 대한 미묘한 차이를 이해할 수 있습니다. 그 결과, 공용 인터넷 데이터만으로 학습된 대형 언어 모델(LLM)보다 훨씬 더 정확한 답변을 제공합니다.
데이터 인텔리전스의 이점은 무엇인가요?
데이터 인텔리전스는 조직에 다음과 같은 이점을 제공합니다.
- 자연어 접근을 통한 데이터 및 AI 생산성 향상: AI 모델을 활용한 데이터 인텔리전스는 조직의 내부 용어와 약어에 맞춰 자연어로 데이터를 다룰 수 있도록 해줍니다. 데이터 인텔리전스는 기존 워크로드에서 데이터가 어떻게 사용되는지 관찰하여 조 직의 용어를 학습하고, 비전문가부터 데이터 사이언티스트, 엔지니어에 이르기까지 모든 사용자에게 맞춤형 자연어 인터페이스를 제공합니다.
- 데이터 및 AI 자산의 의미 분류와 검색 개선: 생성형 AI는 조직별 데이터 모델, 지표 및 KPI를 이해하여 뛰어난 검색 기능을 제공하고, 데이터 사용에서 발생하는 불일치를 자동으로 식별할 수 있습니다.
- 데이터 관리와 최적화의 자동화: 데이터 인텔리전스 모델은 데이터 사용 패턴을 기반으로 데이터 레이아웃, 파티셔닝 및 인덱싱을 최적화하여 수동 조정 및 설정의 필요성을 줄여줍니다.
- 거버넌스 및 개인정보 보호 강화: 데이터 인텔리전스를 통해 조직은 자연어를 사용하여 데이터 관리를 간소화하는 동시에 민감한 데이터의 오용을 자동으로 감지, 분류 및 방지할 수 있습니다.
- AI 워크로드를 최고 수준으로 지원: 데이터 인텔리전스는 엔터프라이즈 AI 애플리케이션을 관련 비즈니스 데이터에 연결하여, 학습한 의미(예: 지표, KPI)를 활용하여 보다 정확하고 적절한 결과를 제공할 수 있도록 합니다. 데이터 인텔리전스를 사용하면 AI 애플리케이션 개발자는 더 이상 취약한 프롬프트 엔지니어링을 통해 인텔리전스를 '비정상적으로' 구현하지 않아도 됩니다.
데이터 인텔리전스 사용 사례
데이터 인텔리전스는 금융, 의료, 에너지 등 다양한 산업에서 활용되고 있으며 비즈니스 운영 방식을 변화시키고 있습니다. 다음 예시들은 데이터 인텔리전스가 기업의 고객 이해, 프로세스 개선, 사기 탐지 등에 어떻게 도움이 되는지를 보여줍니다.
- 금융: 데이터 인텔리전스를 사용하여 재무 위험을 관리하고, 경제 동향을 예측하며, 각종 규제를 준수합니다. 은행 및 기타 금융 기관은 데이터를 분석하여 신용도를 평가하고, 사기를 식별하고, 고객을 분류합니다.
- 리테일 및 CPG: 데이터 인텔리전스를 활용하여 고객 선호도를 파악하고, 재고를 더 효과적으로 관리하며, 공급망을 최적화하고, 개별 고객을 위한 맞춤형 마케팅 전략을 세웁니다.
- 공공 부문: 데이터 인텔리전스는 서비스를 개선하고 정보에 입각한 정책 결정을 내리는 데 매우 중요합니다. 정부 기관은 데이터를 사용하여 경제 변화를 모니터링하고 더 나은 서비스를 제공합니다.
- 보험: 데이터 인텔리전스를 활용하여 위험을 평가하고 보험료를 책정하며 보험금 청구의 사기 여부를 감지합니다. 대규모 데이터세트를 분석하여 리스크를 보다 명확하게 파악하고 보험금 청구 프로세스를 간소화합니다.
- 의료 서비스: 환자에게 더 나은 의료를 제공하고 비용을 관리하며 연구를 수행하기 위해 데이터 인텔리전스를 활용합니다. 데이터 분석은 의료진의 의사 결정을 지원하고 효과적인 치료법을 파악하는 데 도움이 됩니다.
- 에너지: 데이터 분석을 통해 에너지 사용량을 모니터링 및 예측하고 전력망의 효율성을 개선합니다.
데이터 인텔리전스의 활용 방법은 산업별로 다를 수 있지만, 데이터에서 가치 있는 인사이트를 추출하고 이를 활용하여 비즈니스 성장을 촉진하고 고객 경험을 개선한다는 목표는 동일합니다.
Data Intelligence Platform을 지원하는 핵심 기술
Data Intelligence Platform은 (데이터 레이크와 데이터 웨어하우스의 장점을 결 합한) 데이터 레이크하우스를 기반으로 구축된 아키텍처로, 모든 데이터와 거버넌스를 위한 개방적이고 통합된 기반을 제공하며, 조직의 데이터 특성을 이해하는 데이터 인텔리전스 엔진을 통해 운영됩니다. Data Intelligence Platform에 사용되는 주요 기술은 다음과 같습니다:
- 개방적이고 통합된 데이터 스토리지
- 클라우드 스토리지 서비스: Amazon S3, Google Cloud Storage, Azure Data Lake 스토리지 등 확장 가능하고 비용 효율적인 스토리지를 제공합니다.
- 개방형 데이터 형식: Parquet과 같은 데이터 형식에 ACID 트랜잭션을 가져와 안정적인 데이터 운영 및 관리를 가능하게 하는 오픈 소스 스토리지 레이어인 Delta Lake UniForm과 Apache Iceberg가 여기에 포함됩니다.
- 개방형 메타데이터 및 거버넌스 서비스
- Unity Catalog: 데이터 레이크하우스를 위한 개방형 데이터 거버넌스 및 메타데이터 관리를 제공합니다.
- Hive metastore: Hive 테이블 및 데이터베이스의 메타데이터를 저장하는 중앙 리포지토리로, 데이터 탐색 및 관리를 도와줍니다.
- 분산 데이터 처리
- Apache Spark™ 및 Spark Structured Streaming: 배치 및 실시간 스트림 처리를 지원하는 대규모 데이터 처리를 위한 Unified Analytics 엔진입니다.
- 쿼리 엔진
- Databricks Photon: 데이터 레이크에서 직접 실행되는 차세대 엔진으로, 데이터 수집, ETL, 스트리밍, 데이터 웨어하우징, Data Science 및 대화형 쿼리에 저렴한 비용으로 매우 빠른 성능을 제공합니다.
- Machine Learning 및 MLOps
- MLflow: 실험, 재현성 및 배포를 포함한 ML 수명 주기를 관리하는 오픈 소스 플랫폼입니다.
- Mosaic AI: 머신 러닝 워크플로우를 최적화하고 자동화하여 기존 및 생성 AI 모델의 개발과 배포의 속도를 높이는 도구입니다.
- 복합 AI 시스템
- 복합 AI 시스템은 데이터 카탈로그, 대시보드, 노트북, 데이터 파이프라인 및 문서를 포함한 조직의 데이터 플랫폼에서 신호를 수집하여, 조직의 데이터, 사용 패턴 및 비즈니스 개념을 이해하는 전문적이고 정확한 생성형 AI 모델을 만듭니다.