주요 컨텐츠로 이동

데이터 분석 플랫폼(Data Analysis Platform)

Databricks 무료로 시작하기

데이터 분석 플랫폼이란 무엇입니까?

데이터 분석 플랫폼은 용량이 크고 복잡한 동적 데이터를 대상으로 분석을 수행해야 하는 서비스와 기술로 구성된 에코시스템입니다. 이것을 통해 회사에 속한 다양한 출처로부터 얻은 데이터를 검색, 조합, 데이터와 상호작용을 주고받기도 하고 탐색, 표시할 수 있습니다. 종합적인 데이터 분석 플랫폼에는 다양한 기능을 내장한 여러 가지 툴이 포함되어 있습니다. 예측 분석과 데이터 시각화부터 로케이션 인텔리전스(Location Intelligence), 자연어와 콘텐츠 분석 등이 대표적인 예입니다. 이 플랫폼의 주된 범위는 각종 데이터를 실천할 수 있는 인사이트로 바꾸어 실질적인 비즈니스 결과를 도출하는 것까지입니다.Analytic Application이러한 플랫폼은 특히 빅데이터를 다루는 사용자의 수요에 부응하여 관계형 데이터베이스 관리 시스템(RDBMS)의 미흡한 점을 보완하고 기업으로서 좀 더 정보에 입각한 비즈니스 의사 결정을 내릴 수 있도록 지원합니다.

종합적인 빅데이터 분석 시스템이 갖추어야 하는 기능은 다음과 같습니다.

  • 다양한 빅데이터 소스를 통합하여 사용자에게 투명한 보기 제공
  • 기업에서 보유한 데이터 자산을 관리, 보호하여 일반적으로 이해하기 쉽고 올바르고 완전하며 안전한 기업 데이터 보장
  • 데이터, 리소스와 애플리케이션을 모니터링하여 시스템 전체의 상태와 성능 평가

데이터의 성격이 정량적이든 정성적이든 관계없이, 잘 실행된 빅데이터 분석이란 다음과 같은 가능성을 열어줍니다.

  • 데이터 설명 및 요약
  • 여러 변수 사이의 관계 파악
  • 변수 비교
  • 여러 변수의 차이점 파악
  • 숨겨진 시장 발견
  • 충족되지 않은 고객 수요 탐색
  • 충족되지 않은 고객 수요와 비용 절감 기회 탐색
  • 결과 예측
  • 획기적, 중대한 개선 사항 유도

빅데이터에 관해서는 하둡이 주로 안정성, 유연성, 경제성과 확장성을 검증받은 솔루션이기 때문에 그러한 요구사항에 바람직한 선택으로 여겨집니다. 하둡은 이러한 대규모 데이터를 HDFS(Hadoop Distributed File System)에 저장할 수는 있지만 그렇다고 이것이 시중에서 구할 수 있는 유일한 솔루션이라는 뜻은 아닙니다. 시중에는 이러한 초대형 데이터 분석용으로 MapReduce, Pig와 Hive 등과 같은 다른 툴도 많이 나와 있습니다.  

추가 자료

용어집으로 돌아가기