Databricks의 데이터 사이언스 자세히 살펴보기
오픈 레이크하우스 토대를 기반으로 빌드해 협업에 유리한 통합형 데이터 사이언스 환경을 이용해 데이터 준비부터 모델링, 나아가 인사이트 공유에 이르기까지 포괄적인 데이터 사이언스 워크플로를 간소화할 수 있습니다. 정리되고 안정적인 데이터, 미리 구성한 컴퓨팅 리소스, IDE 통합, 다국어 지원 및 기본 제공되는 고급 시각화 도구에 신속하게 액세스하여 데이터 분석 팀의 유연성을 최대한 보장합니다.
데이터 사이언스 워크플로 전체에 걸친 협업
Python, R, Scala 및 SQL로 코드를 작성하고, 대화형 시각화를 활용해 데이터를 탐색하며 Databricks Notebooks로 새로운 인사이트를 발견해보세요. 공동 작성, 메모 작성, 자동 버전 관리, Git 통합과 역할 기반 액세스 제어 등이 제공되므로 신뢰를 기반으로 안전하게 코드를 공유할 수 있습니다.
인프라가 아닌 데이터 사이언스 중심
이제는 노트북 컴퓨터의 데이터 용량에 제한을 받거나, 이용할 수 있는 컴퓨팅 파워로 행동 범위를 한정 짓지 않아도 됩니다. 로컬 환경을 클라우드에 신속하게 마이그레이션하고, 노트북을 개인용 컴퓨팅, 자동 관리형 클러스터에 연결하세요.
익숙한 로컬 IDE환경을 확장 가능한
컴퓨팅 환경에서도 그대로 활용하세요.
IDE 선택은 매우 개인적이며 생산성에 중대한 영향을 미칩니다.즐겨 사용하는 IDE를 Databricks에 연결하여 무한한 데이터 스토리지와 컴퓨팅이 제공하는 이점을 그대로 누리세요. 아니면 Databricks 내에서 RStudio나 JupyterLab을 직접 이용해도 원활한 환경을 보장받을 수 있습니다.
데이터 사이언스에 적합하게
데이터 준비하기
배치, 스트리밍, 구조적 또는 비구조적 데이터 등 종류를 불문하고 모든 데이터를 Delta Lake 내 한 곳에 정리하고 카탈로그화하여 중앙집중형 데이터 스토어를 통해 기업 조직 내 어디에서나 검색 가능하게 할 수 있습니다. 데이터가 유입되면 자동 품질 검사를 실시해 데이터가 기대치에 부합하고 분석할 준비를 마쳤는지 확인합니다. 새로운 데이터와 추가적인 변환으로 인해 데이터가 발전함에 따라 데이터 버전 관리를 통해 규정 준수 요구 사항에 부합하도록 합니다.
로우코드, 시각적 도구로 데이터 탐색
Databricks 노트북 내에 기본 제공되는 네이티브 시각 도구를 사용해 데이터를 준비, 변환, 분석하면 전문지식 수준이 각기 다른 팀원이 모두 간편하게 데이터를 다룰 수 있습니다. 데이터 변환과 시각화를 마치면 배경에서 실행되는 코드를 생성할 수 있으므로, 상용구 코드를 작성하는 데 허비하던 시간을 이제 다른 고부가가치 업무에 할애할 수 있게 됩니다.
새로운 인사이트 발견 및 공유
분석을 동적 대시보드로 간단하게 바꾸어 결과를 간편하게 공유하고 내보낼 수 있습니다. 대시보드는 항상 최신 상태로 유지되며 대화형 쿼리도 실행합니다. 역할 기반 액세스 관리를 통해 셀, 시각화나 노트북을 공유할 수도 있고 HTML와 IPython Notebook을 비롯한 여러 가지 형식으로 내보낼 수도 있습니다.