주요 컨텐츠로 이동
<
Page 17
>

Apache Spark ❤️ Apache DataSketches: Sketch 기반의 새로운 Approximate Distinct Counting

(번역: Youngkyong Ko) Original Blog Post 소개 이 블로그에서는 고유 값 계산, 스케치 병합, 고유 개수 추정을 정확하고 효율적으로 수행할 수 있도록 HyperLogLog...

코드 해독: Databricks가 생체역학 데이터를 사용하여 메이저 리그 야구를 재구성하는 방법

October 17, 2023 작성자: Harrison Flax, Chris Niesel, Hussain Vahanvaty in
생체역학 데이터는 메이저리그 야구(MLB) 팀의 판도를 바꾸는 요소로 부상하여 선수의 경기력을 향상하고 부상을 줄이는 데 경쟁력을 제공합니다. 그러나 이러한 잠재력에도 불구하고 대부분의 팀은...

MapInPandas 및 Delta Live Table을 사용하여 일반적이지 않은 파일 형식을 확장성있게 처리하기

October 17, 2023 작성자: TJ Cycyota in
다양한 파일 형식 최신 데이터 엔지니어링의 영역에서, 데이터브릭스 레이크하우스 플랫폼 은 안정적인 스트리밍 및 배치 데이터 파이프라인 을 구축하는 프로세스를 간소화합니다. 그러나 잘...

데이터브릭스 모델 서빙을 사용하여 프라이빗 LLM 배포하기

데이터브릭스 모델 서빙에 대한 GPU 및 LLM 최적화 지원의 공개 프리뷰를 발표하게 되어 기쁘게 생각합니다! 이번 출시를 통해 LLM 및 비전 모델을 포함한...

데이터브릭스 마켓플레이스에서 사전 구축된 산업 솔루션으로 AI 여정 시작하기

모든 조직은 데이터 마켓플레이스에서 얻은 내부 데이터든 외부에서 얻은 타사 데이터든 데이터에서 가치를 얻고자 합니다. 여러 산업 분야의 조직은 안전한 데이터 공유와 협업을...

분산형 XGBoost 및 LightGBM 모델의 경량 배포를 위한 패턴

데이터 과학자가 머신 러닝 솔루션을 개발할 때 직면하는 일반적인 문제는 서버의 메모리에 담기에는 너무 큰 데이터 집합에 대한 모델 학습입니다. 고객 이탈이나 성향을...

데이터브릭스와 Azure DevOps를 이용해 확장 가능한 AI를 엣지로 가져오기

October 11, 2023 작성자: Andres Urrutia, Howard Wu, Nicole Lu, Bala Amavasai in
제조업에서 머신 러닝과 AI의 기회는 엄청납니다 . 생산량을 소비자 수요 에 더 잘 맞추는 것부터 공정 제어 개선, 수율 예측, 결함 감지...

Crossing Bridges: RStudio 및 데이터브릭스를 이용하여 뉴욕 택시 데이터로 보고서 만들기

데이터를 좋아하는 저희는 데이터 세트에서 스토리를 발견하는 것을 항상 즐깁니다. Posit의 RStudio Desktop 과 데이터브릭스를 사용하면 데이터브릭스에 저장된 데이터를 사용하여 dplyr로 데이터를 분석하고...

Data + AI의 3박자: 사람, 프로세스 그리고 플랫폼

비즈니스 리더들은 모두 같은 질문을 합니다: 데이터와 AI에 대한 회사의 계획을 어떻게 가속화할 수 있을까요? 비즈니스를 위험에 빠뜨리지 않고 대규모 언어 모델(LLM)을 활용하려면...

Unlocking the Power of Data: 레이크하우스를 향한 AT&T의 현대화 여정

October 4, 2023 작성자: Kate Hopkins in
This is a guest post from Kate Hopkins, Vice President of Data Platforms at AT&T. 첫 시작: 페타바이트급 데이터를 신중하게 이동하고 관리하기 AT&T는...