Vogue, New Yorker, Wired와 같은 유명 잡지의 퍼블리셔인 Condé Nast는 데이터를 활용하여 인쇄물, 온라인, 비디오 및 소셜 미디어를 통해 10억 명이 넘는 사람들에게 도달합니다. Condé Nast는 활용해야 할 엄청난 양의 데이터로 인해 인프라를 관리하고 데이터 사이언스 생산성을 높이는 데 어려움을 겪고 있었습니다. Databricks 도입 이후 Condé Nast는 클러스터 자동화를 통해 불필요한 DevOps 작업을 제거하고, Delta Lake를 통해 매월 1조 개의 데이터 포인트로 확장되는 데이터 파이프라인을 구축하였으며 MLflow와의 협업을 통해 전체 머신 러닝 수명 주기를 관리할 수 있는 데이터 사이언스 혁신을 실현할 수 있었습니다. 이를 통해 브랜드 전반에 걸쳐 맞춤형 콘텐츠를 제공하여 고객의 참여를 유도하고 유지할 수 있었습니다.
고객 데이터만으로는 콘텐츠 경험을 개선하기 어렵습니다.
선도적인 미디어 퍼블리셔인 Condé Nast는 20개 이상의 브랜드 포트폴리오를 갖추고 있습니다. 매월 1억 건 이상의 방문과 8억 건 이상의 페이지 조회를 기록하는 웹사이트에서는 엄청난 양의 데이터됩 생성합니다. 데이터 팀은 머신 러닝을 사용하여 맞춤형 콘텐츠 추천 및 타겟 광고를 제공함으로써 사용자 참여를 개선하는 데 집중하고 있습니다. 그러나 기본 Spark를 사용하여 데이터 플랫폼을 운영하는 것은 어려웠습니다.
-
인프라 복잡성: Spark 클러스터를 구축하고 관리하려면 많은 설정과 지속적인 유지 관리가 필요했기 때문에 팀이 더 높은 가치를 창출하는 활동에 집중할 수 없었습니다.
-
경계를 허물기: 팀이 데이터 파이프라인을 구축하고 분석을 발전시킬 수 있는 협업 플랫폼을 찾아야 했습니다.
-
너무 많은 데이터: 기존 데이터 레이크 솔루션으로는 데이터 세트를 감당할 수 없었습니다.
데이터 파이프라인 및 머신 러닝 수명 주기 간소화
Databricks는 Condé Nast에 운영을 간소화하고, 우수한 성능을 제공하며, 데이터 사이언스 혁신을 가능하게 하는 완전 관리형 클라우드 플랫폼을 제공합니다.
-
대화형 워크스페이스: 데이터 사이언티스트가 데이터와 인사이트를 함께 구축하고 공유하고 추적하는 협업 환경을 조성할 수 있습니다.
-
Delta Lake: 데이터 세트의 크기가 (매월 1조 이상의 데이터 포인트로) 증가하더라도 Delta Lake는 이를 따라잡고 데이터 다시 쓰기 및 데이터 병합과 같은 더 많은 사용 사례를 허용할 수 있습니다.
-
관리형 MLflow: MLflow를 통해 Condé Nast는 Experiment 추적에서 프로덕션 모델 모니터링에 이르기까지 전체 머신 러닝 수명 주기를 쉽게 관리할 수 있습니다.
인공지능을 활용한 맞춤형 콘텐츠로 고객 만족 달성
데이터 분석 및 머신 러닝에 Databricks를 도입한 Condé Nast는 고객에 대한 새로운 인사이트를 바탕으로 20개 이상 브랜드의 참여 방식을 완전히 바꾸어 놓았습니다.
-
고객 참여 개선: 향상된 데이터 파이프라인을 통해 Condé Nast는 더 빠르고 정확한 콘텐츠 추천을 제공하여 사용자 경험을 개선하였습니다.
-
통합된 접근 방식: 데이터 엔지니어링팀과 데이터 사이언스팀은 이제 함께 문제를 해결하고 새로운 콘텐츠 제품과 경험을 구축하기 위해 협력하고 있습니다.
-
확장성을 고려한 설계: Condé Nast의 인사이트 처리 및 수집 능력은 데이터 세트보다 결코 부족하지 않습니다.
-
더 많은 모델을 프로덕션에 도입: MLflow를 통해 Condé Nast의 데이터 사이언스팀은 제품을 더 빠르게 혁신할 수 있습니다. Data Science 팀은 1,200개 이상의 모델을 실제 프로덕션 환경에 배포했습니다.