오늘, 우리는 Fennel 팀을 Databricks에 환영하게 되어 매우 기쁩니다. Fennel은 배치, 스트리밍 및 실시간 데이터에 대한 피처 엔지니어링 파이프라인의 효율성과 데이터 신선도를 향상시키기 위해 변경된 데이터만 다시 계산합니다. Databricks Data Intelligence Platform 에 Fennel의 기능을 통합함으로써 고객들은 빠르게 특징을 반복하고, 신뢰할 수 있는 신호로 모델 성능을 향상시키고, GenAI 모델에 개인화되고 실시간 컨텍스트를 제공할 수 있습니다 - 모두 복잡한 인프라를 관리하는 데 드는 비용과 부담 없이.
AI 시대의 피처 엔지니어링
머신러닝 모델은 학습하는 데이터만큼 좋습니다. 그래서 피처 엔지니어링이 매우 중요합니다: 피처는 모델이 쉽게 해석할 수 있는 형식으로 기본 도메인 특정 및 행동 패턴을 포착합니다. 생성 AI의 시대에도, 대규모 언어 모델이 비구조화된 데이터에서 작동할 수 있음에도 불구하고, 특징 공학은 프롬프트의 일부로 개인화된, 집계된, 실시간 컨텍스트를 제공하는 데 필수적입니다. 그 중요성에도 불구하고, 피처 엔지니어링은 신선하고 올바르게 변환된 피처를 계산하기 위한 복잡한 ETL 파이프라인을 유지해야 하기 때문에 역사적으로 어렵고 비용이 많이 들었습니다. 많은 조직들이 배치 및 실시간 데이터 소스를 모두 처리하고, 훈련과 서비스 환경 간의 일관성을 보장하는 데 어려움을 겪고 있습니다 - 물론 이것을 높은 품질을 유지하면서 비용을 낮추는 것은 더욱 어렵습니다.
Fennel + Databricks
Fennel은 이러한 도전을 해결하고 피처 및 피처 파이프라인을 효율적으로 생성하고 관리하기 위한 완전 관리형 플랫폼을 제공함으로써 피처 엔지니어링을 단순화합니다. 이는 통합 배치 및 실시간 데이터 처리를 지원하여 특징의 신선도를 보장하고 훈련-서비스 왜곡을 제거합니다. Python 기반의 사용자 경험을 통해, 복잡한 특징을 빠르고 쉽게 작성할 수 있으며, 새로운 언어를 배우거나 복잡한 데이터 파이프라인을 구축하기 위해 데이터 엔지니어링 팀에 의존할 필요가 없는 데이터 과학자들에게 접근성이 좋습니다. 그것의 증분 계산 엔진은 중복 작업을 피함으로써 비용을 최적화하고 최고 수준의 데이터 거버넌스 도구는 데이터 품질을 유지하는 데 도움을 줍니다. 모든 특징 파이프라인 관리를 처리함으로써, Fennel은 기계 학습 모델을 개발하고 배포하는 데 필요한 복잡성과 시간을 줄이고, 데이터 과학자들이 복잡한 인프라와 도구를 관리하는 대신 더 나은 특징을 만들어 모델 성능을 향상시키는 데 집중할 수 있도록 돕습니다.
들어오는 Fennel 팀은 Meta와 Google Brain에서 AI 인프라 작업을 이끈 창립 팀을 포함하여 현대적인 특징 엔지니어링에 대한 풍부한 경험을 가지고 있습니다. 2022년 설립 이후 Fennel은 모든 규모의 회사와 팀이 실시간 머신러닝을 활용하여 매력적인 제품을 만드는 것을 쉽게 만드는 비전을 실행하는 데 성공했습니다. Upwork, Cricut 등의 고객들은 신용 위험 결정, 사기 탐지, 신뢰 및 안전, 개인화된 랭킹 및 마켓플레이스 추천 등 다양한 사용 사례에 대한 기계 학습 특징을 구축하기 위해 Fennel에 의존합니다.
Fennel 팀은 모든 고객이 Databricks Data Intelligence Platform에서 실시간 특징 엔지니어링의 이점을 활용할 수 있도록 보장하기 위해 Databricks의 엔지니어링 조직에 합류할 것입니다. 통합에 대한 더 많은 업데이트를 기다리고 있으며, 6월 9일부터 12일까지 샌프란시스코에서 열리는 Data + AI Summit 에서 Fennel을 실제로 확인해 보세요!
(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)