지난 한 해 동안 일반 지식 작업에 대한 강력 한 추론 능력을 보여주는 상용 및 오픈 소스 기반 모델이 급증했습니다. 이러한 일반 모델도 중요한 구성 요소이지만, 프로덕션 AI 애플리케이션은 조정된 모델, 검색, 도구 사용, 추론 에이전트와 같은 여러 구성 요소를 활용하는 복합 AI 시스템을 사용하는 경우가 많습니다. AI 시스템은 기반 모델을 보강하여 훨씬 더 나은 품질을 제공하고 고객이 이러한 GenAI 앱을 프로덕션에 자신 있게 적용할 수 있도록 지원합니다.
오늘 데이터 및 AI 서밋에서 Databricks는 Databricks Mosaic AI를 프로덕션급 AI 시스템 구축을 위한 최고의 플랫폼으로 만드는 몇 가지 새로운 기능을 발표했습니다. 이러한 기능은 수천 개의 기업과 협력하여 AI 기반 애플리케이션을 프로덕션에 도입한 경험을 바탕으로 개발되었습니다. 오늘 발표된 내용에는 기초 모델 미세 조정 지원, AI 도구용 엔터프라이즈 카탈로그, AI 에이전트 구축, 배포 및 평가를 위한 새로운 SDK, 배포된 AI 서비스를 관리하기 위한 통합 AI 게이트웨이가 포함되어 있습니다.
이번 발표를 통해 Databricks는 1년 전 MosaicML 인수 시 처음 포함된 모델 구축 기능을 완전히 통합하고 대폭 확장했습니다.
모놀리식 AI 모델에서 복합 시스템으로의 전환은 학계와 산업계 모두에서 활발히 연구 중인 분야입니다. 최근의 연구 결과에 따르면 "모놀리식 모델뿐만 아니라 여러 구성 요소가 있는 복합 시스템에서 최첨단 AI 결과를 얻는 경우가 점점 더 많아지고 있다"고 합니다. 이러한 결과는 고객 기반에서 확인할 수 있습니다. 금융 리서치 회사인 FactSet을 예로 들면, 텍스트-재무 공식 사용 사례에 상용 LLM을 배포했을 때는 생성된 공식의 정확도가 55%에 불과했지만, 모델을 복합 시스템으로 모듈화함으로써 각 작업을 전문화하여 85%의 정확도를 달성할 수 있었습니다.
Databricks의 Mosaic AI 플랫폼은 AI 시스템 구축을 지원하는 다음과 같은 제품을 제공합니다:
사용자는 작업과 기본 모델을 선택하고 학습 데이터( Delta 테이블 또는 .jsonl( 파일)을 사용하여 전문 작업에 맞게 완전히 미세 조정된 모델을 얻을 수 있습니다.
이제 Mosaic AI 모델 서비스는 Function-Calling을 지원하며, 사용자는 AI Playground에서 Function 및 기본 모델을 빠르게 실험할 수 있습니다.
범용 AI 모델은 MMLU와 같은 벤치마크에 최적화되지만, 배포된 AI 시스템은 지원 티켓에 대한 답변, 쿼리 생성 또는 응답 제안과 같은 특정 사용자 작업을 해결하도록 설계됩니다. 이러한 시스템이 제대로 작동하도록 하려면 품질 지표를 정의하고, 품질 신호를 수집하며, 성능을 반복할 수 있는 강력한 평가 프레임워크를 갖추는 것이 중요합니다. 오늘 몇 가지 새로운 평가 도구를 소개하게 되어 기쁩니다:
Mosaic AI 에이전트 평가는 개발자가 빠른 직관을 형성하는 데 도움이 되는 AI 지원 지표를 제공합니다.
Mosaic AI 에이전트 평가를 통해 Databricks 플랫폼 외부의 이해관계자들도 모델 결과물을 평가하고 등급을 제공하여 품질을 반복적으로 개선할 수 있습니다.
코닝은 소재 과학 기업으로서 유리 및 세라믹 기술은 다양한 산업 및 과학 응용 분야에 사용되므로 데이터를 이해하고 이를 바탕으로 조치를 취하는 것이 필수적입니다. Databricks Mosaic AI 에이전트 프레임워크를 사용하여 미국 특허청 데이터를 포함한 수십만 개의 문서를 인덱싱하는 AI 연구 도우미를 구축했습니다. 연구원들이 작업 중인 과제를 찾아서 더 발전시킬 수 있도록 LLM 기반 어시스턴트가 높은 정확도로 질문에 응답하는 것이 매우 중요했습니다. 이를 구현하기 위해 Databricks Mosaic AI 에이전트 프레임워크를 사용하여 미국 특허청 데이터로 증강된 Hello Generative AI 솔루션을 구축했습니다. Databricks 데이터 인텔리전스 플랫폼을 활용하여 검색 속도, 응답 품질 및 정확성을 크게 개선했습니다. - 데니스 카모츠키, 수석 소프트웨어 엔지니어, 코닝
최신 첨단 파운데이션 모델의 급격한 증가로 인해 고객들이 새로운 모델을 빠르게 채택하는 것을 목격했습니다. 예를 들어, DBRX는 출시 2주 만에 천 명의 고객이 실험에 참여했으며, 최근 출시된 Llama3 모델도 수백 명의 고객이 실험에 참여하고 있습니다.
많은 기 업들이 합리적인 기간 내에 플랫폼에서 이러한 최신 모델을 지원하기 어렵고, 프롬프트 구조와 쿼리 인터페이스의 변경으로 인해 구현이 어렵다는 것을 알게 되었습니다. 또한 기업이 최신의 최고 모델에 대한 액세스를 개방함에 따라, 사람들이 많은 것을 구축하게 되면서 거버넌스 문제가 발생할 수 있습니다. 일반적인 거버넌스 문제로는 속도 제한에 도달하여 프로덕션 애플리케이션에 영향을 미치는 것, 대규모 테이블에서 GenAI 모델을 실행할 때 발생하는 비용 폭증, 타사 모델 공급자에게 PII를 전송할 때 발생하는 데이터 유출 우려 등이 있습니다.
이에 대응하여 오늘 거버넌스를 위한 AI 게이트웨이의 새로운 기능과 모델 검색을 지원하는 선별된 모델 카탈로그를 발표하게 되어 기쁩니다. 포함된 기능은 다음과 같습니다:
Databricks Model Serving은 내부 또는 외부에서 호스팅되는 모델을 포함하여 여러 SaaS 및 오픈 모델에 안전하게 액세스하고 관리할 수 있도록 함으로써 Databricks AI 기반 프로젝트를 가속화하고 있습니다. 중앙 집중식 접근 방식은 보안 및 비용 관리를 간소화하여 데이터 팀이 관리 오버헤드를 줄이고 혁신에 더 집중할 수 있도록 지원합니다. - Greg Rokita, Edmunds.com 기술 담당 부사장
Databricks Mosaic AI 플랫폼은 팀이 중앙 집중식 거버넌스와 통합 인터페이스를 통해 단일 플랫폼에서 복합 AI 시스템을 구축하고 협업하여 학습, 추적, 평가, 교환 및 배포할 수 있도록 지원합니다. 엔터프라이즈 데이터를 활용함으로써 조직은 일반 인텔리전스에서 데이터 인텔리전스로 전환할 수 있습니다. 이러한 진화를 통해 조직은 보다 관련성 높은 인사이트를 더 빠르게 얻을 수 있습니다.
고객들이 다음에 어떤 혁신을 만들어낼지 기대가 됩니다!
(번역: HaUn Kim) Original Post