Published: April 5, 2025
작성자: 아흐메드 빌랄, 앙킷 마투르, Cade Daniel, 프리투 다스구타, Wendy Hu, Megha Agarwal, 첸양 유, 한린 탕
수천 개의 기업들이 이미 Databricks 데이터 인텔리전스 플랫폼에서 Llama 모델을 사용하여 AI 애플리케이션, 에이전트, 워크플로를 구동하고 있습니다. 오늘, 우리는 Meta와 파트너십을 맺어 그들의 최신 모델 시리즈인Llama 4를 여러분께 선보이게 되어 기쁩니다. 이는 오늘부터 많은 Databricks 작업 공간에서 사용할 수 있으며, AWS, Azure, GCP에 순차적으로 제공될 예정입니다.
Llama 4는 열린 멀티모달 AI에서 큰 도약을 표시하며, 업계 최고의 성능, 더 높은 품질, 더 큰 컨텍스트 윈도우, 그리고 전문가의 혼합(MoE) 아키텍처로부터 향상된 비용 효율성을 제공합니다. 이 모든 것은 통합된 REST API, SDK, 그리고 SQL 인터페이스를 통해 접근할 수 있으며, 이를 통해 모든 모델을 안전하고 완전히 관리되는 환경에서 쉽게 사용할 수 있습니다.
Llama 4 모델은 오픈 기반 모델에 대한 기준을 높여—이전의 어떤 Llama 모델보다 훨씬 높은 품질과 더 빠른 추론을 제공합니다.
출시 시, 우리는 오늘 메타에서 출시된 가장 크고 최고 품질의 모델인 라마 4 매버릭을 소개합니다. Maverick은 다국어 구사능력, 정확한 이미지 이해력, 안전한 어시스턴트 행동을 결합하여 복잡한 AI 제품을 개발하는 개발자들을 위해 특별히 제작되었습니다. 이를 통해 다음을 가능하게 합니다:
그리고 이제 훨씬 더 좋은 성능으로 이 모든 것을 구축할 수 있습니다. Llama 3.3 (70B)에 비해 Maverick는 다음을 제공합니다:
곧 Databricks에 출시될 Llama 4 Scout는 텍스트, 이미지, 비디오를 처음부터 통합하는 컴팩트하고 최고 수준의 멀티모달 모델입니다. 최대 1000만 토큰의 컨텍스트를 가진 Scout는 고급 장문 추론, 요약, 시각 이해를 위해 제작되었습니다.
"Databricks를 사용하면 LLM을 사용하여 매일 백만 개 이상의 파일을 처리하여 부동산 기록에서 거래 및 엔티티 데이터를 추출하는 번거로운 수동 작업을 자동화할 수 있었습니다. Meta Llama를 세밀하게 조정함으로써 우리의 정확성 목표를 초과하였고, Mosaic AI Model Serving을 사용하여 이 작업을 대규모로 확장하였습니다. 이를 통해 대형이고 비싼 GPU 편대를 관리할 필요가 없었습니다."— Prabhu Narsina, 데이터 및 AI 부사장, First American
Unity Catalog로 관리되는 도구를 사용하여 Llama 4를 귀사의 엔터프라이즈 데이터에 연결하여 컨텍스트를 인식하는 에이전트를 구축하세요. 비구조화된 콘텐츠를 검색하거나 외부 API를 호출하거나 사용자 정의 로직을 실행하여 copilots, RAG 파이프라인, 및 워크플로우 자동화를 강화합니다. Mosaic AI는 내장된 모니터링 및 협 업 도구를 통해 이러한 에이전트를 쉽게 반복, 평가, 개선할 수 있게 해줍니다—프로토타입에서 생산까지.
문서를 요약하거나, 지원 티켓을 분류하거나, 수천 개의 보고서를 분석하는 등 Llama 4를 대규모로 적용하세요. 이를 위해 인프라를 관리할 필요가 없습니다. 배치 추론 은 Databricks 워크플로와 깊게 통합되어 있으므로, 기존 파이프라인에서 SQL 또는 Python을 사용하여 Llama 4와 같은 LLM을 거의 부담 없이 관리 데이터에서 직접 실행할 수 있습니다.
요약, 보조 동작, 브랜드 톤 등의 사용 사례에 더 잘 맞도록 Llama 4를 사용자 정의하세요. 레이블이 지정된 데이터셋을 사용하거나 테스트-타임 적응형 최적화 (TAO) 와 같은 기법을 사용하여 모델을 적응시켜 주석 처리 오버헤드 없이 더 빠르게 반복하세요. 조기 접근을 위해 Databricks 계정 팀에게 문의하세요.
"Databricks를 사용하면, 상담사 교육을 위한 대화 시뮬레이터와 응답 품질 유지를 위한 단계 분류기와 같은 다양한 GenAI 사용 사례를 구축하기 위해 Llama 모델을 빠르고 안전하게 세밀하게 조정하고 배포할 수 있었습니다." 이러한 혁신은 우리의 실시간 위기 개입을 개선시켜, 더 빠르게 확장하고 위기에 처한 사람들에게 중요한 정신 건강 지원을 제공하는 데 도움이 되었습니다.— Matthew Vanderzee, CTO, Crisis Text Line
Mosaic AI Gateway를 사용하여 안전하고 준수하는 모델 사용을 보장합니다. 이는 내장된 로깅, 속도 제한, PII 감지, 정책 가드레일을 추가하여 팀이 Databricks에서 Llama 4를 다른 모델처럼 안전하게 확장할 수 있게 합니다.
우리는 Llama 4를 단계적으로 출시하고 있으며, Azure, AWS, GCP에서 Maverick부터 시작합니다. 곧 출시됩니다:
지원을 확대함에 따라, 극장 컨텍스트, 고처리량 작업, 통합 텍스트 및 비전 이해 등, 작업 부하에 가장 적합한 Llama 모델을 선택할 수 있게 될 것입니다.
Llama 4는 앞으로 몇 일 동안 여러분의 Databricks 작업 공간에 순차적으로 제공될 예정입니다.
(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)