Databricks 데이터 인텔리전스 플랫폼에서 Meta의 Llama 4를 소개합니다

오픈 소스 Llama 4를 귀사의 엔터프라이즈 데이터와 결합하여 도메인 특화 AI 에이전트를 구축하세요

Introducing Meta’s Llama 4 on the Databricks Data Intelligence Platform

Published: April 5, 2025

제품1분 이내 소요

작성자: 아흐메드 빌랄, 앙킷 마투르, Cade Daniel, 프리투 다스구타, Wendy Hu, Megha Agarwal, 첸양 유, 한린 탕

Summary

라마 4를 만나보세요: 라마 4 매버릭이 이제 AWS, Azure, 그리고 GCP에서 데이터브릭스에서 사용 가능합니다.
당신의 데이터로 AI: 모자이크 AI를 사용하여 빠르고 비용 효율적인 도메인 특화 에이전트, 조종사, RAG 파이프라인을 개발하고 배포합니다.
에이전트를 신뢰하세요: 내장된 관리 기능, 로깅, 속도 제한, PII 감지, 정책 가드레일 등이 포함되어 있어 생산 환경에서 안전하게 사용할 수 있도록 도와줍니다.

수천 개의 기업들이 이미 Databricks 데이터 인텔리전스 플랫폼에서 Llama 모델을 사용하여 AI 애플리케이션, 에이전트, 워크플로를 구동하고 있습니다. 오늘, 우리는 Meta와 파트너십을 맺어 그들의 최신 모델 시리즈인Llama 4를 여러분께 선보이게 되어 기쁩니다. 이는 오늘부터 많은 Databricks 작업 공간에서 사용할 수 있으며, AWS, Azure, GCP에 순차적으로 제공될 예정입니다.

Llama 4는 열린 멀티모달 AI에서 큰 도약을 표시하며, 업계 최고의 성능, 더 높은 품질, 더 큰 컨텍스트 윈도우, 그리고 전문가의 혼합(MoE) 아키텍처로부터 향상된 비용 효율성을 제공합니다. 이 모든 것은 통합된 REST API, SDK, 그리고 SQL 인터페이스를 통해 접근할 수 있으며, 이를 통해 모든 모델을 안전하고 완전히 관리되는 환경에서 쉽게 사용할 수 있습니다.

Databricks 데이터 인텔리전스 플랫폼에서 Meta의 Llama 4 소개

Llama 4는 품질이 더 높고, 더 빠르며, 효율적입니다

Llama 4 모델은 오픈 기반 모델에 대한 기준을 높여—이전의 어떤 Llama 모델보다 훨씬 높은 품질과 더 빠른 추론을 제공합니다.

출시 시, 우리는 오늘 메타에서 출시된 가장 크고 최고 품질의 모델인 라마 4 매버릭을 소개합니다. Maverick은 다국어 구사능력, 정확한 이미지 이해력, 안전한 어시스턴트 행동을 결합하여 복잡한 AI 제품을 개발하는 개발자들을 위해 특별히 제작되었습니다. 이를 통해 다음을 가능하게 합니다:

엔터프라이즈 에이전트 들이 도구와 워크플로우 전반에 걸쳐 안전하게 이유를 제시하고 응답합니다
문서 이해 시스템 은 PDF, 스캔, 양식에서 구조화된 데이터를 추출합니다
다국어 지원 에이전트 는 문화적 유창성과 고품질의 답변으로 응답합니다
창의적인 어시스턴트 는 이야기, 마케팅 복사본 또는 개인화된 콘텐츠를 작성하는 데 도움을 줍니다

그리고 이제 훨씬 더 좋은 성능으로 이 모든 것을 구축할 수 있습니다. Llama 3.3 (70B)에 비해 Maverick는 다음을 제공합니다:

표준 벤치마크에서 더 높은 출력 품질
>40% 더 빠른 추론, 이는 모델의 가중치 중 일부만을 토큰 당 활성화하는 MoE(Mixture of Experts) 아키텍처 덕분입니다. 이로써 더 스마트하고 효율적인 계산이 가능합니다.
더 긴 컨텍스트 윈도우(최대 100만 토큰 지원), 더 긴 대화, 더 큰 문서, 더 깊은 컨텍스트를 가능하게 합니다.
12개 언어 지원 (Llama 3.3에서 8개에서 증가)

곧 Databricks에 출시될 Llama 4 Scout는 텍스트, 이미지, 비디오를 처음부터 통합하는 컴팩트하고 최고 수준의 멀티모달 모델입니다. 최대 1000만 토큰의 컨텍스트를 가진 Scout는 고급 장문 추론, 요약, 시각 이해를 위해 제작되었습니다.

"Databricks를 사용하면 LLM을 사용하여 매일 백만 개 이상의 파일을 처리하여 부동산 기록에서 거래 및 엔티티 데이터를 추출하는 번거로운 수동 작업을 자동화할 수 있었습니다. Meta Llama를 세밀하게 조정함으로써 우리의 정확성 목표를 초과하였고, Mosaic AI Model Serving을 사용하여 이 작업을 대규모로 확장하였습니다. 이를 통해 대형이고 비싼 GPU 편대를 관리할 필요가 없었습니다."
— Prabhu Narsina, 데이터 및 AI 부사장, First American

Llama 4와 Mosaic AI로 도메인 특화 AI 에이전트를 구축하세요

Llama 4를 기업 데이터에 연결하세요

Unity Catalog로 관리되는 도구를 사용하여 Llama 4를 귀사의 엔터프라이즈 데이터에 연결하여 컨텍스트를 인식하는 에이전트를 구축하세요. 비구조화된 콘텐츠를 검색하거나 외부 API를 호출하거나 사용자 정의 로직을 실행하여 copilots, RAG 파이프라인, 및 워크플로우 자동화를 강화합니다. Mosaic AI는 내장된 모니터링 및 협업 도구를 통해 이러한 에이전트를 쉽게 반복, 평가, 개선할 수 있게 해줍니다—프로토타입에서 생산까지.

데이터 파이프라인에서 확장 가능한 추론 실행

문서를 요약하거나, 지원 티켓을 분류하거나, 수천 개의 보고서를 분석하는 등 Llama 4를 대규모로 적용하세요. 이를 위해 인프라를 관리할 필요가 없습니다. 배치 추론 은 Databricks 워크플로와 깊게 통합되어 있으므로, 기존 파이프라인에서 SQL 또는 Python을 사용하여 Llama 4와 같은 LLM을 거의 부담 없이 관리 데이터에서 직접 실행할 수 있습니다.

정확성과 일치성을 위해 사용자 정의하기

요약, 보조 동작, 브랜드 톤 등의 사용 사례에 더 잘 맞도록 Llama 4를 사용자 정의하세요. 레이블이 지정된 데이터셋을 사용하거나 테스트-타임 적응형 최적화 (TAO) 와 같은 기법을 사용하여 모델을 적응시켜 주석 처리 오버헤드 없이 더 빠르게 반복하세요. 조기 접근을 위해 Databricks 계정 팀에게 문의하세요.

"Databricks를 사용하면, 상담사 교육을 위한 대화 시뮬레이터와 응답 품질 유지를 위한 단계 분류기와 같은 다양한 GenAI 사용 사례를 구축하기 위해 Llama 모델을 빠르고 안전하게 세밀하게 조정하고 배포할 수 있었습니다." 이러한 혁신은 우리의 실시간 위기 개입을 개선시켜, 더 빠르게 확장하고 위기에 처한 사람들에게 중요한 정신 건강 지원을 제공하는 데 도움이 되었습니다.
— Matthew Vanderzee, CTO, Crisis Text Line

Mosaic AI 게이트웨이를 통한 AI 사용 관리

Mosaic AI Gateway를 사용하여 안전하고 준수하는 모델 사용을 보장합니다. 이는 내장된 로깅, 속도 제한, PII 감지, 정책 가드레일을 추가하여 팀이 Databricks에서 Llama 4를 다른 모델처럼 안전하게 확장할 수 있게 합니다.

다음에 올 내용

우리는 Llama 4를 단계적으로 출시하고 있으며, Azure, AWS, GCP에서 Maverick부터 시작합니다. 곧 출시됩니다:

Llama 4 Scout - 최대 10M 토큰으로 장문 컨텍스트 추론에 이상적
더 높은 규모의 배치 추론 - 오늘부터 배치 작업을 실행하며, 곧 더 높은 처리량 지원이 제공될 예정입니다
다중 모드 지원 - 곧 도입될 네이티브 비전 기능

지원을 확대함에 따라, 극장 컨텍스트, 고처리량 작업, 통합 텍스트 및 비전 이해 등, 작업 부하에 가장 적합한 Llama 모델을 선택할 수 있게 될 것입니다.

데이터브릭스에서의 라마 4를 준비하세요

Llama 4는 앞으로 몇 일 동안 여러분의 Databricks 작업 공간에 순차적으로 제공될 예정입니다.

모자이크 AI 놀이터에서 라마 4 사용하기
Databricks에서 기반 모델에 대해 더 알아보세요
지역별 사용 가능성에 대한 문서를 확인하십시오: AWS, Azure, Google.
AI 에이전트에 대한 간략한 가이드를 확인해 보세요.

(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)

다음은 무엇인가요?

January 27, 2025/1분 이내 소요

Databricks로의 마이그레이션 탐색: 아키텍처와 전략적 접근법

January 31, 2025/1분 이내 소요