대규모 언어 모델(LLM)은 고급 자연어 처리 기술을 활용해 복잡한 작업을 수행함으로써 우리가 기술과 상호작용하는 방식을 혁신하고 있습니다. 최근 몇 년간 최첨단 LLM 모델들은 다양한 혁신적 응용 프로그램을 가능하게 했습니다. 작년에는 RAG(Retrieval Augmented Generation)가 주목받았는데, 이를 통해 사용자들은 벡터 임베딩을 이용해 조직의 데이터를 LLM에 제공하여 대화형 AI 챗봇을 만들 수 있었습니다.
하지만 이는 시작에 불과합니다. "정보 검색 기반 생성(RAG)"는 강력하지만 정적 지식 검색에만 국한되는 한계가 있습니다. 이제 우리는 한 걸음 더 나아가, 내부 데이터를 기반으로 질문에 답변할 뿐만 아니라 최소한의 인간 개입으로 실제 조치를 취할 수 있는 고객 서비스 에이전트를 상상해볼 수 있습니다.
LLM의 의미 이해와 언어적 능력을 활용하면, 단순히 사용자 쿼리에 응답하는 것을 넘어 실제로 '행동'할 수 있는 완전 자율 의사결정 애플리케이션을 만들 수 있습니다.
Databricks Mosaic AI 에이전트 프레임워크:
Databricks가 새롭게 선보인 Mosaic AI 에이전트 프레임워크는 개발자들 이 다양한 대규모 언어 모델(LLM)을 활용해 실제 서비스에 적용 가능한 에이전트 시스템을 구축할 수 있도록 지원합니다. 이 프레임워크의 핵심 기능은 RAG 애플리케이션을 포함한 고품질 AI 에이전트의 개발, 배포, 평가를 위한 종합적인 도구 세트를 제공하는 것입니다.
개발자들은 다양한 라이브러리를 활용해 에이전트를 생성하고 로그를 기록할 수 있으며, MLFlow와도 쉽게 연동할 수 있습니다. 에이전트의 매개변수 조정을 통해 빠른 실험과 반복 개발이 가능하며, 에이전트 추적 기능을 통해 로그를 기록하고 분석하여 에이전트의 응답 과정을 자세히 디버깅하고 이해할 수 있습니다.
이 블로그 시리즈의 첫 부분에서는 에이전트의 기본 개념과 핵심 구성 요소를 살펴보고, Databricks에서 제공하는 최고 성능의 오픈소스 기본 모델을 사용하여 온라인 소매업체를 위한 자율적인 다중 대화형 고객 서비스 AI 에이전트를 구축하는 과정을 소개합니다. 후속 시리즈에서는 다중 에이전트 프레임워크를 탐구하고, 같은 비즈니스 애플리케이션을 위한 고급 다단계 추론 기반의 다중 에이전트 시스템 구축 방법을 다룰 예정입니다.
LLM 에이전트는 복잡 한 작업을 수행하기 위해 설계된 차세대 고급 AI 시스템입니다. 이들은 미래를 예측하고, 과거 대화를 기억하며, 상황과 필요에 따라 적절한 방식으로 응답을 조정할 수 있는 다양한 도구를 활용합니다.
LLM 에이전트는 RAG 기술의 자연스러운 진화 형태로 볼 수 있습니다. 이는 최신 대규모 언어 모델에 외부 시스템이나 도구, 기능을 추가하여 자율적인 의사결정을 가능하게 하는 접근 방식입니다. 복합 AI 시스템에서 에이전트는 메모리, 자기 성찰 능력, 도구 사용 등으로 강화된 의사결정 엔진으로 볼 수 있습니다. 쉽게 말해, 이들은 독립적으로 학습하고, 추론하며, 행동할 수 있는 매우 지능적인 의사결정 엔진이라고 생각하면 됩니다. 이러한 기술의 궁극적인 목표는 진정으로 자율적인 AI 애플리케이션을 만드는 것입니다.
에이전트 애플리케이션은 다음과 같은 주요 구성 요소로 이루어집니다: