(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)
새로운 제품을 등록하는 것은 공급업체와 소매업체 모두에게 복잡하고 시간이 많이 소요되는 과정일 수 있습니다. 소매업체들은 종종 불완전하거나 부정확하거나 저품질의 제품 정보에 문제를 보고하며, 이는 온보딩 과정을 방해합니다. 반면에 공급업체들은 종종 중복되거나 겹치는 정보 요청에 압도되어 소매업체 파트너들이 요구하는 상세한 정보를 제공하는 데 어려움을 겪습니다. 특히 온라인 사이트에서 제품 수가 계속해서 늘어나면서 이 과정을 양쪽 모두에게 개선할 필요성은 점점 커지고 있으며, 생성 AI를 사용하면 이를 가능하게 할 수 있습니다.
이 기회를 어떻게 접근할지는 제품 온보딩 중에 직면하는 특정한 도전 과제에 따라 다릅니다. 최소한으로, 우리는 제품 이름과 설명과 같은 다양한 요소를 검사하고 생성 AI 모델에게 이러한 세부 사항이 일관성이 있는지, 그렇지 않다면 왜 그런지 물어볼 수 있습니다. 우리는 또한 잘못 철자된 단어, 약어 및 기타 섹션에 속하는 기술 사양의 포함과 같은 일반적인 문제를 찾고, 이러한 문제를 모델에게 정리하도록 요청할 수도 있습니다(그림 1).
Gen AI 적용 전 설명 |
생성 AI 적용 후 설명 |
58인치 가스 그릴은 4개의 튜브 버너와 1개의 사이드 버너를 특징으로 하며 스테인리스 스틸 구조, 새틴 마감, 페인트 칠한 측면 및 뒷면, LP 가스 60,000 BTU, 주철 그릴 패널, 요리 면적 706 평방 인치, 빵 등을 위한 후면 랙, 크기는 64 x 21 x 37-1/2 인치, 1년 보증 |
이 58인치 가스 그릴은 스테인리스 스틸 구조와 새틴 마감, 네 개의 튜브 버너, 사이드 버너를 특징으로 하며, 60,000 BTU의 파워를 제공합니다. 이 제품은 706 제곱 인치의 요리 공간, 보관용 후면 랙, 그리고 내구성 있는 주철 그릴 패널이 있습니다. |
그림 1. Llama 3.1 8B Instruct 모델이 텍스트를 더 액세스하기 쉽게 만들도록 요청한 후 샘플 제품의 설명 전후.
한 단계 더 나아가, 우리는 모델에게 제품과 관련된 이미지를 검토하고, 우리가 다시 일관성을 확인하기 위해 다른 요소와 비교할 수 있는 항목 설명을 추출하도록 요청할 수 있습니다 (그림 2).
제품 이미지 |
생성된 설명 |
|
이미지의 제품은 뚜껑, 네 개의 버너, 그리고 사이드 선반이 있는 스테인리스 스틸 그릴입니다. 그릴은 둥근 상단과 평평한 하단을 가진 직사각형 모양입니다. 상단에는 불꽃을 조절하는 노브가 있는 네 개의 버너가 있습니다. 옆쪽 선반은 음식 준비나 보관에 추가 공간을 제공합니다. 그릴은 바퀴가 달린 스탠드에 의해 지지되어 이동이 쉽습니다. 전체적인 디자인은 야외 요리에 적합한 고품질, 내구성 있는 그릴을 제안합니다. |
그림 2. 제품의 이미지와 Llama 2.3 11B Vision 모델을 사용하여 추출한 설명.
검색을 돕기 위해, 우리 는 모델에게 제공된 설명과 추출된 설명(및 관련 메타데이터)을 사용하여 키워드와 검색어를 제안하도록 요청할 수 있습니다(그림 3).
제안된 키워드 & 문구 |
스테인리스 스틸 | 58인치 | 가스 | 그릴 | 네 개의 버너 | 사이드 버너 | 60,000-BTU | 706-제곱인치 | 주철 | 그릴 패널 | 실버 | 새틴 마감 | 요리 공간 | 후면 랙 | 보관 | 야외 주방 | 파티오 그릴 | 대형 그릴 | 헤비 듀티 그릴 | 상업용 그릴 | 고출력 그릴 |
그림 3. 그림 1과 2에서 설명된 그릴에 대해 생성된 검색어, Llama 3.1 8B Instruct 모델 사용.
우리는 또한 모델에게 이미지에서 핵심 속성을 결정하고, 그 정보를 사용하여 공급업체가 등록 시 제공하지 않았을 수 있는 세부 사항을 처리하도록 요청할 수 있습니다(그림 4).
제품 이미지 |
추출된 색상 |
|
실버 |
그림 4. Llama 2.3 11B Vision 모델을 사용하여 결정된 제품의 이미지와 주요 색상.
이러한 모델을 이런 방식으로 사용하는 핵심적인 도전 과제 중 하나는 출력물이 우리가 필드에 대해 정의할 수 있는 제약 조건을 항상 준수하지 않을 수 있다는 것입니다. 예를 들어, 우리는 주요 색상으로 실버 값을 추출할 수 있지만, 그 색상이 회색 또는 금속색과 같은 지원되는 선택 사항과 일치해야 합니다. 이러한 시나리오에서는 모델에게 허용되는 선택사항 목록을 제공하고 검사되는 항목과 가장 잘 맞는 응답으로 제한하도록 요청할 수 있습니다.
또 다른 접근 방법은 다양한 속성을 사용하여 의미론적 검색을 수행하는 것일 수 있습니다. 이는 텍스트나 이미지를 숫자 인덱스로 변환하는 생성 AI 기법으로, 개념적으로 유사한 항목들이 서로 가까이 위치하게 됩니다. 이 기술을 고품질 항목 세부 정보의 사전 승인된 세트와 함께 사용하면, 우리는 밀접하게 관련된 항목을 식별하고 그들로부터 제품 계층 구조에서의 위치와 같은 관련 속성을 검색할 수 있습니다.
다양한 접근법을 갖추고 있으므로, 우리는 어떻게 애플리케이션을 구조화할지 결정해야 합니다. 초기 구현에서는 기관들이 일괄 처리 과정을 구현하고, 공급업체 제출 후 데이터 입력을 검증하고 수정하여 기존의 제품 온보딩 절차가 방해받지 않도록 하는 것을 보고 있습니다. 프롬프트와 모델이 신뢰할 수 있는 결과를 제공하도록 적절하게 조정되면, 데이터 입력 시점에 생성 AI를 사용하여 문제가 발생하면 공급업체에게 권장 대안을 제시하는 새로운 온보딩 애플리케이션 개발로 이동하는 데 관심이 생기는 경우가 많 습니다. 두 가지 접근법 모두 효과적일 수 있지만, 변화 관리에 있어서 차이가 있습니다.
배치 형태든 실시간이든, 이러한 생성 AI 워크플로우의 구현은 Databricks 데이터 인텔리전스 플랫폼에 의해 간소화됩니다. 다양한 데이터 형식을 지원하는 Databricks는 구조화되고 비구조화된 데이터 입력을 쉽게 처리할 수 있습니다. 그 개방적인 특성으로 인해, 플랫폼은 미리 통합된 가장 인기 있는 많은 생성 AI 모델을 지원합니다. 벡터 저장소와 같은 주변 기술들도 사전에 통합되어 있어, 구현을 간소화합니다.
구축할 애플리케이션에 대해, Databricks는 일괄 처리와 실시간 워크플로우 를 지원하여 새로운 정보가 도착함에 따라 데이터를 백그라운드에서 처리할 수 있습니다. 대화형 사용자 중심 애플리케이션이 선호되는 경우, 플랫폼의 내장 애플리케이션 기능 은 내부 및 외부 대상에게 확장 가능하고 통합된 솔루션의 구축과 배포를 단순화합니다.
Databricks 데이터 인텔리전스 플랫폼의 다양한 기능은 제품 온보딩 솔루션을 구축하려는 조직이 원하는 것의 세부 사항에 초점을 맞추고, 필요한 부분을 어떻게 모아서 구축할 것인지에 대한 고민을 줄일 수 있게 합니다.
조직이 Databricks 데이터 인텔리전스 플랫폼에서 생성 AI를 어떻게 사용하여 일반적인 제품 온보딩 문제를 해결할 수 있는지 보여주기 위해, 우리는 다양한 기법을 보여주는 새로운 솔루션 가속기 를 구축했습니다. 아마존 버클리 객체 (ABO) 데이터셋에서 제품 이미지와 메타데이터를 사용하여, 이러한 기법들이 어떻게 일괄 처리 워크플로우에서 사용될 수 있는지, 그리고 여러 문제를 식별하고 수정하는 방법을 보여줍니다. 생성 AI 모델로부터 일부 세부 정보를 보류함으로써, 우리는 선택한 모델이 예상대로 수행되고 있는지 확신을 얻기 위해 수정 사항을 스팟 체크할 수 있습니다. 제품 온보딩 문제를 해결하기 위해 생성 AI를 사용하려는 조직들에게 우리의 코드를 검토하고, 보여진 기법에서 영감을 얻고, 그들에게 작동하는 코드를 빌려서 오늘날 Databricks와 함께 제품 온보딩 솔루션을 구축하기 시작하도록 권장합니다.