이미지 생성 기술은 리테일 및 소비재 기업에게 상당한 이점을 제공합니다. 마케팅 전문가, 디자이너, 제품 개발팀은 사용자 프롬프트에서 양식화된 이미지와 사실적인 이미지를 모두 만들어 낼 수 있는 생성형 모델을 사용하여 새로운 아이디어와 디자인을 빠르고 효과적으로 시도해 볼 수 있습니다. 이 AI 기술을 사용하기 위한 기본 요건은 사용자가 개념을 명확하게 표현할 수 있는 능력 입니다. 그런 다음 공유된 목표에 집중하는 소규모 팀이 AI에 프롬프트를 전달하여 아이디어를 평가하고 새로운 아이디어를 촉발하는 데 도움이 되는 시각화를 생성할 수 있습니다. 이러한 기술을 통해 팀은 초기 투자 비용을 줄이고 피드백 시간을 단축하며 궁극적으로 새롭고 혁신적이며 차별화된 콘텐츠 및 디자인 컨셉을 도출하는 보다 창의적인 프로세스에 참여할 수 있습니다.
그러나 대량의 일반 이미지로 미리 훈련된 모델을 사용하는 것은 일관된 이미지를 생성하는 데 도움이 되지만, 대부분의 조직은 특정 브랜드나 도메인에 특화된 패턴, 디자인 및 미적 요소를 모방하기를 원합니다. 이러한 경우 위와 같은 요소를 이해하기 위해 모델을 미세 조정(fine-tuning)하면 조직의 요구사항에 더 잘 부합하는 결과물을 제작할 수 있습니다. 이 블로그 포스트에서는 이러한 방식으로 모델을 조정할 수 있는 핵심 개념을 소개하며, 이를 통해 우리의 고객들이 이러한 놀라운 기술의 즉각적인 이점을 더 많이 누릴 수 있기를 바랍니다.
브랜드 및 도메인 지식을 반영하여 모델을 미세 조정하는 방법을 설명하기 위해 가구 디자이너가 새로운 의자 디자인에 대한 아이디어를 얻고자 하는 시나리오를 상상해 보겠습니다. 이 시나리오에서 디자이너는 인터넷에서 수집한 대량의 이미지로 학습된 Stable Diffusion XL과 같이 잘 알려진 이미지 생성 모델을 선택했을 수 있습니다.
이 모델은 다양한 종류의 이미지를 생성할 수 있지만, 디자이너는 과거에 생성한 의자에 대한 모델의 이해력을 향상시키기를 원할 수 있습니다. 이러한 항목에 대한 지식은 모델이 브랜드의 일반적인 방향과 일치하는 이미지를 생성하는 데 도움이 될 것입니다. 이는 회사가 고객과 특정한 디자인 감각을 확립하려는 데 매우 중요합니다.
이를 위해 디자이너는 팀에 주요 제품의 사진을 몇 장 찍어 달라고 요청합니다. 각 항목은 다양한 각도에서 캡처되므로 모델은 다양한 구성에서 항목을 렌더링하는 방법에 대한 인사이트를 얻을 수 있습니다. 하지만 여기서 중요한 것은, 디자이너가 Stable Diffusion 모델에 이미 내재된 일반적인 지식을 기반으로 구축하기 때문에 압도적인 수의 이미지가 필요하지 않다는 것입니다.
특정 스타일의 의자와 관련된 각 이미지에 대해 설명이 제공됩니다. 각 설명에는 사진의 피사체가 되는 각 항목에 대한 고유한 이름(토큰)이 포함되어 있습니다. 이 토큰은 모델이 이미지의 특정 항목을 식별할 뿐만 아니라 이 이미지가 학습된 다른 이미지와 어떻게 다른지 학습하는 데 도움이 됩니다. 나머지 설명은 모델이 다른 이미지에 대한 사전 학습을 통해 이미 축적된 지식을 방해하지 않도록 간결하게 유지합니다.
Chair | Token | Description |
---|---|---|
![]() |
BCNCHAR | A photo of a BCNCHAR chair taken from the side. |
![]() |
EMSLNG | A photo of an EMSLNG chair taken from the front. |
![]() |
HSMNCHR | A photo of a HSMNCHR chair taken from the side. |
![]() |
EMSRCK | A photo of a EMSRCK chair taken from the side. |
![]() |
NRMCHR | A photo of a NRMCHR chair taken from the front. |
그림 2. 샘플 가구 디자인 회사에서 선택한 5개의 의자 각각에 대한 설명
이미지 생성 모델의 미세 조정을 위해 DreamBooth 프레임워크를 사용하여 기성품인 Stability Diffusion XL 모델을 미세 조정합니다. 결과 모델은 재사용을 위해 저장되며, 이제 모델은 디자이너와 팀 에 더 잘 맞는 결과물을 생성할 수 있습니다. 그림 3.
Original Stable Diffusion XL | Fine-Tuned Stable Diffusion XL |
---|---|
![]() |
![]() |
그림 3. 원래 Stability Diffusion XL 모델의 출력 이미지와 그림 1의 이미지로 미세 조정된 모델에 "갈색 가죽(EMSLNG) 의자 사진"이라는 프롬프트로 생성된 출력 이미지
이 모델로 무장한 디자인 팀은 이제 제품의 새로운 변형을 탐색하고(그림 4), 포트폴리오에서 이전에 생산한 제품의 디자인을 반영한 새로운 아이템을 모두 함께 생산할 수도 있습니다(그림 5).