メインコンテンツへジャンプ

生成AIを用いてブランドイメージに沿った画像を作成する

吉松龍太
マイケル・シュテルマ
アナスタシア・プロカイエワ
ブライアン・スミス(Bryan Smith)
Share this post

画像生成技術は、小売業や消費財メーカーに大きなメリットをもたらします。 生成モデルを使用することで、ユーザーのプロンプトから様式的な画像とフォトリアリスティックな画像の両方を生成することができ、マーケティング担当者やデザイナー、製品開発チームは、新しいアイデアやデザインを迅速かつ効果的に検討することができます。 このAI技術を使用するための主な要件は、ユーザーがコンセプトを明確に表現する能力です。 共通の目標に集中する個人からなる小さなチームは、AIにプロンプトを渡すことで、アイデアを評価したり、新しいアイデアを閃いたりするのに役立つビジュアライゼーションを生成できます。 このような技術によって促進されるプロセスでは、チームは先行投資コストを削減し、フィードバックまでの時間を短縮し、最終的には、新しい、革新的で差別化されたコンテンツやデザインコンセプトにつながる、より創造的なプロセスに従事することができます。

しかし、大量の一般的な画像で事前に訓練されたモデルを使用することは、あるまとまった画像を作成するのに適していますが、ほとんどの組織では、特定のブランドやドメインに固有のパターンやデザイン、美学を模倣したいと思っています。 そういった要素を理解するためにモデルを微調整(ファインチューニング)することは、組織のニーズにより合致したアウトプットを生み出すのに役立ちます。 このブログでは、このような方法でモデルを調整する方法の核となるコンセプトをご紹介します。

カスタムイメージによるモデルの微調整

ブランドやドメインの知識を反映させるためにモデルをどのように微調整するかを説明するために、家具デザイナーが新しい椅子のデザインを考えたいというシナリオを想像してみましょう。 このシナリオでは、インターネットから収集した大量の画像でトレーニングされた、Stable Diffusion XLのような定評のある画像生成モデルを、デザイナーが選択している可能性があります。

このモデルは様々な画像を作り出すことができますが、デザイナーは、過去に製作した椅子についての理解を深めたいと思うかもしれません。 過去に制作した椅子に関する知識は、画像生成モデルがブランドの一般的な方向性に沿った画像を生み出すのに役立つことから、顧客と特定のデザイン感覚を確立しようとする同社にとっては非常に重要です。

これを可能にするため、デザイナーはチームに主要製品の写真を撮らせます。 各アイテムをさまざまな角度からキャプチャすることで、さまざまな構成でアイテムがどのようにレンダリングされるべきかをモデルが知ることができます。 しかし、ここで重要なのは、デザイナーがすでにStable Diffusionモデルに焼き込まれている一般的な知識をベースにしているため、圧倒的な数の画像が必要ないということです。

<b>図 1.</b>サンプル家具デザイン会社が製作した椅子の中核となるデザインの美学を表現した5種類の椅子の画像。
Figure 1. Images of five different chairs representing the core design aesthetics of chairs produced by a sample furniture design company.

それぞれの椅子のスタイルに関連する画像には、説明が記載されています。 各説明文には、写真の被写体である各アイテムの固有の名前(トークン)が含まれています。 このトークンは、モデルが画像内の特定のアイテムを識別するだけでなく、この画像が、トレーニングされた他の画像とどのように異なるかを学習するのに役立ちます。 残りの説明は、モデルが他の画像に対する事前のトレーニングで既に蓄積した知識を妨げないように、簡潔なものにします。

椅子トークン説明
BCNCHARBCNCHARBCNCHARチェアを横から撮った写真。
EMSLNGEMSLNGEMSLNGチェアを正面から撮影。
HSMNCHRHSMNCHRHSMNCHRチェアを横から撮った写真。
EMSRCKEMSRCKEMSRCKチェアを横から撮影。
NRMCHRNRMCHRNRMCHRチェアを正面から撮影。

図2.サンプル家具デザイン会社が選んだ5脚の椅子の説明

画像生成モデルの微調整のためのDreamBoothフレームワークを使用して、既製のStability Diffusion XLモデルを微調整します。 出来上がったモデルは再利用のために保存され、デザイナーとそのチームにより適したアウトプットを生成できるようになりました。 (図 3)

オリジナルStable Diffusion XL微調整されたStable Diffusion XL
オリジナル安定拡散XL微調整された安定拡散XL

図3.オリジナルのStability Diffusion XLモデルの出力画像と、図1の画像で微調整したモデルの出力画像。"ブラウンレザー(EMSLNG)の椅子の写真。"

このモデルを武器に、デザインチームは製品の新たなバリエーションを模索し(図4)、ポートフォリオに含まれる既製品のデザインを反映させたまったく新しいアイテムを生み出すこともできるようになりました(図5)。

図4.認知されているチェアスタイルの色と素材のバリエーション
Figure 4. Color and material variations for recognized chair styles

図5.様々な椅子の要素を組み合わせることで生まれる新しい家具アイテム
Figure 5. New furniture items generated by combining elements of various chairs

Databricksによるモデルのカスタマイズの有効化

画像生成モデルの微調整は、新しいアイデアやデザインを探求するための強力なツールを組織に提供します。 しかし、このような能力を提供するためには、生成的なAIモデルを独自の情報資産と統合し、モデルの微調整という重い計算作業を実行し、幅広いユーザーアプリケーションとの統合をサポートする方法で更新されたモデルを展開できなければなりません。 これらの機能はすべて、Databricksデータインテリジェンスプラットフォームを通じて利用できます。

Databricksを使用することで、組織は構造化・非構造化の両方の情報資産を保存、処理、照会することができます。 一元化されたデータガバナンスレイヤーの背後で管理されるこのデータは、レポート利用者、アナリスト、データサイエンティストに公開され、一貫した管理を維持しながら、最も幅広い利用を可能にします。 弾力的なスケーラビリティと最新のGPUアーキテクチャのサポートにより、高性能なワークロードを効率的に拡張し、このデータ上で動作する重要なワークロードをタイムリーに処理できるようにします。 オープンなプラットフォームとして、組織はオープンソースとプロプライエタリモデルの両方を活用して、この技術を実現することができます。

ビルトインのモデル管理機能を使用することで、既製のモデルやカスタマイズされたモデルを取り込み、評価し、本番デプロイに移行することができます。 これらのモデルは、ネイティブのモデルサービング機能を通じて、最新のアプリケーションやユーザーインターフェース技術で広くサポートされているオープンでセキュアなインターフェースを使用して公開することができます。 Databricksデータインテリジェンスプラットフォームを使用すると、情報資産を差別化できる能力に変えるプロセスが大幅にシンプル化されるため、多くの組織がデータとAIのニーズを満たすためにこのプラットフォームを採用しています。

Databricksを使用して画像生成モデルを微調整し、上記のようなブランドに沿った画像を提供する方法をご覧になりたいですか? 最新のソリューションアクセラレーターをご覧ください。 無料でアクセスできるノートブックでは、既製のモデルをあなたのニーズに合わせてカスタマイズされたソリューションに変えるエンドツーエンドのプロセスを、ステップバイステップの手順と文書化されたコードで説明しています。

生成AIを使用して、ブランドに沿った画像を作成するための最新のソリューションアクセラレーターをご覧ください。

Databricks 無料トライアル

関連記事

生成AIを使って商品コピー(説明文)の作成を拡張する

eコマースプラットフォームでは、優れた商品説明は商品を目立たせ、販売を促進します。 優れた商品説明は、正確で読みやすく、顧客のニーズにつながるだけでなく、ブランドや小売業者のサイトのイメージを強化するものでなければなりません。 多くの組織では、少人数のライターチームが商品コピーとも呼ばれる説明文の作成に取り組んでいます。 ビジネスのニーズによっては、ブランドとの一貫性を保ちながら、消費者の共感を得るために必要なすべての要素をバランスよく配置するまでに、商品コピーは何度も繰り返し進化することがあります。 ファッション業界など、新商品の投入頻度が高い業界では、プラットフォームで販売できるようになるまでに時間がかかります。 生成AIを使用することで、コピーライターは新しい商品説明文の作成に取り掛かることができます。 生成AIは、商品画像から基本的な説明を抽出し、商品に関する情報を組み合わせて、ブランドのニーズに沿ったトーンやスタイルを反映したコピーの草稿を作成するために使用できます。 作家はこれらを出発点として、ゼロか

大規模言語モデルを用いて常識に沿った商品レコメンデーションを行う

詳細とノートブックのダウンロードについては、 LLM Solution Accelerators for Retail をご覧ください。 商品の推薦(レコメンデーション)は、現代の顧客体験の中核をなす機能です。 ユーザーは以前利用したことのあるサイトに戻ったとき、以前の利用内容に関連するレコメンデーションが表示されることを期待します。 ユーザーが特定のアイテムに興味を持ったとき、類似した関連性のある代替品が提案され、自分のニーズに合ったアイテムを見つけられることを期待します。 また、商品がカートに入れられると、ユーザーは、全体的な購買体験を完成かつ向上させる追加の商品がレコメンドされることを期待します。 このような商品のレコメンデーションが適切に行われれば、買い物がスムーズになるだけでなく、ユーザーは小売店によって認識され、理解されていると感じることができます。 商品のレコメンデーションを生成するための様々なアプローチがありますが、現在使用されているレコメンデーションエンジンのほとんどは、小売業者固有の大規模なデ

画像とメタデータの活用して商品の名寄せを実現するには

翻訳:Saki Kitaoka. - Original Blog Link 商品マッチングは、多くの小売企業や消費財メーカーにとって不可欠な機能です。サプライヤーがオンライン・マーケットプレイスで新商品を販売する際、入荷する商品は既存の商品カタログの商品と比較されます。サプライヤーは、小売業者のウェブサイトに掲載されている商品リストを比較し、表示されている内容が契約条件と一致していることを確認します。小売業者はお互いのウェブサイトをスクレイピングし、価格比較のために商品を一致させることがあります。また、サプライヤーは、小売業者やサードパーティのデータから、より上位の商品アグリゲートと、販売する個々のSKUを照合する必要があります。多くの組織にとって、この作業は時間がかかり、正確ではありません。 この作業を行う上での主な課題は、同じ商品でも組織によってラベル表示が異なることです。表示される商品名、説明文、または顧客と商品との結びつきをよくするための箇条書きの特徴リストの小さな差異が、正確な一致を不可能にすることがあ
業界一覧へ