メインコンテンツへジャンプ

Translation Reviewed by Hiroyuki Nakazato

生成AIを用いることで、組織は計り知れない価値を引き出すことができます。 どの組織もその可能性を認識していますが、生成AI技術をどこでどのように採用するかについて賢明な選択をする必要性には慎重です。 モデルやベンダー、そしてアプローチの数は圧倒的です。 当然のことながら、予算責任者は、生成 AI の導入に伴う投資と再編成を正当化できる実行可能な投資収益率(ROI)戦略を確認する必要があります。

Databricks は、不正検出から財務予測まで、あらゆる分野でエンタープライズ AI の力を Databricks 自身の社内で活用してきた長い歴史を持っています。 当社の生成 AI プラットフォームは、Salesforce や Metronome などの複数のソースシステムからデータを取り込み、それを中央の「logfood」アーキテクチャに送信します。そこでデータを抽出して変換し、データ サイエンティストやソフトウェア エンジニアなど、さまざまな担当者が活用できるようにしています。 このプロセスには、10 ペタバイトを超えるデータと 60 のマルチクラウドの地理的リージョンが関係しており、毎週 2,000 人超のユーザーの 100,000 件を超える毎日のタスクを処理するために使用されています。 お客様のAI戦略と取り組みに協力していく中で、私たち自身がビジネスで AI をどのように活用しているか、また、どのようなツールや戦略、ヒューリスティックを採用しているかを探ることは有益です。

AI 戦略を構築する方法の 1 つは、法務、エンジニアリング、セキュリティの各チームとの連携を含む堅牢な AI ガバナンス体制を確立することから始めることです。 確立したら、成熟したサードパーティ ソリューションと、厳格な A/B テストを活用して従来のアプローチとパフォーマンスを比較する生成 AI 社内構築プログラムを組み合わせたハイブリッド アプローチを採用します。 このフレームワークと意思決定方法は、さらなるユースケース開発の足掛かりを築くことができる明確な成功を強調するため、幅広い AI 実践者にとって有益です。 以下は、Databricks が複数ステップの生成 AI ビジョンをどのように実践しているかを示す、明確な成功例と実験的アプローチの例です。

明確な勝利

社内外のサポート チームでの生成 AI の使用は、Databricks にとって、そして実際にこのテクノロジーを活用しようとした多くの組織にとって明らかな勝利でした。 組織のサポート機能を強化することは、多くの場合、AI 戦略の最初のステップであり、私たちの場合、サポート チームに優れたドキュメントと知識を提供し、サポート ケースの速度向上や削減能力の向上、自動化機能、顧客向けのセルフ サービスの向上に重点を置きました。 現在、40 を超えるエンジニアリング チャンネルが、3,000 人のアクティブ ユーザーとともに、社内の Slackbot サポート機能を使用しています。 合計で、問題解決、スクリプトと SQL のサポート、エラー コードの説明、アーキテクチャまたは実装のガイダンスなどの分野に関連する約 40,000 件の質問への回答を社内で自動化できました。

外部利用に関しては、数百人のアクティブユーザーを持つ同じ Slackbot が 1,200 以上の質問に答えることができました。IT サポート側では、既存の技術と生成 AI を組み合わせて、サポートおよび学習機能を強化しました。この結果、サポートと AI チャットボットが一般的な問い合わせに対応する仕組みが整い、対応率は 2 年前のゼロから、30% に向上しました。最終的な目標は、2024 年末までに 60% に到達することです。 一方で、Field Sidekick(現場支援ツール)に統合されたBrickNuggetsチャットボットは、営業チームにマイクロラーニングを提供しています。全社的には、サードパーティのチャットボットをグローバルに活用し、チーム間のコラボレーションや一般的な質問に対する具体的な回答を得るために使用されており、社内では月間4,700人以上のアクティブユーザーがいます。

2 つ目の明確な成功事例は、ソフトウェア開発における生成 AI の利用に関するものです。私たちはコパイロット機能を活用することで、エンジニアの生産性を向上させ、技術的な知的財産(IP)の開発も進めてきました。コパイロットの機能は、膨大な効率性と生産性の向上をもたらします。早期アクセスユーザーを対象とした調査では、70% が「より生産的になった」と答え、73% が「タスクをより迅速に完了できる」と述べ、67% が「より重要なタスクに集中するための時間を節約できた」と答えました。

Databricks では、生成 AI コパイロットを活用して、従来は作成が困難であったモデルや、より専門的なエンジニアリングの専門知識を必要とするモデルも含め、ツール、ダッシュボード、機械学習(ML)モデルをより高速に構築しています。 当社は、データエンジニアリング、データ取り込み、レポート作成、その他のデータタスクを高速化するために、 DatabricksIQとアシスタントコパイロットを積極的に活用しています。 コパイロットのその他の用途は、言語の移行やテストケースの開発、およびコードの説明にまで及びます。 生産性の向上は、当社のビジネスに顕著な違いをもたらし、場合によっては最大 30% も向上します。

実験の精神

Databricks は、明確な成果を認識するだけでなく、適切なガードレールを備えた AI 戦略に対して実験的なアプローチを採用する意欲も示しています。 パイロットに変化したり、最終的に本番運用に至った多くのアイデアは、アイデア創出の文化と、当社が単に製品に AI を組み込むだけではなく、AI を中心としたインフラストラクチャを構築しているという認識を反映した、数多くのDatabricks ハッカソンから生まれました。

一例として、インサイドセールスチーム向けのメール生成があります。メール生成の自動化は、セールスチームの業務負荷を管理するための便利で効率的な方法ですが、特定の業界、製品、および顧客基盤に関する文脈を考慮する必要があるため、実行が難しい場合があります。私たちのアプローチは、データレイクハウスで管理・統制されているデータの知見と LLM の力を活用することです。これにより、オープンソースの AI モデルとデータインテリジェンスプラットフォーム(データウェアハウスのデータセット、Databricks の Unity Catalog ガバナンスプラットフォーム、モデル実行用のモデル提供エンドポイント、RAG Studio プラットフォーム、Mosaic AI を統合)を組み合わせて、構造化データと非構造化データを微調整し、高品質な応答率を提供することが可能になります。RAG は私たちのアプローチにおいて重要な要素であり、LLM をエンタープライズデータと組み合わせるだけでなく、学習プロセスを迅速化するために品質と速度のバランスを適切に提供します。

その結果、メール生成支援機能は、連絡先の役割、代表する業界、類似の顧客参照などの文脈情報と、単語数、トーンや文法、効果的なメールガイドラインなどのメール生成支援を組み合わせたインテリジェントな機能となりました。ビジネス開発の専門家(SME)と密接に協力し、モデルをトレーニングするための適切なプロンプトを開発しました。このアプローチは非常に価値があり、モデルが生成した AI メールの返信率と応答率は、営業・ビジネス開発担当者が初めてメールを送信する場合に匹敵します(具体的には、クリック率が 30% から 60%、返信率が 3% から 5%)。一方で、メール1通あたりのコストは、微調整されたオープンソースモデルを使用することで、US$0.07 から US$0.005 に減少しました。営業開発担当者(SDR)は、これらのメールを見込み客に送信する前に完全な編集権を持っています。この自動化技術と編集プロセスの両方には、誤生成や関連性のないデータを排除するための安全対策が組み込まれており、メールキャンペーンが集中して効果的であることを確保しています。

内部営業担当者向けのもう一つの有望なツールは、営業ベースのエージェント LLM モデルです。これは「ホバーチャットボット」の機能を活用して、特定の会社の可能性やユースケースについて営業チームに情報を提供します。例えば、Salesforce を利用するユーザーは、会議の前に会社の最近の変化を把握したり、類似企業の構造化データを使用して、クラウドプラットフォームの移行や新しいデータウェアハウスの構築などの有益な介入を特定したりすることができます。このモデルの機能の重要な要素は、Salesforce の構造化データと内部および外部の非構造化データの両方を、アクセス制御を維持し、データ機密性の基準を満たす方法で組み合わせることにあります。

また、契約管理における新しいアプローチを実験し、契約の要約を支援する生成 AI ツールも構築しています。 Salesforce の検証済みデータに対して非標準の契約条件を評価し、特定の契約に関連する補償と法的リスクのレベルを判断できます。 この自動要約への移行により、契約の処理が高速化され、社内の法務チームの作業負荷が軽減されます。また、これは、セキュリティおよびプライバシー チームと連携して設計された、より広範な AI ガバナンスと安全性のフレームワークによってサポートされています。

主な考慮事項

実験的なユースケースを開発する場合でも、成功事例に基づいて構築する場合でも、生成 AIに取り組む際には、いくつかの共通点に注意する必要があります。

  • 洗練されたプラットフォームには利点がありますが、DBRX や Llama 3 などの基礎的なオープンソース モデルから生まれたプロジェクトもあり、RAG アプローチによってリスクを軽減できます。 当社では、構造化データと非構造化データと RAG ベースのモデルを組み合わせて、実用的な知見を提供し、誤解を最小限に抑えています。また、ROI を確保し、コストを最小限に抑える鍵となるモデルの有効性を確認するために、当社独自の Databricks RAG Studio プラットフォームを使用することが増えています。 カスタマイズしたプロンプトを使用して LLM 動作をガイドし、 Databricks インテリジェンス プラットフォームを使用してエンタープライズ データと組み合わせることで、実験から迅速に最適化および学習することができます。 これらのアプローチは、速度と品質のバランスが取れており、微調整したり、LLM 事前トレーニング手順に組み込んだりすることができます。 さまざまなキャンペーンやモデルに対するパフォーマンスを測定することで、会社やその他の利害関係者にとってのメリットが浮き彫りになります。
  • 生成 AIツールは、従業員の満足度と効率性を認識し、定量化する必要があります。 実装の早い段階からライフサイクル全体にわたって従業員エクスペリエンスをモニタリングすることで、従業員がテクノロジーの機能を最大限に活用し、テクノロジーの使用を定着させることができます。 これは、さまざまなチームからの継続的なフィードバックを通じて、全面的に行われる必要があります。 プロトコルは、テクノロジーが一貫して効果的に使用されることを保証します。
  • 実験のプロセスは簡単ではなく、本番運用への道はデータとテストの課題に満ちています。 組織が AI の利用を拡大するにつれて、課題は複雑化しますが、決して克服できないものではありません。 データが乱雑でテストが難しいのは事実ですが、組織が負担を軽減するために実行できるステップは数多くあります。 レイクハウス機能を活用し、データベース拡張に反復的なアプローチを採用し、テスト実施時にビジネスへの影響を測定する計画を策定することは、すべて重要なステップです。 ML Ops ステージ間をスムーズに移動すること、高品質のプロンプトを提供するための集中的なセッションを計画すること、回答が実用的な知見をもたらすことを保証することも重要です。
  • 特にコストが低い場合、エクスペリメントは広範囲な調整なしに有効にできますが、実験から本番運用に移行するには集中型のアプローチが必要です。 これには IT 機能とガバナンス機能が含まれ、どちらも ROI の評価に役立ちます。

今後、Databricks は生成 AI を活用した多くの革新的で高価値の内部ユースケースを追求しています。具体的には、ビジネス運営(ディールデスクや IT サポートを含む)、現場の生産性(アカウントアラート、コンテンツの発見、会議準備)、マーケティング(コンテンツ生成とアウトバウンド見込み客探索)、人事(チケットディフレクションと採用効率)、法務(契約データ抽出)、ビジネス分析(セルフサービスのアドホッククエリ)などの分野で利用が進んでいます。しかし、私たちは外部顧客ベースに対する生成 AI の価値を無視しているわけではありません。

米国の航空会社 JetBlue は、当社のデータ インテリジェンス プラットフォームと高度な OSS LLM を組み合わせてチャットボットを構築し、従業員が各自の役割に固有の KPI や情報にアクセスできるようにしました。 このソリューションにより、トレーニング要件とフィードバックの処理時間が短縮され、組織全体で知見へのアクセスが簡素化されました。 ヨーロッパの航空会社 easyJet も同様の生成 AI ソリューションを構築しました。これは、技術に詳しくないユーザーが自然言語で音声ベースの質問をし、意思決定プロセスに役立てられる知見を得るためのツールとして設計されています。 このソリューションは、組織のデータ戦略の改善に役立ち、ユーザーがデータや LLM 主導の知見に簡単にアクセスできるようにしただけでなく、リソースの最適化、運用プロセスとコンプライアンスを中心としたチャットボット、カスタマイズされた旅行の推奨事項を提供するパーソナル アシスタントなど、他の革新的な生成 AI ユース ケースに関する新しいアイデアも生み出しました。

生成 AI プロジェクトは、セキュリティ、ガバナンス、ROI を考慮して実施する必要がありますが、組織が反復と実験を通じて生成 AI の部門横断的な可能性を取り入れると、この AI 戦略の潜在的な効率性の向上によって、組織とその顧客の両方に競争上の優位性がもたらされることが、当社の経験から明らかです。

さらなるリソースを探す

Databricks 無料トライアル

関連記事

Databricksで高品質のRAGアプリケーションを作成する

RAG(Retrieval-Augmented-Generation )は、独自のリアルタイムデータを LLM(Large Language Model) アプリケーションに組み込む強力な方法として、急速に台頭してきた。 本日Databricksユーザーが企業データを使用して高品質な本番LLMアプリケーションを構築するためのRAGツール群を発表できることを嬉しく思う。 LLMは、新しいアプリケーションを迅速にプロトタイプ化する能力において、大きなブレークスルーをもたらした。 しかし、RAGアプリケーションを構築している何千もの企業と仕事をした結果、彼らの最大の課題は、これらのアプリケーションを 本番で用いることができる品質にすること であることがわかった。 顧客向けアプリケーションに要求される品質基準を満たすためには、AIの出力は正確で、最新で、そして企業のコンテキストを認識し、安全でなければならない。 高品質なRAGアプリケーションを構築するためには、開発者はデータとモデル出力の品質を理解するための豊富なツール
Databricks ブログ一覧へ