メインコンテンツへジャンプ

ソリューション・アクセラレーターのご紹介: 製造業のためのLLM

Will Block
 Ramdas Murali
Nicole Lu
Bala Amavasai

in

Share this post

翻訳:Saki Kitaoka.  -  Original Blog Link

GoogleのVaswaniらによるトランスフォーマーに関する画期的な論文(seminal paper on transformers by Vaswani et. al.)が発表されて以来、大規模言語モデル(LLM)は生成AIの分野を支配するようになりました。間違いなく、OpenAIのChatGPTの登場は、多くの必要な宣伝をもたらし、個人的な使用と企業のニーズを満たすものの両方で、LLMの使用に対する関心の高まりにつながりました。ここ数ヶ月の間に、GoogleはBardを、MetaはLlama 2モデルをリリースし、大手テクノロジー企業による激しい競争を示しました。

製造業やエネルギー産業では、運用コストの上昇に加え、より高い生産性を実現することが課題となっています。データ先進企業はAIに投資しており、最近ではLLMにも投資しています。要するに、データフォワード企業はこれらの投資から大きな価値を引き出しているのです。

DatabricksはAIテクノロジーの民主化を信じています。

私たちは、すべての企業がLLMを訓練する能力を与えられ、データとモデルを所有すべきだと信じています。製造業やエネルギー産業では、多くのプロセスが専有されており、これらのプロセスは、厳しい競争に直面している中で、リードを維持したり、営業利益率を改善したりするために不可欠です。秘密のソースは、特許や出版物を通じて一般に公開されるのではなく、企業秘密として秘匿することで保護されます。一般に入手可能なLLMの多くは、知識の明け渡しを必要とするこの基本要件に適合していません。

ユースケースという点では、この業界でしばしば生じる疑問は、より多くのアプリやデータを氾濫させることなく、いかにして現在の労働力を増強するかということです。そこには、労働力により多くのAIを搭載したアプリを構築し、提供するという課題があります。しかし、ジェネレーティブAIとLLMの台頭により、これらのLLMを搭載したアプリは、複数のアプリの依存性を減らし、知識を補強する機能をより少ないアプリに集約できると考えています。

業界には、LLMの恩恵を受けられるユースケースがいくつかあります。これには以下が含まれますが、これらに限定されるものではありません:

  • 顧客サポート担当者の強化:カスタマー・サポート・エージェントは、該当する顧客の未解決/未解決の問題を照会し、AIガイド付きのスクリプトを提供して顧客を支援できるようにしたいと考えています。
  • 対話型トレーニングによるドメイン知識の獲得と普及:この業界は、しばしば「部族的」知識として表現される深いノウハウに支配されています。労働力の高齢化に伴い、このドメイン・ナレッジを永続的に捕捉することが課題となっています。LLMは知識の貯蔵庫として機能し、トレーニングのために容易に普及させることができます。
  • フィールド・サービス・エンジニアの診断能力の強化:フィールド・サービス・エンジニアは、相互に絡み合った膨大なドキュメントへのアクセスにしばしば直面します。LLMがあれば、問題の診断にかかる時間を短縮することができ、結果的に効率を高めることができます。

このソリューション・アクセラレータでは、上記の項目(3)に焦点を当てます。これは、インタラクティブなコンテキスト認識Q/Aセッションの形で、フィールド・サービス・エンジニアを知識ベースで補強するユースケースです。メーカーが直面する課題は、独自のドキュメントからデータをどのように構築し、LLMに組み込むかということです。LLMをゼロからトレーニングするのは非常にコストのかかる作業で、数百万ドルどころか数十万ドルもかかります。

その代わりに、MosaicMLのMPT-7B や MPT-30のような事前にトレーニングされたLLMモデルを利用し、自社独自のデータでこれらのモデルを補強し、微調整することができます。これにより、コストは数百ドルとは言わないまでも、数十ドルにまで下がり、実質的に10000倍のコスト削減になります。ファインチューニングへの全経路を左から右へ、Q/Aクエリへの経路を右から左へ示したのが下の図1です。

Fine-tuning and using an LLM as a context-aware Q/A chatbot on proprietary domain-specific data.
Figure 1. Fine-tuning and using an LLM as a context-aware Q/A chatbot on proprietary domain-specific data.

このソリューション・アクセラレータでは、LLMはPDF文書の形で配布される一般に入手可能な化学物質のファクトシートに追加されます。このファクトシートは、任意の独自データと置き換えることができます。ファクトシートはエンベッディングに変換され、モデルのリトリーバとして使用されます。次に Langchain を使用してモデルをコンパイルし、Databricks MLflow上でホストします。デプロイメントには、GPU推論機能を備えたDatabricks Model Servingエンドポイントを使用します。

これらのアセットをダウンロード( downloading these assets here)することで、今すぐエンタープライズを強化することができます。なぜDatabricksがLLMの構築と配信に最適なプラットフォームなのか、Databricksの担当者にご相談ください。

ソリューションアクセラレータについてはこちらをご覧ください。

Databricks 無料トライアル

関連記事

Simplify and Accelerate IoT Data-Driven Innovation

Internet of Things (IoT) is the digital backbone of physical industry, connecting products, machines, devices, and people and becoming the bedrock for game-changing...

グレート・アンロック: 製造業における大規模言語モデル

May 30, 2023 Sam Steinyシヴ・トリサル による投稿 in
Original: The Great Unlock: Large Language Models in Manufacturing 翻訳: junichi.maruyama 製造業は、自動化を進め、オペレーションを可視化し、製品・技術開発を加速させるための新しい方法を常に模索しています。そのため、企業は常に深い技術的進歩の最前線にいることが求められます。製造業で最近見られる技術的進歩のひとつに、Generative AI、特にLarge Language Models(LLM)の利用があります。Generative AIは、既存のデータから認識したパターンに基づいて新しいユニークなデータを作成することができますが、LLMはさらに一歩進んで、複雑な情報を理解・整理し、人間のような対話を生成する能力を備えています。 製造業では、接続された車両、工場、建物、作業員によって生成される大量の複雑な非構造化データ(センサー、画像、ビデオ、テレメトリ、LiDARなど)が発生しますが、その多くは、データをリアルタイムでストリー

製造業向けレイクハウス

April 3, 2023 シヴ・トリサルSam SteinyBala Amavasai による投稿 in
Original Blog : The Lakehouse for Manufacturing 翻訳: junichi.maruyama あらゆる業界が、生成的AI、データ共有、生産性、予測分析といったトピックについてどう考えるかが問われています。しかし、これは製造業において特に何を意味するのでしょうか?なぜこのようなシフトが重要なのでしょうか?なぜ、未来がそれに左右されるのでしょうか? 製造業は、次のSKU、機械、自動車、飛行機といった主要な生産単位を効率的に提供するだけでなく、より高い成長性、より安定した収益源、外部ショックに対するより高い回復力といった、より高い拡張性を示すテクノロジー対応のビジネスを提供することに常に焦点を当て、ビジネスを再構築しています。 この業界は膨大な量のデータ(小売、メディア、金融サービスなどの業界の2~4倍)を生成し、このデータは今後5年間で200~500%と推定される指数関数的な速度で成長しています。この膨大なデータの増加は、コネクテッドワーカー、ビル、車両、工場から発せられる
業界一覧へ