データと AI によるスケーラブルな産業用 IoT ソリューション

本ブログ記事は、Databricks の Bala Amavasai と、Databricks のコンサルティングパートナーである Tredence 社による共同投稿です。Tredence 社インダストリーソリューション担当ディレクター Vamsi Krishna Bhupasamudram 氏、および IoT 担当シニアアーキテクト Ashwin Voorakkara 氏のご協力に感謝します。

製造・流通業界における今日の目覚しい発展は、データとコネクティビティにより実現されています。エッジから AI へのデータジャーニーにおいて最初のステップとなる産業用 IoT(IIoT)は、デジタルトランスフォーメーションの中核となります。

IIoT テクノロジースタックの重要性と成長性は、いまや軽視できなくなっています。複数の主要な調査会社によれば、IIoT は 2027年にかけて 16% を超える CAGR で成長し、市場規模は世界全体で 2,630億ドルに達すると予想されています。多くのプロセスがこの成長を後押ししています。例えば次のものがあります。
 ・自動化、プロセスの最適化、M2M 通信に特化したネットワーキング
 ・ビッグデータ分析と機械学習(ML)を用いた品質管理
 ・航空宇宙、自動車、エネルギー、ヘルスケア、製造、小売業界にメリットをもたらすスループットと可用性の向上
センサーからのリアルタイムデータは、産業用エッジデバイスやエンタープライズインフラによるリアルタイムの意思決定を支援し、その結果、よりよい製品の製造、アジャイルな生産インフラの構築、サプライチェーンのリスクの軽減、市場投入の迅速化が可能になります。

IIoT アプリケーションは、より広範な業界における X.0 パラダイムの一部として、エンタープライズ情報システム、業務プロセス、およびビジネス運営の中心となる人々に「コネクテッド」な産業用アセットをもたらします。これらの「モノ」やその他の業務データの上に構築された AI ソリューションは、新たなリアルタイムの知見やインテリジェンス、最適化を促進します。これにより、先進的なリーダーは迅速な意思決定ができ、変革をもたらすビジネス成果と社会的価値の提供を可能にします。データが新しい燃料であるように、AI は IIoT 主導の変革を推進する新しいエンジンです。

製造現場や車両からのセンサーデータを活用することで、複数の利点が得られます。クラウドベースソリューションの利活用は、効率を高め、計画を改善するための鍵となります。ユースケースとして、次の 5 つが挙げられます。

  1. 予知保全:工場全体の保守コストを 40% 削減
  2. 品質管理と検査:組立製造業の製造品質を最大 35% 向上
  3. 遠隔監視:労働者の健康と安全を確保
  4. アセットのモニタリング:石油・ガス業界でのエネルギー使用量を 4 〜 10% 削減
  5. フリート管理:推奨する貨物配送ルートの提案を 100% 高速化

IIoT ソリューションを活用する

インダストリー 4.0 のソリューションから最大限の価値を引き出すためには、早い段階での正しい選択がカギとなります。製造業では、非構造化データを統合すると同時に、IIoT によって生成された膨大な量のデータを高速に処理できるデータ分析プラットフォームが欠かせません。インダストリー 4.0 の取り組みの目標を達成するには、十分な実績のあるテクノロジーを利用して慎重に設計されたプラットフォームが必要であり、テクノロジーの採択に際しては、導入状況および運用管理を含めたテクノロジーの成熟度が重要な検討項目となります。

データアーキテクチャに関しては、次のような要件を明らかにし、各要件に対応しなければなりません。

  1. 正確な予測やスケジューリングを行うためには、どれくらいの量のデータを収集すべきか。
  2. どれくらいの期間の履歴データを収集・保存する必要があるか。
  3. どれくらいの数のデバイスが、どのような頻度でデータを生成しているか。
  4. 社内および社外のパートナーとの間でデータを共有する必要はあるか。
簡素化された産業用 IoT のデータレイヤーアーキテクチャ
図 1:簡素化された産業用 IoT のデータレイヤーアーキテクチャ

図 1 が表す自動化ピラミッドは、一般的な製造業におけるさまざまな IT/OT(オペレーショナルテクノロジー)システムレイヤーをまとめたものです。データの粒度はレイヤーによって異なります。通常、ピラミッドの最下層では、最大量のデータをストリーミング形式で処理します。ピラミッドの最上層にある分析と機械学習は、主にバッチコンピューティングに依存しています。

自社の取り組みに適したプラットフォームを設計・開発するために留意すべき主要な課題と検討事項を以下に示します。

課題 必要なケイパビリティ
膨大なデータ量とデータ生成の処理速度 ストリーミング IoT デバイスから取得された高速で詳細なデータを、確実かつコスト効率よくキャプチャして保存する。
OT レイヤーでのデータ抽出に必要な複数の独自プロトコル    データを複数のプロトコルから MQTT や OPC UA といった標準プロトコルに変換する。
データ処理ニーズの複雑化 低レイテンシでの時系列データの行列化、集約、およびマイニングができる。
ML ユースケースのためのキュレーテッドデータレイクの実現 高度な AI/ML アプリケーション向けの処理性能が高く柔軟なコンピューティングができる。
スケーラブルな IoT エッジ互換の ML 開発 詳細な過去データに対して予測モデルを共同でトレーニングし、デプロイする。「ML-IoT Ops」アプローチを通じて、データとモデルのパイプラインを合理化する。
エッジ ML、インサイト & アクションオーケストレーション リアルタイムの洞察と自律的に連携するオーケストレーションができる。
効率的なエッジの実装 データエンジニアリングパイプライン、ML パイプラインを比較的小さなフォームファクタのデバイスで本番展開する。
セキュリティとガバナンス さまざまなレイヤーのデータガバナンスの実装。バリューチェーン全体の脅威モデリング。

プラットフォームとテクノロジーの選択に関係なく、連携を必要とする基本的な構成要素があり、アーキテクチャがシームレスに機能するためには、これらの構成要素を考慮しなくてはなりません。

一般的な製造業における IIoT アーキテクチャの機能図
図 2:一般的な製造業における IIoT アーキテクチャの機能図

図 3 は、Databricks を活用した場合のアグノスティックな技術アーキテクチャです。Databricks の機能は多くのニーズに対応していますが、IIoT ソリューションは「孤立した島」ではなく、さまざまなサポートサービスやソリューションとの連携が必要です。このアーキテクチャは、そういった追加コンポーネントを統合するポイントと方法に関するガイダンスも提供しています。

Databricks を活用した場合の IIoT アーキテクチャ
図 3:Databricks を活用した場合の IIoT アーキテクチャ

従来の IT ベースのデータアーキテクチャとは異なり、製造業における IIoT では、ハードウェアとソフトウェアの間に OT アーキテクチャを必要とする交差点があります。OT はプロセスや物理的なマシンと向き合う必要があります。アーキテクチャの各コンポーネントは、産業用オペレーションを扱う際の特定のニーズや課題に対処するように設計されています。図 3 内の番号は、アーキテクチャ全体のデータジャーニーを表しています。

1 — 複数の OT プロトコルに接続し、機器からスケーラブルに IoT データを取り込んでストリーミングする。センサーや PLC/SCADAなど、データ量の多い OT デバイスからクラウドデータプラットフォームへの取り込みを効率化。
2 — バッチモードによるエンタープライズデータとマスターデータの取り込み。
3、11 — ニアリアルタイムのインサイト配信を可能にする。
4 —データ取り込みのために未加工のデータレイクを調整。
5、6 — データを処理、標準化して異常を取り除き、Delta Lake に保存するデータエンジニアリングパイプラインを開発。
7 — データサイエンティストがキュレートされたデータベースで ML モデルを構築できるようにする。
8、9、10 — 本番環境に対応した ML モデルをコンテナ化してエッジにデプロイし、エッジ分析を可能にする。
12、13 — 集約されたデータベースは、フォーマットされた知見や、任意の形式で活用可能なリアルタイムなバッチ処理を提供。
14 — CI/CD パイプラインによるデータエンジニアリングパイプラインとエッジ上にある ML モデルのデプロイの自動化。

Databricks のアーキテクチャを採用すべき 6 つの理由

スケーラブルな IIoT アーキテクチャの構築に役立つシンプルな知見をご紹介します。

  1. 単一のエッジプラットフォーム無数のタグをストリーミングする複数の OT プロトコルに接続してデータを取り込む必要があります。
  2. レイクハウスアーキテクチャにより、ニアリアルタイムでストリーミングを価値ある洞察に変換し、膨大な量のデータデータエンジニアリングクラスタでバッチ処理します。
  3. 汎用クラスタML ワークロードを膨大な量のデータで実行可能にします。
  4. MLflow は、モデルアーティファクトをコンテナ化するのに役立ちます。モデルアーティファクトは、リアルタイムの知見を得るためにエッジにデプロイできます。
  5. レイクハウスアーキテクチャの肝である Delta Lake はオープンソースであり、オープンスタンダードに準拠しているため、ロックインを発生させることなくソフトウェアコンポーネントの互換性を向上させます。
  6. すぐにご利用いただける AI Notebook とアクセラレータ が準備されています。

IIoT ソリューションにレイクハウスを活用すべき理由

製造業における利活用シナリオでは、複数のゲートウェイデバイスにデータを供給する複数のセンサーがあり、データは継続的にストレージに到達する必要があります。このシナリオに関連する問題は、次のとおりです。

  1. ボリューム:システム内のデータプロデューサーの数により、保存されるデータ量が急増する可能性があり、コストが課題になり得ます。
  2. 速度:通常の製造現場において数十のゲートウェイに接続された数百のセンサーは、容易に障害をもたらし得ます。
  3. 多様性:製造現場からのデータは、必ずしも構造化された形式で提供されるとは限らず、半構造化または非構造化データも存在します。

Databricks のレイクハウスプラットフォームは、膨大なストリーミングデータの管理に最適です。Delta Lake を基盤として構築されているため、複数のセンサーやデバイスから小さなロットで配信される大量のデータストリームを処理できます。ACID コンプライアンスを提供し、従来のウェアハウスアーキテクチャよりもジョブの失敗を排除します。レイクハウスプラットフォームは、膨大なデータに対応できるように設計されています。

製造業では、一般的に半構造化(JSON、XML、MQTT など)、または非構造化(ビデオ、オーディオ、PDF など)で構成される複数のデータ型が生成されます。これら全てのデータ型を単一のプラットフォームにマージすることにより、信頼できる唯一の情報源を構築し、より正確な結果が得られます。

レイクハウスのデータ管理機能に加えて、データチームは、データのコピーを作成することなく分析と ML を直接実行できるため、精度と効率を改善できます。レイクハウスでは、ストレージがコンピューティングから切り離されているため、同時接続のユーザー数やデータ量の拡張も可能です。

まとめ

IIoT システム上に構築されたソリューションに投資した製造業者は、コストと生産性の大幅な最適化だけでなく、収益の増加も享受しています。多数のソースからのデータ統合は、製造業における継続的な課題です。価値主導の成果を実現するための核となるのは、コストの大幅な増加に屈することなく、産業データの量と速度に対応して拡張できる適切なアーキテクチャに投資することです。Databricks と Tredence は、レイクハウスアーキテクチャが大きなイネーブラーであると信じています。今後のブログでは、このコアアーキテクチャを基に、産業ビッグデータの「リポジトリ」内に構築された有意義なデータ分析と AI 主導の分析の実行によりもたらされる価値についてご紹介する予定です。Databricks のソリューションをご覧ください。

Databricks 無料トライアル 使ってみる

ご登録