Databricks による Deep Learning

複雑なデータには大きなチャンスが埋もれています

データ量が増大し複雑化する中、処理能力の向上と高度なグラフィック処理機能が求められています。Deep Learning はビッグデータの予測分析ソリューションとして理想的な手法です。

Deep Learning によって、組織は画像、テキスト、音声などの非構造化データを活用し、AI、画像解釈、自動翻訳、自然言語処理などによる革新的なユースケースを実現できます。

一般的なユースケース

画像の分類
画像を認識/分類して、ソートを容易にし、検索の精度を高めます。
オブジェクト検出
すばやくオブジェクトを検出し、自律走行車や顔認識を実現します。
自然言語処理
話し言葉を正確に理解して、音声のテキスト化やホームオートメーションなどの新しいツールを強化します。

Deep Learning の課題

Big Data と AI には大きな可能性がありますが、Big Data から実用的な洞察を引き出す作業は、通常のタスクでありません。急速に増大している大量の情報が、非構造化データ(画像、音声、テキストなど)の中に隠れていおり、高度な技術と複合的なチーム(データエンジニアリング、Data Science、ビジネス)の緊密なコラボレーションを必要としています。

まとまりのない技術
急勾配の学習曲線を持つ低レベルAPI を提供する個別のフレームワークおよびツール(TensorFlow、Keras、PyTorch、MXNet、Caffe、CNTK、Theano)に依存
高価なインフラストラクチャ
Deep Learning をサポートするインフラストラクチャを実現するには、膨大かつ高価なリソースと高い計算能力が必要
Data Science の複雑さ
正確な Deep Learning モデルのトレーニングはデータサイエンティストが手動で集中的に実施することになり、多くの場合、データのラベル付けとパラメータの調整が必要

Deep Learning の民主化

Apache Spark™を搭載したDatabricks 統合分析プラットフォーム を使用することで、高性能かつスケーラブルな、信頼性の高い Deep Learning パイプラインを構築することができ、データサイエンティストは Deep Learning アプリケーションの構築、トレーニング、およびデプロイを簡単に実施できます。

統合されたインフラストラクチャ
フルマネージド型のサーバーレス クラウド インフラストラクチャにより、分離、コスト管理、弾力性が実現します。インタラクティブな環境で、TensorFlow、Keras、PyTorch、MXNet、Caffe、CNTK、Theano などの主要なフレームワークを使って簡単に作業することができます。
エンドツーエンドのワークフロー
単一のプラットフォームでデータ準備、調査、モデルトレーニング、および大規模な予測を処理します。高レベルAPI とサンプルアプリケーションを使用して、最先端のモデルを簡単に活用できます。
最適化されたパフォーマンス
Apache Sparkを搭載し、高性能な GPU ハードウェア上で大規模に動作するように構築された、ハイパフォーマンスの Databricks ランタイムを提供します。
インタラクティブな Data Science
複数のプログラミング言語でチームと協力してデータを調査し、リアルタイムのデータセットに対して Deep Learning モデルをトレーニングします。

お客様の利用事例

Hotels.com は画像を分類してエンゲージメントとコンバージョン率を改善し、すべてのデータセットをモデル化しながらも、処理能力は 20 倍向上しています。ビデオ

Giphy は Databricks を使用して、数千万の GIF に対するさまざまな画像プロパティ(シーン、ラベル、色など)を把握し、優れた検索結果と推奨事項を提供しています。

Voicebox は自然言語処理を活用して人間の会話のコンテキストを特定し、音声制御デバイスやパーソナルアシスタントなどの、スマートな AI アプリケーションを実現しています。

Riot Games は、Databricks を使って実際のゲームプレイ内の悪口雑言をリアルタイムで理解/検出し、顧客満足度、顧客保持、および顧客の生涯価値の向上に役立てています。ビデオ

無料お試し・その他のご相談を承っております