インフォマティカとの連携により、データパイプラインの開発とデータガバナンスの確保を効率化

Databricks + Informatica 連携のメリット

 

Delta Lake にデータを直接取り込む

インフォマティカのBig Data Management(BDM)のドラック&ドロップインターフェースを使用することで、Delta Lakeの大容量パイプライン処理が高速化します。

分析の価値創出までの時間を短縮

Delta Lake の ACID トランザクション、スキーマエンフォースメント、その他のファイル拡張機能を利用することで、信頼性の高いデータセットを開発できます。

分析と機械学習のデータリネージを検証

インフォマティカのエンタープライズデータカタログ(EDC)統合を使用して、Delta Lake からモデルトレーニングに最適なデータセットを検索できます。

「Informatica World 2019」にデータブリックスの
CEOアリ・ゴディシが登壇

オープニング基調講演に登壇し、インフォマティカのCEOと共に「Informatica World 2019」をキックオフ。

仕組み

コーディング不要のデータパイプライン構築

インフォマティカのデータエンジニアリング統合(DEI)とデータブリックスの統合データ分析プラットフォームを組み合わせることで、データチームは最適化されたApache Spark™を使用してスケーラブルなパイプラインを構築できます。

SparkジョブのプッシュダウンとDelta Lakeによる信頼性の提供

Delta Lakeは、分析や機械学習プロジェクトのためのデータセットとデータパイプラインの拡張に高い性能を発揮し、信頼性をもたらします。分析モデルを素早くプロビジョニングすることで、データ管理を高速化し、俊敏性を実現します。

分析に最適なデータセットの検索

インフォマティカのエンタープライズデータカタログ(EDC)とデータブリックスの統合で、組織のデータガバナンスのプロセスを自動化します。Deltaテーブルでのデータリネージ追跡のために、データの起源をトレースします。

ユースケース

不正の検知

データアクセスを高速化し、不正トランザクションのリアルタイム検知を可能にします。

ヘルスケアエクスペリエンスの改善

テクノロジースタックの最新化により、患者や医師のエクスペリエンスが向上します。

機密データセットの
リネージ検証

カタログ管理を自動化し、モデリングのためのデータの信頼性を向上させます。

無料お試し・その他のご相談を承っております

Databricks アカウントを
お持ちの場合

ご相談・お問い合わせ

Databricks アカウントを
お持ちでない場合

無料アカウントを登録

クイックスタートガイドへ