あなたのデータ品質をLakehouseモニタリングで監視します

動画の内容

Lakehouse Monitoringは、Databricksデータインテリジェンスプラットフォーム内で直接プロファイルを作成し、診断し、品質を強制することを容易にします。追加のツールや複雑さなしで、Lakehouse Monitoringはチームがダウンストリームプロセスに影響を与える前に品質問題を積極的に発見するのを支援します。

このチュートリアルを通じて、Unity Catalogの任意のテーブルにモニターを作成し、データのトレンドや異常についての洞察を得ることがいかに簡単かを確認できます。このチュートリアルでは、小売業のユースケースであるトランザクションデータの監視を示し、モニターの設定時のベストプラクティスを説明します。デモの最後には、次の品質問題/異常を発見するための自動生成ダッシュボードが提供されます:

  • データ量
  • データの整合性
  • 数値分布の変更
  • カテゴリカル分布の変更

Unity Catalogに組み込まれたLakehouse Monitoringを使用して、このデモでは、メタデータと統合された品質がどのようにルート原因分析と系統による影響分析を実行することを可能にするかを示します。

Lakehouse Monitoringについての詳細は、製品のドキュメンテーション(AWS | Azure)をご覧ください。今すぐ始めましょう。

 

デモをインストールするには、無料のDatabricksワークスペースを取得し、Pythonノートブックで以下の2つのコマンドを実行します

%pip dbdemosをインストールします
import dbdemos
dbdemos.install('lakehouse-monitoring', catalog='main', schema='dbdemos_lhm')をインストールします

Dbdemosは、Databricksのデモをワークスペースに完全にインストールするPythonライブラリです。Dbdemosはノートブック、Delta Live Tablesパイプライン、クラスター、Databricks SQLダッシュボード、およびウェアハウスモデルをロードして開始します... dbdemosの使い方を参照してください

 

DbdemosはGitHubプロジェクトとして配布されています。

詳細については、GitHubのREADME.mdファイルをご覧いただき、ドキュメンテーションに従ってください。
Dbdemosはそのまま提供されています。詳細については、
ライセンス通知をご覧ください。
Databricksは、dbdemosおよび関連資産に対して公式のサポートを提供していません。
問題が発生した場合は、チケットを開いてデモチームに最善の努力で対応してもらってください。