Databricksアセットバンドルデモ

動画の内容

Databricksアセットバンドルは、データ、分析、MLプロジェクトをバンドルと呼ばれるソースファイルの集まりとして表現することを可能にします。バンドルのソースファイルは、プロジェクトのエンドツーエンドの定義として機能します。これらのソースファイルには、テストとデプロイの方法に関する情報が含まれています。このエンドツーエンドの定義により、ソースコントロール、コードレビュー、テスト、CI/CDなどのデータエンジニアリングのベストプラクティスを簡単に適用することができます。

バンドルには次の部分が含まれます:

  • ソースファイル、たとえばノートブックやPythonファイルには、ビジネスロジックが含まれています。

  • Databricksリソース、たとえばDatabricksジョブ、Delta Live Tablesパイプライン、Model Servingエンドポイント、MLflow実験、およびMLflow登録モデルなどの宣言と設定。

  • ユニットテストとインテグレーションテスト。

  • バンドルがデプロイされるワークスペースまたはワークスペースを定義する設定。