データレイクの信頼性と性能を高める
既存のデータレイクの信頼性とスケーラビリティを改善。
オープンソースのトランザクションストレージ層がデータライフサイクル全般をサポート。
Delta Lake について詳しく見る
自動スケーリング可能なインフラにおけるシンプルなデータ処理。
高度に最適化された Apache Spark™ で最大 50 倍の性能向上。
Apache Spark について詳しく見る
データサイエンスと機械学習ライフサイクルにおけるコラボレーション
データの完全性と最新性を高めて気づきを促進
SQL ワークロードをデータレイクで直接実行。最新のデータを使ったクエリと分析が可能です。従来のクラウドデータウェアハウスと比べて最大 9 倍の価格性能を提供します。
クエリ結果を迅速かつ容易に視覚化し、豊富な機能を持つダッシュボードに表示。重要な変化を知らせる自動アラート機能も装備。新たな気づきをタイムリーに共有できます。
Tableau や Microsoft Power BI など、主要な BI ツールを利用できます。最適化された統合コネクタが、データレイクに高速性と低レイテンシ、複数ユーザーの同時アクセスでも変わらない高スループットをもたらします。
マシン数百万台が常時稼働するマルチクラウドプラットフォームを
セキュアでスケーラブルに
高度な監査証跡機能が、ユーザーによる適切なデータアクセスを確実にします。既存のクラウドセキュリティポリシーと ID 管理システムを使用して、ワークスペースのコンプライアンス、プライバシー、独立性を確保できます。
プラットフォームセキュリティについて詳しく見る
あらゆるプロジェクトの共有ワークスペースを迅速にスピンアップ/スピンダウン。ユーザーアクセスの管理、使用状況の監視、アクティビティの分析など、多面的な運用管理を可能にするツールを備え、かつ、ユーザー/データガバナンスをシームレスに維持します。
多面的な管理について詳しく見る
構成済みデータ環境と API が、開発から実稼働までを迅速化します。本番環境では、オンデマンドの自動スケーリングが性能を最適化。さらに、リソースと需要を効率よく調整することで、データパイプラインや ML モデルのダウンタイムを短縮します。
スケーラビリティについて詳しく見る
単一のプラットフォームと各クラウドをセキュアに統合し、データ分析や ML の実行を容易にします。クラウド環境専用のツールやプロセスを新たに学ぶ手間は不要です。
Microsoft Azure への展開について詳しく見る
AWS への展開について詳しく見る
この講演では、コムキャストのフォーサイス氏とニューマン氏が登壇し、Databricks の統合分析プラットフォーム上に構築された Comcast のデータ・ML インフラストラクチャについて解説しています。コムキャストでは、Databricks を導入し、製品開発の中核を担う ML モデルのトレーニングと強化を行い、ユーザーがどのように製品を使用しているかについての深い洞察を取得しています。