

Databricks SQL(DB SQL)は、マルチクラウドのレイクハウスアーキテクチャによって、従来のクラウド型データウェアハウスの性能と比較して最大 12 倍の価格性能を提供します。オープンソーススタンダードを基盤とすることでデータロックインを回避し、データレイクのみでは実現できなかった高信頼性、高品質、高性能をもたらします。
現行の BI ツールを利用したデータ分析
dbt、Fivetran、PowerBI、Tableau など、任意の BI ツールを利用できるため、別のデータウェアハウスにデータを移行する必要はありません。最新で完全なデータを BI ツールに取り込み、クエリや分析を実行できます。アナリストは、Databricks SQL の SQL エディタ、視覚化、ダッシュボード機能を利用して、新たな知見を迅速に抽出し、共有できます。
管理とガバナンスの簡素化
サーバーレスでストレージから分離した弾力性のある SQL のコンピュートを容易に設定できます。Databricks のインスタンスタイプや構成の自動設定機能により、最適な価格性能が実現します。また、エンドポイントの監視、クエリ履歴、詳細なガバナンスなどの機能を使用して、ユーザー、データ、リソースを管理できます。
データレイクのデータを高速にインプレース分析
データウェアハウスの性能とデータレイクの経済性の相乗効果により、レイクハウス上の SQL クエリ実行に競争優位性がもたらされます。Databricks SQL は、データレイクの信頼性、品質、スケーラビリティ、セキュリティ、性能を高め、最新の完全なデータを使用した従来の分析ワークロードを可能にします。

仕組み
現行のツールとの連携
dbt、PowerBI、Tableau など、任意の BI ツールからデータレイクに直接アクセスし、高速性、低レイテンシ、複数ユーザーの同時アクセスなどのメリットを享受できます。Delta Lake テーブルの接続は容易で、主要な認証ソリューションとの統合も可能です。ODBC/JDBC ドライバーの再設計により、低レイテンシ、低オーバーヘッドが実現し、ラウンドトリップを 0.25 秒短縮しました。また、データ転送速度 50% アップ、メタデータの検索処理は最大 10 倍高速化しています。
クエリ実行の価格性能を最大化
Databricks SQL には、あらゆるクエリタイプとリアルワールドのアプリケーションに対して最高のパフォーマンスを提供すべく、数千もの最適化機能が実装されています。これには、他のクラウドデータウェアハウスと比較して最大 12 倍の価格性能を実現した次世代クエリエンジンの Photon も含まれます。
レイクハウスのシンプルな管理とガバナンス
Databricks SQL に実装された仮想クラスタ、ユーザ、時間などの利用状況を記録する中央ログ機能により、SQL コンピューティングリソースの設定と管理を容易に行うことができます。この機能により、Databricks SQL、サードパーティの BI ツール、その他の SQL クライアントのワークロードを単一の場所で容易に観察できるようになり、エラーや性能の問題の解決に役立ちます。管理者は、各クエリの実行フェーズまで掘り下げてのトラブルシューティングや監査のサポートも可能です。
充実した SQL 開発機能
DB SQLクエリエディタにより、アナリストは使い慣れた構文(ANSI SQL)でクエリを作成し、レイクハウスで直接データを探索できます。視覚化機能が充実しており、最も効果的な方法でクエリ結果を表示できます。また、ダッシュボードを介して、分析結果を社内外のステークホルダーと容易に共有できます。
新たな気づきの発見と共有を迅速化
充実した視覚化機能は、アナリストがクエリの結果を理解するのに役立ち、直感的なドラッグ&ドロップインターフェースにより、視覚化された分析結果をダッシュボード上にすぐに表示できます。ダッシュボードの自動更新および、重要な変更についてのアラートの設定がサポートされており、組織内外の関係者間で常に最新の情報を共有できます。
ユースケース
レイクハウスのインフラを有効化
マルチクラウドのレイクハウスアーキテクチャの運用により、データウェアハウスの性能とデータレイクの経済性を同時に実現します。Databricks SQL では、アナリストやデータサイエンティストが選択した任意のツール、最新で完全なデータを使用して、データレイク上で SQL クエリや BI による分析を直接実行できます。また、システムを分散する必要がなくなり、アーキテクチャを大幅にシンプルにします。
既存の BI ツールとの連携
PowerBI や Tableau など、現在利用中の BI ツールを利用して、データレイクで直接クエリできるため、データサイロを回避できます。再設計、最適化されたコネクタが、データレイクに高速性と低レイテンシ、複数ユーザーの同時アクセスを実現します。これにより、アナリストは、あらゆるデータに対して単一のデータソースで分析に最適なツールを使用できるようになります。
最新のデータを共同で探索
コラボレーション可能でセルフサービスのエクスペリエンスをアナリストや SQL のエキスパートに提供し、新たな知見の迅速な抽出と共有を可能にします。詳細なガバナンスにより、データのアクセス権限を確実に管理でき、クエリの共有・再利用が可能です。また、インタラクティブな視覚化機能により、分析結果を迅速に共有できるダッシュボードを作成します。
カスタムデータアプリを構築
リッチなデータ駆動型カスタムアプリを構築できます。Databricks SQL は、管理が容易で接続性が高く、価格性能が優れており、データレイクを使用するデータ駆動型アプリの大規模な開発をシンプルにします。
統合
モダンデータスタックとのシームレスな統合により、データチームに高い柔軟性がもたらされます。レガシーデータウェアハウスにデータを移動させることなく、Fivetran でビジネスクリティカルなデータを取り込み、dbt を使用してインプレースで変換し、Power BI、Tableau、Looker で知見を抽出できます。
Tableau、PowerBI、Looker、Fivetran、dbt など、任意のツールを Databricks に容易に接続できます。
「高速性と俊敏性を兼ね備えたデータ戦略が、これまで以上に重要になっています。多くの組織がデータのクラウド移行を急速に進めるなか、データレイク上でアナリティクスを行うことへの関心が高まっています。
Databricks SQL の優れた性能、信頼性、スケーラビリティは、膨大なデータから知見を得るための一連のエクスペリエンスを変革します。Databricks とのパートナーシップを通じて、新しいデータ戦略を実行できることを大変うれしく思います。」
Tableau CPO フランソワ・アジェンスタッド(Francois Ajenstat)氏
導入事例
ダン・ジーボンズ氏は、シェル社でのデータブリックスの活用について、次のように述べています。
「Shell.ai プラットフォームの基盤要素の 1 つとしてデータブリックスを選択しました。私たちは、よりクリーンなエネルギーソリューションを提供するという目標の一環として、デジタル変革を進めており、データレイクアーキテクチャに対して積極的に投資してきました。膨大なデータセットに対するクエリを、シンプルな方法で迅速に実行できるようにする必要がありました。ペタバイト規模のデータセットに対して、標準的な BI ツールを使用して迅速なクエリを実行できることは、私たちにとってのゲームチェンジャーとなります。データブリックスとの共同開発アプローチにより、製品ロードマップに影響を与えることが可能となるこの製品が市場に出てくるのを楽しみにしています。」
シェル社 データサイエンス部門ゼネラルマネージャー
ダン・ジーボンズ氏
「Atlassian では、常に進化し続ける目標を達成するために、チームが機能を超えてうまくコラボレーションできるようにする必要があります。簡素化されたレイクハウスアーキテクチャは、大量のユーザーデータをインジェストし、顧客のニーズをより良く予測し、顧客体験を向上させるために必要な分析を実行することを可能にします。使いやすい単一のクラウドアナリティクスプラットフォームにより、迅速に改善し、実用的な洞察に基づいた新しいコラボレーションツールを構築することができます。」
Atlassian 社:
データプラットフォームシニアマネージャー、ローハン・デュペリア氏
「Snowflake から Databricks のレイクハウスに移行したことで、完全で最新のデータに基づく意思決定が可能になりました。これまでのデータウェアハウスでは不可能だったことです。」
ブレッド社 スタッフデータエンジニア
Christina Taylor 氏
「Databricks のレイクハウスの導入により、あらゆるデータを大規模に活用できるようになりました。メール攻撃の検知やブロックのための分析を強化することで、従来の防御策では回避できなかったソーシャルエンジニアリングの標的型メール攻撃にも対応しています。」
アブノーマル・セキュリティ社 データサイエンス責任者
Sanny Liao 氏
「Databricks のレイクハウスプラットフォームにより、視聴者行動の分析結果を得るまでの時間が数週間から数分に短縮され、リスナーの共感を得られるプログラムを迅速に提供できるようになりました。」
CBC ラジオカナダ BI 部門シニアディレクター
Stephane Caron 氏