メインコンテンツへジャンプ

クロスプラットフォームにおけるビューの共有がパブリックプレビューに なりました🚀

データを柔軟かつ簡単に共有!きめ細かいアクセス制御で、あらゆる相手に安全に届けます
Share this post

Summary

  • クロスプラットフォームビュー共有により、データプロバイダは異なるプラットフォーム、クラウド、および地域間でビューを共有することができます。
  • この機能は、安全でシームレスなデータ交換を可能にするオープンで相互運用可能なデータエコシステムを推進します。
  • ユーザーは、Apache Spark、Pandas、Power BI、Tableauなどのオープンクライアントを使用して、Databricks上でなくてもDelta Sharingを介して共有ビューにアクセスし、クエリを実行することができます。

Generated by AI

クロスプラットフォームにおけるビューの共有のパブリックプレビューを発表できることを嬉しく思います。

本日より利用可能なこの機能により、データプロバイダーは異なるプラットフォーム、クラウド、リージョン間でビューを共有できるようになり、オープンで相互運用可能なデータエコシステムを促進します。

ビュー共有はこれまでも便利な機能として利用されてきましたが、他のベンダーが提供する機能は同一プラットフォーム内に限定されることがほとんどでした。つまり、1つのプラットフォーム内でビューを共有することはできても、複数のプラットフォームやクラウド間での共有はできませんでした。この課題を解決するのが、Databricksのクロスプラットフォームビュー共有です。この機能を使用することで、異なる環境間でビューをシームレスに共有できるようになります。これは、データプロバイダーの影響範囲を広げるだけでなく、データ消費者にとってのベンダーロックインを回避し、コラボレーションをより簡単かつ迅速にする画期的な進化です。

クロスプラットフォーム共有は、異なるプラットフォーム、クラウド、リージョン間で安全かつシームレスなデータ交換を可能にすることで、Databricksのオープンな共有ビジョンと完全に一致しています。

ビュー共有の理解

ビュー共有を理解するために、まずビューについて説明しましょう。Databricksでは、ビューとはテーブルや他のビューから作成されたデータの読み取り専用の表現を指します。ビューにはクエリのテキストが保存されますが、データそのものは保存されません。ビューはUnity Catalogの一部です。

ビュー共有は、Delta Sharingプロトコルを使用してビューを共有できる機能です。Delta Sharingは、安全なデータ共有を実現する業界初のオープンプロトコルであり、使用するデータプラットフォームに関係なく、他の組織と簡単にデータを共有できます。ビュー共有は再利用性を促進し、冗長性を削減します。複数のユーザーが同じビューにアクセスして利用できるため、分析が効率的に行えるようになります。

クロスプラットフォームビュー共有
Cross Platform View Sharing

これまでは、Databricksアカウント間でビューを共有する場合、消費者はDatabricks Serverless SQLを使用してのみクエリを実行できました。Databricks Serverless SQLは、AWS、Azure、Google Cloud Platform (GCP) の3大クラウドプロバイダーすべてで動作するため、ビューをクラウド間で共有することが可能でした。

しかし、現在のクロスプラットフォームビュー共有では、データ消費者は任意のタイプのDatabricksクラスターを活用するだけでなく、オープンなDelta Sharingクライアントを使用して共有ビューにアクセスしてクエリを実行できるようになりました。
オープンDelta Sharingクライアントとは、Delta Sharingプロトコルをサポートするツールやプラットフォームを指し、Databricksを使用せずに共有ビューにアクセスできるものです。これには、Apache Spark™、Pandas、Power BI、Tableauなどの一般的なシステムが含まれます。この仕組みにより、Databricksを使用していないプラットフォームのユーザーでも、Delta Sharingを介して共有ビューにアクセスしてクエリを実行することが可能になります。

それでは、クロスプラットフォームビュー共有の実際の動作をデモでご覧ください!

 

 

ユースケース

DatabricksからDatabricksへの共有(D2D)

このシナリオでは、Databricksの顧客2社が、Databricksエコシステム内でシームレスにビューを共有できます。なぜこれが重要なのでしょうか?
企業は異なるクラウドや地域にいるパートナーと協力することが多く、クラウドや地域をまたいでビューをクライアントやパートナーと共有したいと考えています。Delta Sharingテクノロジーを活用することで、データを重複コピーすることなく、ビューをシームレスかつ安全に共有できます。

Databricks to Open (D2O) 共有

このシナリオでは、Databricksの顧客がDatabricksを使用していない外部受信者とビューを共有できます。クロスプラットフォームビュー共有は、Apache Spark™、Pandas、Power BI、Tableauなどのオープンコネクタをサポートし、受信者がDelta Sharingプロトコルを介して共有ビューにアクセスできるようにします。この機能は、複雑なデータプラットフォームに直接触れることなく、データに簡単にアクセスする必要があるビジネスアナリストや業務ユーザーにとって特に有益です。

Databricksマーケットプレイスのデータプロバイダーは、クロスプラットフォームビュー共有を活用することで、市場リーチと収益化の機会を大幅に拡大できます。この機能により、Databricksを使用していないクライアントを含む、より広いオーディエンスとビューを共有でき、潜在的な顧客基盤を増やすことが可能になります。
さらに、データ消費者はDatabricksプラットフォームに制限されることなくビューをクエリできるため、Databricksへのロックインを回避できます。

 

クロスプラットフォームビュー共有は、私たちの顧客にとってゲームチェンジャーです。複雑な企業で大規模にゼロコピーのデータ共有を実現するには柔軟性が必要です。プラットフォーム間でビューを共有する能力により、Delta Sharingのセキュリティとパフォーマンスの利点をより多くの顧客に提供することができ、彼らが顧客データからの価値をより早く解放するのを助けます
— デレク・スレイガー、AmperityのCTO兼共同創設者

これからの展望

今後数ヶ月で、Databricksはさらに高度なデータ共有機能を導入する予定です。これには、さまざまなプラットフォーム(例:Amazon Redshift、Azure Synapse、Google BigQuery、Snowflake)からデータを複製することなく直接共有できるLakehouse Federationの共有が含まれます。

さらに、D2O OAuthサポートにより、受信者が信頼できるIDプロバイダー(IdP)のOAuthトークンを使用して認証することで、セキュリティが強化されます。加えて、マテリアライズドビューとDelta Live Tablesの共有により、事前計算されたクエリ結果やストリーミングデータの効率的な配信が可能になり、新鮮なデータをより良いパフォーマンスと低コストで提供できます。

次のステップ

クロスプラットフォームビュー共有は、現在AWS、GCP、Azureの顧客向けにパブリックプレビューとして利用可能です。Unity Catalogが有効になっているDatabricksワークスペースから、任意のコンピューティングプラットフォーム上のユーザーとデータを共有する方法について詳しく学びましょう。

Databricks 無料トライアル

関連記事

Data + AI Summit 2024:データ共有とコラボレーションの最新情報

Translation Review by saki.kitaoka Databricksでは、データとAIの民主化をミッションとしています。オープンなアプローチによる共有とコラボレーションは、そのリーチとインパクトを最大化するために重要です。当社のデータインテリジェンスプラットフォーム内では Delta Sharing オープンプロトコルが顧客のデータとAI資産の共有を簡単かつ安全にし、イノベーションを加速させます。サードパーティデータとのコラボレーションには、 Databricks Marketplace がすべてのデータ、分析、AIのニーズに対応するオープンマーケットプレイスを提供します。データパートナーのエコシステムが拡大する中で、さまざまなデータとAI資産を共有し、データ消費者がイノベーションを実現できるようにします。 Databricks Clean Rooms は、ビジネスがどのクラウド上でも安全な環境で簡単にコラボレーションできるプライバシー保護されたコラボレーションを提供します。先週、Delta

Delta Sharingで実現する安全なエンドツーエンドのコラボレーション

Reviewed by saki.kitaoka 現代のデジタル環境において、セキュアなデータ共有は運用効率とイノベーションに不可欠です。DatabricksとLinux Foundationは、データ、分析、AI全体でのデータ共有に対する初のオープンソースアプローチとして Delta Sharing を開発しました。Databricksは、安全なデータ交換を提供し、プラットフォーム、クラウド、地域をまたいだシームレスな共有を促進します。あらゆる規模の企業が、幅広いアプリケーションと多様なデータ形式をサポートするDelta Sharingを信頼しています。この柔軟性により、データ資産の可能性を最大限に引き出そうとする組織にとって信頼できるツールとなります。 本ブログでは、Databricks Delta Sharingのセキュリティアーキテクチャを、 Databricks顧客間共有(D2D) 、 Databricks顧客からオープン共有(D2O) 、クロスクラウドデータ共有の3つの異なる共有シナリオを通じて検討し

Databricksプライベートエクスチェンジでデータ共有の可能性を解き放とう!

Databricksマーケットプレイスに、新しいエキサイティングな機能が追加され、すべてのDatabricksユーザーがプライベートエクスチェンジを簡単に設定できるようになりました。この機能により、プライベートエクスチェンジプロバイダーになることがこれまで以上に簡単になります。 このブログ投稿では、Databricksマーケットプレイスのプライベートエクスチェンジ機能について深く掘り下げて解説します。さまざまなエクスチェンジメカニズム(パブリックマーケットプレイスとプライベートエクスチェンジ)を比較し、プライベートエクスチェンジプロバイダーになるプロセスを簡素化する新機能を詳しく見ていきます。 プライベートエクスチェンジとパブリックマーケットプレイスの比較 データ共有と収益化の進化する分野において、企業はデータやAIモデルを配布するための複数の方法を持っています。それぞれの方法は異なる利点を提供し、さまざまな戦略的ニーズに対応します。以下に、パブリックマーケットプレイスとプライベートエクスチェンジの2つのシナリオ

AIモデル共有のGAを発表

このブログへの貴重な洞察と貢献に対して、Daniel Benito(CTO、Bitext)、Antonio Valderrabanos(CEO、Bitext)、Chen Wang(リードソリューションアーキテクト、AI21 Labs)、Robbin Jang(アライアンスマネージャー、AI21 Labs)、Alex Godfrey(パートナーマーケティングリード、AI21 Labs)に特別な感謝を述べます。 Databricks Delta SharingとDatabricksマーケットプレイス内のAIモデル共有の一般提供をお知らせすることをうれしく思います。このマイルストーンは、 2024年1月のパブリックプレビュー発表 に続いています。Public Previewのローンチ以来、我々は新たなAIモデル共有の顧客やプロバイダー、例えば Bitext 、 AI21 Labs 、Rippleと共に、AIモデル共有をさらにシンプルにするために取り組んできました。 Delta Sharingを使用して、AIモデルを簡単
プラットフォームブログ一覧へ