メインコンテンツへジャンプ

プライバシー保護されたコラボレーションを実現する Databricks Clean Rooms がパブリック プレビューに登場

機密データを保持しながら、クラウドや業界全体でデータと AI をシームレスに活用
Share this post

イノベーションのための外部データと AI の急激な増加に後押しされ、あらゆる業界の組織が、プライバシーを守りながらパートナーと連携する効果的な方法を模索しています。 一部の組織ではコラボレーション ソリューションが限られており、データがどのように使用されるかについての可視性がほとんどまたはまったくない状態で、機密データの共有方法に関する制御を放棄する必要があることがよくあります。 これにより、データの誤用やデータプライバシーの侵害の可能性が高まる大きなリスクが生じます。

組織は、オープンで柔軟でありながらプライバシーが保護された方法でデータに共同作業を行い、AI を実行する必要があります。Databricks Clean Rooms は、これらの重要なニーズを満たします。 今年のData + AI Summit で最近発表したように、Clean Rooms は AWS と Azure でパブリック プレビュー中です (プレビューへのアクセスはこちらからリクエストできます)。 Clean Rooms はDelta Sharingを搭載しており、プライバシーを侵害したり機密データを共有したりすることなく、企業があらゆるクラウド上で顧客やパートナーと簡単に共同作業できるようにします。 クリーン ルームの参加者は、既存のデータを安全に共有および結合し、ML のネイティブ サポートを提供する Python などの任意の言語を使用して複雑なワークロードを実行できます。 クリーンルームで共同作業を行うと、データはその場に留まり、データの使用場所と方法を常に制御できます。

Databricks Clean Rooms は、データドリブンの知見を活用してイノベーションを加速する方法を検討している企業向けに構築されています。 たとえば、最近の Data + AI Summit セッション「Databricks クリーン ルームと PET とのコラボレーション」を視聴して、Mastercard の話を聞き、協力者、データ、ユース ケースに基づいてどのプライバシー強化テクノロジ (PET) を使用するかを動的に決定することで機密データを保護する方法について学んでください。

あらゆる言語、あらゆるワークロード

Databricks Clean Rooms は、あらゆるアナリティクスおよびAIワークロード向けに構築されています。 機能が表形式のデータに対する SQL クエリのみに制限されている他の多くの既存のソリューションとは異なり、Databricks Clean Rooms では、計算を Python で実行できます。 この柔軟性により、単純な結合だけでなくML/AI ユースケースでの複雑な計算の両方が可能になります。 Databricksノートブックのパワーを最大限に活用して、複雑なコンピューティングおよびML/AIワークロードにSQLまたはPythonを実行できます。共同作業者はプライベート ライブラリを使用して機密性の高いアルゴリズムやデータ処理ロジックを非表示にしておくこともできるため、IP が保護された状態を維持できます。 最後に、Scala と Java の言語サポートが近日中に追加される予定です。

レプリケーションなしであらゆるクラウドに対応

Databricks Clean Rooms は、リージョン、クラウド、プラットフォーム間のコラボレーションを目的として構築されています。 たとえば、AWS の共同作業者と Azure の共同作業者など、異なるクラウドの共同作業者は、Databricks Clean Rooms を使用して共同作業を行うことができます。Clean Rooms とのこの安全でオープンかつ柔軟なコラボレーションは、Delta Sharing によって実現されています。 基礎となるデータのプライバシーを保護しながら、非表形式または非構造化データや AI モデルを含むすべてのデータと AI で共同作業を行うことができます。

Delta Sharingの新しいレイクハウスフェデレーション機能の共有を使用した、データ プラットフォーム間のコラボレーションが間もなく開始されます (ここでプレビューへのアクセスをリクエストできます)。

あらゆる規模、あらゆる信頼レベル

私たちは、組織がクリーンルームを大規模に使用することが非常に重要であることを理解しています。 Databricks Clean Rooms は、この需要を満たす強力なコラボレーション機能と運用機能を提供します。

近日中に、API、SQL コマンド、組み込みの Databricks ワークフロー オーケストレーションのサポートが提供され、あらゆるユース ケースのクリーン ルームを簡単に自動化および管理できるようになります。複数の共同作業者が、さまざまな承認モードを使用して、さまざまな信頼レベルで Databricks クリーン ルームで共同作業できます。また、Databricks Notebooks または Unity カタログでクリーン ルームの出力に簡単にアクセスできるため、後続のワークフローにシームレスに統合できます。

Databricks Clean Rooms はどのように機能しますか?

クリーンルームは強力なツールですが、セットアップと開始は簡単です。

まず、希望するクラウド プロバイダーとリージョンを選択してクリーン ルームを作成します。 クリーン ルームは、ユーザーと共同作業者が現在使用しているクラウドやリージョンに関係なく、どのクラウドやリージョンでも作成できます。 これにより、Databricks によってホストされるプライバシーが保護された分離された環境が作成されます。 クリーン ルームが作成されると、あなたと共同作業者は Delta Sharing を使用して、非構造化データ、テーブル、ボリューム、AI モデルなどのデータをクリーン ルームに持ち込むことができます。 クリーンルームの参加者は、お互いのデータを見たり、直接アクセスしたりすることはできません。

最後に、分析を実行するために、相互に合意したコードを含むノートブックを作成し、クリーン ルームで共有することができます。 その後、共同作業者は、サーバレス コンピュートを使用してこれらのノートブック タスクを実行できます。 Databricks Clean Rooms を使用すると、共同作業者は誰でもノートブックをクリーン ルームに共有し、承認を受けて、クリーン ルーム内で実行できます。 この柔軟性により、あらゆるワークロードをプライバシーを保護しながら実行できます。

Databricks クリーンルームの仕組み

一般的なクリーンルームのユースケース

さまざまな業界のクリーンルームで多くのユースケースが出現しています。 一般的なものをいくつか見てみましょう。

広告&メディア

クリーンルームを使用すると、広告主やパブリッシャー(コンテンツ配信者)は、ユーザーのプライバシーを損なうことなくキャンペーンのパフォーマンスを分析できます。 このアプローチにより、広告主はパブリッシャーのデータプライバシーを保護しながら、プラットフォーム全体のキャンペーン効果を包括的に把握できます。 1 つのユースケースは類似モデリングです。これは、ML モデルを使用して、生の基礎データを共有せずに、別の共同作業者のデータセット内の類似プロファイルを見つけるものです。 これは、ニッチなオーディエンスにリーチしたり、ターゲットオーディエンスのプロファイルデータを充実させてコンバージョンを向上させたり、リターゲティングを実行したり、既存のターゲティングプロファイルを改良したりするなど、さまざまなシナリオで強力な手法となります。

この業界の戦略的パートナーである LiveRamp は、 Databricks Clean Rooms 顧客に、顧客モデリングと分析のための ID を活用したデータ インフラストラクチャを提供します。

「LiveRamp と Databricks Clean Rooms は、プライバシーを保護しながら、素晴らしい顧客体験を生み出すために必要なツールをマーケティング担当者に提供します。 Databricksの顧客は、LiveRamp の ID を活用したデータ インフラストラクチャを利用して、顧客モデリングと分析のより優れたパーソナライゼーション、強力なコラボレーション、および精度の向上を推進できます。これはあらゆるマーケティング チームにとって夢の組み合わせです」
— Mike Moreau 氏、LiveRamp、オペレーション担当バイス プレジデント

小売・消費財(CPG)

小売業者やメーカーはクリーンルームを使用してトレンドを特定し、価格戦略を最適化できます。 この共同分析により、よりターゲットを絞った広告が可能になり、キャンペーンの最適化に役立つ貴重な知見が提供されるため、小売業者のメディア ネットワークの有効性が強化されます。 もう 1 つの一般的な使用例は、需要予測と在庫管理に販売データを活用することです。

加工

グローバルな製造業者は、パートナーと連携して、クリーンルームを使用して、予測メンテナンスによる運用効率の向上など、バリューチェーン全体にわたるデータ知見を獲得できます。 設置されたセンサーからのデータやデータ パイプラインからの生データにアクセスでき、また、履歴データでトレーニングされたMLモデルを使用して、障害やメンテナンス期間の予測に役立てることができます。

医療・ライフサイエンス

クリーンルームは、ヘルスケアやライフサイエンスの分野でも、患者データの共同研究に役立てられます。 さまざまな機関の研究者は、患者のプライバシーを維持しながら、統合されたデータセットを分析して新しい治療法を開発し、患者の転帰を改善することができます。

金融サービス

クリーンルームは、金融サービスにおける顧客確認 (KYC) コンプライアンスに革命をもたらします。 金融機関は、機密性の高い顧客情報を公開することなく、KYC データを安全に共有および分析して、顧客のオンボーディングを迅速化し、潜在的なマネー ロンダリング活動を特定し、全体的なリスク管理を改善できます。 不正行為の検出と防止は、金融機関とサードパーティのアナリティクス プロバイダー (フィンテック企業、不正検出会社など) が協力して重要な知識を抽出するのにも役立ちます。 もう 1 つの使用例は、顧客の知識とパーソナライゼーションを生成することであり、金融機関とサードパーティのアナリティクス プロバイダーが協力して、パーソナライズされた金融製品やサービスに対する顧客の行動や好みを理解するのに役立ちます。

Databricks クリーンルームを使い始める

Databricks Clean Rooms は、プライバシーが保護されたコラボレーションを可能にし、データと AI の取り組みの実現を支援します。 パブリック プレビューがリリースされる前に、Databricks Clean Rooms への関心フォームにご興味をお送りください。

また、クリーン ルームに関する最近の 2024 Data + AI Summit セッションを視聴して、その仕組みやデータドリブンのイノベーションを加速させる方法についてさらに学ぶこともできます。

  • Databricks クリーンルームおよび PET とのコラボレーションは、 Mastercard による顧客主導のセッションです。 Clean RoomsとMastercardは、複数の関係者間のコラボレーションを促進し、最新のデータ問題を解決します。 Mastercard が使用するノートブックを詳しく調べて、エンドユーザーのエクスペリエンスに影響を与えずに、協力者、データ、ユースケースに基づいて、どのプライバシー強化テクノロジー (PET) を自動的に適用する必要があるかを判断します。
  • Databricks Clean Rooms の使用開始では、共有データの分析を開始する方法と、プラットフォーム間でのデータの操作、ML/AI モデルのトレーニング、プライバシー ポリシーの適用、独自のライブラリの組み込み、非構造化データの分析、クリーン ルームのアクションの監査など、Databricks Clean Rooms を使用して高度なユース ケースを実現する方法について説明します。
  • Databricks クリーン ルームによる安全なデータと AI のコラボレーションでは、データ クリーン ルームの採用を推進するマクロ トレンドと一般的な使用例について説明します。 このセッションでは、Mastercardのユースケースについてもデモで紹介します。
Databricks 無料トライアル

関連記事

Data + AI Summit 2024:データ共有とコラボレーションの最新情報

Translation Review by saki.kitaoka Databricksでは、データとAIの民主化をミッションとしています。オープンなアプローチによる共有とコラボレーションは、そのリーチとインパクトを最大化するために重要です。当社のデータインテリジェンスプラットフォーム内では Delta Sharing オープンプロトコルが顧客のデータとAI資産の共有を簡単かつ安全にし、イノベーションを加速させます。サードパーティデータとのコラボレーションには、 Databricks Marketplace がすべてのデータ、分析、AIのニーズに対応するオープンマーケットプレイスを提供します。データパートナーのエコシステムが拡大する中で、さまざまなデータとAI資産を共有し、データ消費者がイノベーションを実現できるようにします。 Databricks Clean Rooms は、ビジネスがどのクラウド上でも安全な環境で簡単にコラボレーションできるプライバシー保護されたコラボレーションを提供します。先週、Delta

Delta Sharingで実現する安全なエンドツーエンドのコラボレーション

Reviewed by saki.kitaoka 現代のデジタル環境において、セキュアなデータ共有は運用効率とイノベーションに不可欠です。DatabricksとLinux Foundationは、データ、分析、AI全体でのデータ共有に対する初のオープンソースアプローチとして Delta Sharing を開発しました。Databricksは、安全なデータ交換を提供し、プラットフォーム、クラウド、地域をまたいだシームレスな共有を促進します。あらゆる規模の企業が、幅広いアプリケーションと多様なデータ形式をサポートするDelta Sharingを信頼しています。この柔軟性により、データ資産の可能性を最大限に引き出そうとする組織にとって信頼できるツールとなります。 本ブログでは、Databricks Delta Sharingのセキュリティアーキテクチャを、 Databricks顧客間共有(D2D) 、 Databricks顧客からオープン共有(D2O) 、クロスクラウドデータ共有の3つの異なる共有シナリオを通じて検討し
プラットフォームブログ一覧へ