Delta Sharingと新時代のレイクハウス顧客データプラットフォーム (CDP) の登場
このブログに貴重な知見と貢献を提供してくれた Amperity の Caleb Benningfield 氏と Sam Malissa 氏に特に感謝します。
今日、企業はプライバシー規制に準拠しながら 、大規模なパーソナライゼーションを実現するために、より膨大で複雑な顧客データを処理しなければならないという大きな課題に直面しています。 これは、データ品質を優先し、効果的なガバナンスレイヤーを実装することを意味しますが、企業が依存していた既存のツールや方法では、この課題に対応できません。
この課題に対処するために、多くの企業がクラウドデータウェアハウスとデータレイクからデータレイクハウスアーキテクチャに移行しました。 データレイクハウスは、これまでのシステムの最高の機能を組み合わせて、企業がデータを保存および管理する方法を合理化し、貴重な知見に簡単にアクセスできるようにします。
では、次は何でしょうか? 次のフロンティアは、 DatabricksとDelta Sharing上に構築されます。これにより、レプリケーションなしでリアルタイムに安全なクロスプラットフォームのデータ共有が可能になり、よりオープンで柔軟かつ安全なデータ エコシステムの構築に役立ちます。これにより、データ分析とAI可能になるだけでなく、データと MarTech スタック全体の相互運用性を通じてアクティベーションを推進する機能も実現します。 この柔軟でオープンなプラットフォームは、データエンジニアとビジネスチームの両方にメリットをもたらします。IT ITツール間の接続を維持したりスタック内でデータを移動したりするために時間とリソースを費やす必要がなくなり、マーケティング担当者は機能する洗練された顧客エクスペリエンスを構築できます。
このブログでは、データ プラットフォームがデータ イ ンテリジェンス プラットフォームへと進化する仕組み、 Delta Sharingすべてのデータ + AIの進化をどのようにサポートしているか、Amperity がDelta SharingとDatabricksを使用して新しいレイクハウス顧客データ プラットフォーム (CDP) を構築している仕組みについて説明します。 Databricksと Amperity が General Motors などの顧客の顧客エクスペリエンスの構築と強化にどのように役立ったか、また、ワークフローの簡素化、データ品質とガバナンスの強化、コストの削減を組織でどのように支援できるかについて、以下をお読みください。
Databricks データインテリジェンスプラットフォーム
Databricks 、データウェアハウスとデータレイクの長所を組み合わせて統合するレイクハウスの概念の先駆者です。 現在、世界の CIO の 74% が自社内にレイクハウスを保有していると報告しており、残りのほぼ全員が今後 3 年以内にレイクハウスを保有する予定であると回答しています。
しかし、レイクハウスの採用が市場で勢力を増す一方で、私たちの業界は前例のない速度で革新を遂げており、生成AIと呼ばれる別の技術が急速に台頭しています。 2023 年 11 月に、 Databricks Data Intelligence Platform (DI Platform) を導入しました。 これは、現在のデータ プラットフォームに対する単なる段階的な改善ではなく、当社の製品戦略とロードマップの根本的な転換です。 レイクハウスと生成AIの統合により、お客様は自然言語で知識を民主化し、独自のデータにAIを組み込むことができます。
Databricksデータ インテリジェンス プラットフォームは、データ共有とコラボレーションのために構築されています。 Databricks を使用すると、企業は一元化されたガバナンスにより、リージョン、クラウド、プラットフォーム全体ですべてのデータと AI 資産を共有できるため、データと MarTech エコシステム全体の相互運用性を高めることができます。 データの消費者でもプロバイダーでも、データセット、 AIモデル、データベース、ダッシュボード、ソリューションを共有できます。これらはすべて、多様な環境間で安全かつリアルタイムのデータ共有を可能にするDelta Sharingによって実現されています。
Delta Sharing、クロスプラットフォームデータ共有のためのオープンプロトコル
Delta Sharing は、Databricks と Linux Foundation によって構築された、安全なデータ共有のためのオープン共有プロトコルです。これにより、企業はレプリケーションを必要とせずに、データ プラットフォーム、クラウド、またはリージョン間でライブ データを安全に共有できます。 これは、データのサイロ化がなくなることを意味します。 IT チームは、ETL や統合を維持する必要なく、データがどこに保存されていてもアクセスできます。 これは組織にとってより効率的であり、不必要で法外なストレージコストを軽減するのに役立ちます。
ガバナンスも一元化されています。 Delta Sharing Databricks Unity Catalogと統合されており、ビジネス ユニット間、またはパートナーや顧客などの他の組織との間で共有されるデータを一元的に管理、監査、追跡できます。 これにより、データ保護規則によるコンプライアンスがサポートされ、許可された 個人のみがデータにアクセスできるようになります。
これらの機能はすべて、次のようなビジネスに新たな機会をもたらします。
- シームレスな共有:データを複製することなく、クラウドや地域をまたいでビジネス ユニットや子会社内でデータを安全かつ迅速に共有します。 社内インフラストラクチャはさまざまであるため、テクノロジーに依存しないデータ共有によりビジネスコストが削減されます。
- より簡単なデータ収益化:顧客が同じプラットフォーム上にいなくても、データセット、機械学習モデル、ダッシュボードなどのデータ製品を配布および収益化できます。
- データ アクセスの向上、統合の削減:プラットフォームとツール間でデータを共有する際に、データ パイプラインの構築と維持が不要になります。 データ共有が容易なため、企業は特定のクラウドベンダー プラットフォームに縛られることなく、クラス最高のツールを活用できます。
データへのアクセスと移動を容易にすることは特に重要です。 ビッグデータ環境が進化し、さまざまなプラットフォームやアプリで利用できる専門ツールが登場するにつれて、データの共有が容易になり、データ管理の新たな領域が開かれます。 このような状況では、顧客データの管理に伴う特有の複雑さにより、新しい種類の顧客データ プラットフォームが必要になります。
Amperity レイクハウス CDP: 柔軟性、データ品質、ガバナンス
Databricks データ インテリジェンス プラットフォームと Delta Sharing は、コラボレーションを促進するための新たなイノベーショ ンを推進しています。 このプラットフォームをベースに、CDP 分野のリーダーである Amperity が初のレイクハウス CDPを導入しました。
データ ストレージがウェアハウスからレイクハウスへと進化したのと同様に、CDP にも独自の発展曲線があります。 これらは、エンドツーエンドの顧客データ ワークフローを備えたオールインワンのパッケージ製品としてスタートしましたが、強力な機能を備えていましたが、最終的にはもう 1 つのサイロになってしまいました。 その後、企業が必要とするコンポーネントとツールだけを取り出して、それをデータウェアハウスから直接実行する、コンポーザブル CDP またはアンバンドル CDP の概念が登場しました。 これにより柔軟性とカスタマイズ性は向上しましたが、データの品質やガバナンスを維持するという課題が考慮されないことが多々ありました。
レイクハウス CDP は、両方のアプローチの長所を兼ね備えています。 これは、レプリケーションなしでエコシステム全体のライブ レイクハウス データにアクセスして共有できる構成可能なソリューションです。 レイクハウス CDP は、複雑なビジネス ロジックに依存するのではなく、コードなしで、アクティベーション、アナリティクス、 AIユースケース向けにレイクハウス内の顧客データを統合して強化します。 Delta Sharing 、レイクハウス CDP のこれらの中核的な利点を実現する重要な機能です。
Amperity は、 Amperity Bridgeと呼ばれる新しい機能を通じて Delta Sharing を使用します。 Bridge を使用すると、ユーザーはプラットフォーム間でデータをコピーまたは移動することなく、Databricks との間でデータをポイントおよび共有できます。 共有カタログを通じてテクノロジースタック全体でライブ データを利用できるため、企業はデータの可視性と制御性が向上し、不要なネットワーク呼び出しや処理を行わずに、より適切なコンプライアンスを実現できます。
Amperity と Databricks 間のデータ共有により、顧客セグメンテーションの改善とデータ セキュリティの強化のメリットを実感している組織が General Motors です。 「Amperity Bridge により、ファイアウォール内で顧客データを安全に保ちながら、自社のファーストパーティ データを活用する AI 搭載ターゲティング エンジンを構築できるようになりました。 「私たちは現在、これまでさまざまな行動特性で結び付けることができなかった顧客や人口のセグメントを特定しています」とフランシス氏は説明した。
「 AIと最新のデータ共有プロトコルを使用してDatabricksとシームレスにデータを共有するAmperityのレイクハウスCDPを使用して、次世代の顧客データ基盤を構築できることを嬉しく思います。」— ゼネラル モーターズ、最高データ・アナリティクス責任者、ジョン・フランシス氏
Amperity レイクハウス CDP によって実現されるものを詳しく見てみましょう。
- データ品質の向上:自動化されたファーストパーティ ID 解決では、AI を使用して生の顧客データを統合し、安定したユニバーサル ID を生成します。 これにより、レイクハウス内およびツール全体で高いデータ品質が維持されます。
- データモデリングの高速化: チームは、アクティブ化のためにデータをすばやく整形できます。 業界やユースケース別に事前に構築されたデータ資産は、レイクハウスで簡単に共有および拡充できます。
- より簡単なアクティベーション:マーケティング担当者に優しいツールを使用したレイクハウスからの高品質データへのスムーズなアクセスとアクティベーションは、一般的なリバース ETL よりも簡単で安全です。
- より強力なデータガバナンス:複製なしでデータを安全に共有し、すべての変換を追跡し、同意管理を自動化することで、ガバナンスが向上します。
Delta Sharingは最大限のリーチとインパクトを実現するオープンアプローチです。
Delta Sharingのデータ共有に対する安全なクロスプラットフォーム アプローチは、アプリケーション開発環境を一変させ、企業がテクノロジ ー スタックに取り組む方法を変えました。 データエンジニアは、ツール間のカスタムの安全な接続を構築したり、スタック内でデータを手動で移動したりするために時間とリソースを費やす必要がなくなりました。 代わりに、ビジネス ニーズを満たし、新しい AI ユース ケースを実現し、イノベーションをさらに形作るために、データを強化するためにどのツールを使用するかに重点を置くことができます。
Amperity などのプラットフォームはすでにDelta Sharing採用しており、あらゆるデータレイクハウスにクラス最高の ID 解決、エンリッチメント、アクティベーション ツールをより簡単に提供しています。 データ + AI 共有革命がさらに進むにつれ、この新たな自由がより多くの企業やブランドの創造性と革新性を刺激し、クラウドやプラットフォーム全体であらゆるタイプのデータを使用したオープンなコラボレーションを推進していく様子を見るのが楽しみです。
General Motors が Amperity とDatabricksを活用して 顧客 360 を強化し、GM のビジネスと顧客に有意義なビジネス インパクトをもたらす方法について詳細をご覧ください。 「顧客ロイヤルティの向上: GM が Amperity で C360 を強化する方法」は、今年 6 月にサンフランシスコで開催されるData + AI Summit 2024での顧客主導のセッションです。
Amperityは、2024年5月16日にニューヨーク市で年次サミット「 Amplify 2024 」を開催しました。 イベントの詳細とオンデマンド セッションの視聴方法をご覧ください。
Delta Sharing が組織にどのように役立つかについて詳しくは、以下の新しい電子書籍や関連ブログなどの最新のリソースをご覧ください。