データが急速に増加し、金融機関がAIや生成AIモデルにデータを活用することへの圧力が高まる中、データガバナンスの重要性はますます高まっています。 欧州連合(EU)議会が包括的なAI規制を可決し、米国連邦政府がAI利用を規制する措置を講じるなど、規制当局がAIの応用に関心を寄せています。 これは、AI規制の重要性の高まりを浮き彫りにしています。(詳しくは、Databricksのブログ「展開中のAI規制への対応をデータインテリジェンスプラットフォームが支援」にまとめられています)
データガバナンスは基礎であり、生成AIの使用に先立つものです。 データガバナンスがなければ、金融機関は規制上の要求を満たすことも、AIの結果を説明することも、アルゴリズムやデータ中心のバイアスを制御することもできません。 AIモデルがより複雑になるにつれ、それらをどのように管理し、社内外のデータ資産とどのように相互作用させるかを検討することが極めて重要になります。
データガバナンスは生成AIよりも前に考えるべき重要な基盤
データとテクノロジー、技術リーダーが生成AIでより複雑なものを導入する際には、対象となるデータの種類だけでなく、AIモデルをどのようにカバーするかについても考える必要があります。 また、組織内のデータ資産と組織外のデータ資産の両方を考慮する必要があります。これは、生成AIを活用して手動プロセスを自動化し、データ・タグ付けに費やす時間を短縮する方法にも及びます。
ガートナーは、2026年までに大企業の20%が単一のデータと分析のガバナンスプラットフォームを使用して、個別のガバナンスプログラムを統合し、自動化すると予測しています。 このシンプル化されたアプローチにより、サイロ内のすべてのデータ資産にわたってポリシーとコントロールを維持する必要性が減少します。
ガバナンスを始める:人材、プロセス、プラットフォーム
ガバナンスを始めるには、人材、プロセス、プラッ トフォームの3つの要素が必要です。
人材: 人々は技術的な能力開発にフォーカスすべきです。そしてそれがビジネスユーザーにもきちんと伝わるようにする必要があります。 ユーザーの変革を支援します。 データとAI戦略が成功するかどうかは、従業員が知見を採用し、活用し、行動に変化をもたらすかどうかにかかっています。 あらゆる階層でデータとAIの活用を強化し、再教育し、奨励します。
主な質問:役割に応じてデータアクセスや知見をどのように調整しますか? データを(社内外で)共有/提供していますか、または提供しようとしていますか? 新しい技術を継続的に学ぶ文化をどのように育みますか? ビジネスユーザーがアクセスできるようにするにはどうすれば良いかを考えてください。ビジネスユーザーはPythonで育ったわけではありませんし、SQLで育ったわけでもありません。では、彼らを生成AIの旅に連れて行くにはどうすればいいのでしょうか?その方法は技術のみに基づいて設定されたものではありませんか?
プロセス:データおよびAI戦略をビジネス目標と整合させ、ITスタックに優先順位を付け、構造化された全社的な取り組みを確立します。 人材に対してもアジャイルなアプローチをとってください。多くの場合、人々はポリシーを理解していなかったために、ポリシー違反をしてしまうことがよくあります。 アジャイルなアプローチをAIポリシーに必ず組み込んでください。
主な質問:AI のアドホックな導入から構造的な導入への移行方法とは?何がうまくいっているのか、なぜうまくいっているのかを迅速に特定するには? 機能していない部分にどのように対処し、調整することができますか? 組織には、データの民主化に基づいたデータ戦略が欠けていませんか?
プラットフォーム:プラットフォームは、リスクの最小化とイノベーションの必要性のバランスを取りながら、適切な執行を行う必要があります。 将来の混乱を回避するために、オープンなインターフェースとデータ形式を採用する必要があります。 多くのCISOはリスクを最小限に抑えたいと考えています。 その結果、統制を確実にするために技術革新を止めたり、遅らせたりすることがよくあります。 一方、最高製品責任者(CPO)は、できるだけ早くイノベーションを起こそうとします。 ですから、それらのプロセスのバランスを取るようにしてください。
主な質問:あなたの会社には(複数の)異なる/互換性のないプラットフォームがありますか? どこに境界線、障壁、コントロールを設ける必要がありますか? プロプライエタリなソリューションと、柔軟性と効率性のためのオープンソースのバランスをどのように取っていますか? イノベーションのペースに備えるには? 組織はデータメッシュアーキテクチャを導入しようとしていますか?
Unity Catalogがデータガバナンスをサポート、データとAIを統合
金融サービステクノロジーの技術リーダーは、データの収益化とイノベーションの促進を図りつつ、コスト削減、リスク管理、コンプライアンスを徹底する必要に迫られています。 Databricks Unity Catalogは、Data Intelligence Platform上のデータとAIのための統合ガバナンスソリューションです。 データ、分析、AIの統一モデルを提供することで、企業のガバナンス、共有、コラボレーションを簡素化します。 また、AIを活用して生産性を高め、レイクハウスアーキテクチャの機能を最大限に活用することで、信頼できるデータへのセキュアなアクセスとコラボレーションが可能になります。
Unity Catalog は、構造化・非構造化データ、機械学習(ML)モデル、その他のデジタル資産をあらゆるクラウドやプラットフォームで管理するための統一レイヤーを提供することで、データガバナンスに変革をもたらします。
データとAIの統合ガバナンスのメリットは以下の通りです:
- 統一された可視性:クラウド、リージョン、プラットフォームにわたるすべてのデータ、分析、AI資産の一元的なカタログ化により、チームは情報を簡単に発見、アクセス、分析できます。 これにより、イノベーションを加速し、コストを削減することができます。
- 統合アクセス管理:アクセス管理のための単一のツールを提供することで、ポリシー管理が簡素化され、データとAIのセキュリティが強化されます。
- エンドツーエンドのモニタリングとレポーティング:機密データやAI資産のデータ権限やアクセスパターンを一元的に監視・監査できるため、プロアクティブな監視と堅牢なアクセス制御が容易になり、脆弱性を最小限に抑え、コンプライアンス違反やセキュリティ侵害のリスクを軽減できます。
- プラットフォームに依存しない共有とコラボレーション:MLモデル、ダッシュボード、Notebookを含むデータとAI資産のクロスプラットフォーム、クロスクラウド、クロスリージョンの安全な共有を促進する標準化されたアプローチ。 これにより、重複コストを削減すると同時に、データプロバイダー、パートナー、顧客などの膨大なエコシステムとのコラボレーションを可能にし、新たな収益源の開拓とビジネス価値の向上を実現します。
金融サービスにおけるデータガバナンス
National Australia Bank(NAB):オーストラリア最大のビジネスバンクであるNABは、スピードとスケールで安全にデータを配信するためにDatabricksを利用しています。 Databricks は、信頼性の高いデータへのアクセスを1つのプラットフォームで提供し、Unity Catalogにより全社的なガバナンスを可能にし、ビジネスユーザーが必要なときにいつでもデータにアクセスできるようにします。NABは、これまで手の届かなかったユースケースを解放しつつあります。 現在では、顧客サービス、マーケティング・キャンペーン、金融犯罪の検知、報告、監視のための生成AIを探求できるようになりました。 動画を見る
Coastal Community Bank:Coastal Community Bankは、世界最大の金融センターから遠く離れたワシントン州エベレットに本社を置いています。 同行のCCBX部門は、金融テクノロジー、技術系企業、ブローカ ー・ディーラー向けにバンキング・アズ・ア・サービス(BaaS)を提供しています。 パーソナライズされた金融製品、より優れたリスク監視、レポーティング、 コンプライアンスを提供するため、コーシャルはDatabricks Data Intelligence Platform を含むUnity Catalog を利用しました。
ソフトウェア・エンジニアリングの原則をデータに適用することは、エンジニアリング・チームにとって軽視されたり、無視されたりすることがよくありますが、同行は、自分たちが働いている社内外の環境の規模と複雑さを管理することが重要であることを知っていました。 これには、開発、テスト、本番用の環境を分離すること、環境間でのコードの推進を技術リーダーに承認してもらうこと、データのプライバシーとセキュリティのガバナンスを含めることなどが含まれます。 続きを読む
Block:Block社では、データ転送とサイロ化されたガバナンスポリシーが、IAMロールによる監査とポリシー実施における課題を悪化させていました。 2PBを超えるガバメントデータを持つBlock社は、Block社のデータエステートを統合し、アクセス管理とコスト帰属をシンプル化するDatabricks Unity Catalogを採用しました。 きめ細かなアクセスポリシーによって維持される機密データへのセキュアなアクセスは、コンプライアンスを保証し、最終的にデータ排出コストを20%削減します。 続きを読む
生成AIのテストと実験がかつてないほど盛んな今、ガバナンスをシンプル化することは非常に重要です。 だからこそ、効率的で品質保証されたLLM開発の新たなスタンダード、DBRXを発表できることを嬉しく思います。 DBRXはビルトインのガバナンスとモニタリングを提供し、初期段階から最終モデルまでデータの完全性を保証します。これにより、企業データを使用してカスタムモデルを安全かつコスト効率よく作成できるようにします。 DBRXを使用すれば、すべてのベンチマークでオープンソースの標準を上回り、モデルの最高生産品質を確保できます。