メインコンテンツへジャンプ

Databricks Data Intelligence Platformのためのセキュリティベストプラクティス

データとAIセキュリティで先を行くための防御深化アプローチ
Share this post

Databricksでは、データが最も価値のある資産の一つであることを理解しています。当社の製品とセキュリティチームは協力して、セキュリティリスクに対抗し、コンプライアンスの義務を満たすことができるエンタープライズグレードのデータインテリジェンスプラットフォームを提供します。過去1年間で、Azure Private Link for Databricks SQL Serverlessによるデータアクセスの保護、Azure firewall support for Workspace storageによるデータのプライバシー保護、Azure confidential computingによる使用中のデータ保護、FedRAMP High Agency ATO on AWS GovCloudの達成、Databricks AI Security Frameworkの公開、そしてResponsible AIへのアプローチの詳細を共有するなど、新たな機能とリソースを提供してきました。

2024 Verizon Data Breach Investigations Reportによると、データ侵害の件数は昨年から30%増加しています。私たちは、あなたが私たちのセキュリティ機能を理解し、適切に利用し、推奨されるセキュリティベストプラクティスを採用することが、データ侵害リスクを効果的に軽減するために重要であると考えています。

このブログでは、プラットフォームの主要なコントロールと最近リリースされたセキュリティ機能を活用して、データとAI資産を保護する堅牢な防御深化姿勢を確立する方法を説明します。また、迅速に始められるように、私たちのセキュリティベストプラクティスリソースの概要も提供します。

Databricks Data Intelligence Platform上のデータとAIワークロードを保護します

Databricksプラットフォームは、各アクセスポイントでアカウントの乗っ取りとデータの外部への流出のリスクに対抗するためのセキュリティガードレールを提供します。下の画像では、Databricks上の典型的なレイクハウスアーキテクチャを3つのセキュアな面で概説しています:

  1. あなたのクライアント、ユーザー、アプリケーションがDatabricksに接続する
  2. Databricksサービス(API)に接続するワークロード
  3. あなたのデータがDatabricksのワークロードからアクセスされる

Databricksワークロード

では、Databricksの各接続ポイントにおける、デフォルトで有効化されているか、またはユーザーがオンにできる主なセキュリティ制御と新機能を高レベルで見ていきましょう。異なる脅威モデルに基づいた完全な推奨事項は、セキュリティベストプラクティスガイドに記載されています。

Databricksへのユーザーおよびアプリケーション接続 (1)

アクセスに関連するリスクから保護するためには、Databricksへのユーザーおよびアプリケーションの認証と認可に複数の要素を使用することが推奨されます。パスワードのみの使用は、盗難、フィッシング、管理の不備に対する脆弱性があるため不十分です。実際、2024年7月10日をもって、Databricks管理のパスワードはサポート終了となり、UIおよびAPI認証での使用ができなくなります。このデフォルトのセキュリティ強化に加えて、以下のコントロールを実装することをお勧めします:

  1. シングルサインオンで認証: すべてのユーザーアクセスのアカウントレベルで(AWS、SSOはAzure/GCPで自動的に有効化されます)
  2. マルチファクター認証を活用する: あなたのIDPが提供するマルチファクター認証を使用して、Databricksにアクセスするすべてのユーザーとアプリケーションを確認します(AWSAzureGCP
  3. 統一ログインを有効にする: すべてのワークスペースで単一のアカウントレベルのSSOを使用し、SSO緊急アクセスをMFAで設定することで、効率的かつ安全なアクセス管理を実現します(AWS、DatabricksはAzure/GCPの組み込みIDプロバイダーと統合)
  4. フロントエンドのプライベートリンクを使用する: ワークスペースで、信頼できるプライベートネットワークへのアクセスを制限します(AWSAzureGCP
  5. IPアクセスリストの設定: ワークスペースやアカウントに対して行い、信頼できるネットワークロケーション(例えば、あなたの企業ネットワーク)からのみのアクセスを許可します(AWSAzureGCP

あなたのワークロードをDatabricksサービスに接続する (2)

ワークロードのなりすましを防ぐために、Databricksはクラスタのライフサイクル中に複数の認証情報を使用してワークロードを認証します。私たちの推奨事項と利用可能なコントロールは、あなたのデプロイメントアーキテクチャに依存します。

高レベルで見ると:

  1. クラシッククラスターについてあなたのネットワーク上で動作する場合、計算プレーンと制御プレーンの間にバックエンドプライベートリンクを設定することをお勧めします。バックエンドのプライベートリンクを設定することで、クラスタは専用のプライベートチャネルを介してのみ認証できるようになります。
  2. Serverlessの場合、Databricksは自動的にアプリケーションレベルの認証情報、mTLSクライアント証明書、プライベートリンクの組み合わせを使用して、ワークスペースのなりすましリスクに対する防御深度のセキュリティ姿勢を提供します。

Databricksからあなたのストレージやデータソースへの接続(3)

データが正しいユーザーとワークロードによってのみアクセスされ、ワークロードが許可されたストレージ場所にのみ書き込むことができるようにするために、以下の機能を活用することをお勧めします:

  1. データへのアクセスを管理するためのUnity Catalogの使用: Unity Catalogは、細かいアクセス制御や、デフォルトで信頼されたコードからのみアクセス可能な時間制限付きのスコープダウンされた資格情報など、いくつかの保護層を提供します。
  2. Mosaic AI Gatewayを活用する: 現在パブリックプレビュー中のMosaic AI Gatewayを使用すると、エンタープライズ全体で外部モデルとDatabricksにホストされたモデルの使用を監視し、制御することができます。
  3. 認証されたネットワークからのアクセスを設定: AWSのS3バケットポリシー、Azureのストレージファイアウォール、GCPのVPCサービスコントロールを使用してアクセスポリシーを設定することができます。
    • クラシッククラスタを使用すると、上記のコントロールを通じてネットワークへのアクセスを制限することができます。
    • Serverlessを使用すると、Serverlessネットワークへのアクセスを制限することができます(AWSAzure)またはAzureの専用のプライベートエンドポイントへのアクセスを制限することができます。Azureでは、ワークスペースストレージのストレージファイアウォール(DBFSルート)アカウントを有効にすることができます。
    • Databricks外部のリソース、例えば外部モデルやストレージアカウントなどは、専用のプライベート接続で設定することができます。こちらは、最もリクエストが多いシナリオの一つであるAzure OpenAIへのアクセスのためのデプロイメントガイドです。
  4. 許可されていないストレージへのアクセスを防ぐためのイーグレス制御の設定:Classicクラスタでは、ネットワーク上でイーグレス制御を設定できます。SQL Serverlessの場合、DatabricksはPython UDFなどの信頼されていないコードからのインターネットアクセスを許可していません。より多くのServerless製品を採用する際に、どのようにイーグレス制御を強化しているかについて学ぶためには、こちらのフォームに記入してプレビューに参加してください

以下の図は、Databricks Serverless製品を導入する際に、データ処理のためのプライベートで安全な環境をどのように設定するかを概説しています。上記のように、複数の保護層がこの環境へのすべてのアクセスを保護することができます。

Databricksワークロード

業界最先端のセキュリティベストプラクティスであなたのデータとAIワークロードを定義、デプロイ、監視します

ここで、利用可能な主要なコントロールのセットを概説したので、おそらくこれらをどのように迅速にビジネスに適用できるかを考えているでしょう。Databricksのセキュリティチームは、彼らが何百もの顧客との経験から開発したリソースを使用して、「定義、デプロイ、モニタリング」のアプローチを取ることを推奨しています。

  1. 定義: あなたの組織特有のリスクとともに、私たちのベストプラクティスを見直してDatabricks環境を設定するべきです。私たちは、すべての主要なクラウド上でのDatabricksのデプロイメントに対する包括的なベストプラクティスガイドを作成しました。これらのドキュメントは、私たちのエンタープライズエンゲージメントから洗練されたセキュリティプラクティス、脅威モデル、パターンのチェックリストを提供します。
  2. デプロイ: Terraformテンプレートを使用すると、セキュアなDatabricksワークスペースのデプロイが簡単になります。公式の Databricks Terraform プロバイダを利用して、ワークスペースと必要なクラウドインフラをプログラムでデプロイできます。これらの統合された Terraform テンプレートは、セキュリティを最重要視するお客さま向けに強化されたセキュリティ設定であらかじめ設定されています。私たちのGitHubを見てください。AWS、Azure、GCPで始めるための情報があります。
  3. モニター:セキュリティ分析ツール(SAT)は、Databricksワークスペースでのセキュリティベストプラクティスへの遵守を継続的に監視するために使用できます。最近、SATをアップグレードしてセットアップを効率化し、チェックを強化し、それらをDatabricks AIセキュリティフレームワーク(DASF)に合わせてAIセキュリティリスクのカバレッジを改善しました。

データとAIのセキュリティで先を行きましょう

Databricksデータインテリジェンスプラットフォームは、データとAI資産を保護するためのエンタープライズグレードの防御深度アプローチを提供します。セキュリティリスクの軽減についての推奨事項は、選択したクラウドに対するセキュリティベストプラクティスガイドを参照してください。不正アクセスに関連するコントロールの要約チェックリストについては、このドキュメントを参照してください。

私たちは、お客様のフィードバック、進化する業界標準、新たに出現するセキュリティ脅威に基づいて、プラットフォームを継続的に強化しています。これにより、お客様のニーズをより良く満たし、潜在的なリスクに先んじることができます。最新情報を得るために、セキュリティと信頼のブログをブックマークし、YouTubeチャンネルをチェックし、Databricksセキュリティと信頼センターを訪れてください。

Databricks 無料トライアル

関連記事

Databricks が AWS GovCloud 上で FedRAMP High agency ATO を取得、現在パブリックプレビュー中

私たちは、Databricks on AWS GovCloudが現在 パブリックプレビュー 中であること、そして最近、最初の FedRAMP® High Agency ATO を獲得したことを発表できることを嬉しく思います! 国際武器取引規制(ITAR)およびHIPAAのユースケースをサポートする準備が整いました。間もなく国防総省影響レベル 5 (IL5) の暫定認可が得られる予定です。 本日の発表は、Databricks にとってエキサイティングな コンプライアンスマイルストーン の最新版です。 これは、FedRAMP Highのスポンサー機関とプレビューのお客様の功績を称えるものであり、 米国市民権移民サービス 、メディケアおよびメディケイドサービスセンター、米国食品医薬品局のような公共部門のお客様が、市民サービスの向上とミッションの成功を達成するためのデータインテリジェンスの約束を実現するための支援に重点を置いていることを反映しています。...

Databricks AIセキュリティフレームワーク(DASF)の紹介

Databricks AI Security Framework(DASF)バージョン1.0 のホワイトペーパーを発表できることを嬉しく思います! このフレームワークは、ビジネス、IT、データ、AI、セキュリティの各グループのチームワークを向上させるように設計されています。 本書は、実際の攻撃観察に基づくAIセキュリティリスクの知識ベースをカタログ化することで、AIとMLの概念を簡素化し、AIセキュリティに対する徹底的な防御アプローチを提供するとともに、すぐに適用できる実践的なアドバイスを提供します。 機械学習(ML)と生成AI(GenAI)は、イノベーション、競争力、従業員の生産性を高めることで、仕事の未来を変革します。 しかし、企業は人工知能(AI)技術を活用してビジネスチャンスを得ると同時に、データ漏洩や法規制の不遵守など、潜在的なセキュリティおよびプライバシーリスクを管理するという二重の課題に取り組んでいます。 このブログでは、DASFの概要、組織のAIイニシアチブを保護するためにDASFを活用する方法、

Databricks SQL Serverless向けのAzure Private LinkとAzure Storageファイアウォールの一般提供についてのお知らせ

2024年4月に予定されている Databricks SQL (DBSQL) Serverlessの Azure Private Linkサポートの一般提供を、 追加料金なしで ご利用いただけることをお知らせいたします。 また、安定した VNet サブネット ID による Azure Storage ファイアウォールのサポートが DBSQL Serverless で一般的に利用できるようになったことを発表できることを嬉しく思います。 このブログでは、DatabricksサーバーレスからAzure Storageアカウントのデータに安全にアクセスするための、2つの機能の概要と関連するベストプラクティスを紹介します。...
プラットフォームブログ一覧へ