Azure 環境向けに最適化された「Azure Databricks」は、Azure Data Lake Storage、Azure Data Factory、Azure Machine Learning、Azure Synapse Analytics、Power BI、その他の Azure サービスと緊密に統合されています。シンプルでオープンなレイクハウスにあらゆるデータを保存し、分析とAI のワークロードを一元化します。

シンプル

データ・分析・AI を一元化
あらゆるデータのユースケースを単一の共通プラットフォームで

オープン

データエコシステムを統合
オープンソース、オープンスタンダード、オープンフォーマット

コラボレーション

データチームをひとつに
データと AI のワークフロー全体でのコラボレーションを促進

Azure Databricks トレーニング

Azure Databricks トレーニング

この 3 部構成のトレーニングシリーズでは、Azure Databricks を使ったデータレイクの構築方法、Databricks の機能、レイクハウスのデータに対する SQL クエリ、および、製品利用データを利用して機械学習モデルをトレーニングする方法を学べます。
さらに詳しく

Azure Databricks が選ばれる理由

Apache SparkTM ワークロードの性能 50 倍

高度に最適化された Spark を備え、最大 50 倍速の性能と自動スケーリングを可能にするコンピューティングクラスタの展開。
詳しく見る

1日あたりサーバー時間 = 数百万の規模に対応

Azure Databricks は、1 日当たりのサーバー時間が数百万時間、Azure リージョン数 34 以上の運用規模を有する数千社のお客様に利用されています。
詳しく見る

使いやすさ

Azure ポータルからのワンクリックスタート、Azure セキュリティとデータサービスとのネイティブ統合、データエンジニアリングとデータサイエンスの連携により、生産性を最大 25% 向上させます。
詳しく見る

業界別ユースケース

Azure Databricks のイベント

Azure Databricks のイベント

Databricks と Microsoft は、パートナー企業の協力のもと、お客様に Azure Databricks をより深く理解していただくためのイベントを開催します。イベントでは、急成長を見せているデータ・AI サービスの Azure 展開についての詳しい情報をご紹介します。ぜひご参加ください。詳細は下記のリンクをご覧ください。
詳しく見る

Azure 展開のための最適化

Azure Databricks は、専用コネクタを使用して Azure データストアおよびサービスとシームレスに統合し、データアクセスの高速化と管理の簡素化を可能にします。これにより、セキュリティの制御環境の管理、Azure 上のあらゆるデータの処理が容易になります。

主要な統合機能

Azure Databricks にサインインするには、Azure Active Directory(Azure AD)を使用したシングルサインオンが最適です。Azure Databricks は、Azure AD を利用する自動ユーザープロビジョニングをサポートしており、新規ユーザーの作成、適切なアクセス権限の付与、ユーザーの削除に伴うアクセスのプロビジョニング解除が可能です。

Azure Databricks の ADLS へのネイティブコネクタは、データレイクへの複数のアクセス方法をサポートしています。Azure Active Directory の認証情報パススルーにより、Azure Databricks へのアクセスと同一の Azure AD 認証が使用できるため、データアクセスのセキュリティ管理がシンプルになります。また、データアクセスは、事前に設定した ADLS のロールとアクセス制御リストによって管理されます。

Azure Data Factory(ADF)を使用して Azure Databricks のジョブをシームレスに実行し、90 以上のビルトインデータソースコネクタを活用して、全てのデータソースを単一のデータレイクに取り込みます。ADF は、ビルトインおワークフロー制御、データ変換、パイプラインのスケジューリング、データ統合など多くの機能を提供し、信頼性の高いデータパイプラインの作成を支援します。

Azure Databricks は、MLflow を介して Microsoft の Azure Machine Learning (AML)と統合して ML 実験を一元追跡し、Azure コンテナにモデルを展開してオンデマンド推論を実行します。また、Azure Databricks では、AML SDK を介した AML の自動機械学習機能の使用が可能です。

レイクハウス戦略に求められる主要な機能の 1 つは、データレイクのデータを BI ツールで直接、効率的かつセキュアに活用できることです。データレイクからデータウェアハウスにデータをコピーする従来のフローが不要になるため、余分なレイテンシ、コンピューティング、ストレージコストを回避できます。また、Power BI の Azure Databricks コネクタによって、データレイクに保存されているデータの、セキュアかつインタラクティブな視覚化が可能になります。

Azure Databricks は Azure DevOps と連携し、継続的インテグレーションと継続的デリバリー(CI/CD)の実施を支援します。また、Azure DevOps を Git プロバイダとして構成することで、バージョン管理機能を利用できます。

Azure Databricks の展開は、デフォルトでは、仮想ネットワーク(VNet)を含む Azure 上のフルマネージドサービスとなります。Azure Databricks は、ネットワークセキュリティルールの完全な制御を可能にする独自の仮想ネットワーク内での展開(VNet インジェクションとも呼ばれる)もサポートしています。

リアルタイムデータインジェストサービスの Azure Event Hubs を Azure Databricks に接続し、メッセージを受信した時点で処理することで、ライブストリーミングデータを分析できます。Event Hubs と Azure Databricksre の統合により、あらゆる IoT デバイスや Web サイトのクリックストリームのログからの毎秒数百万件のイベントのストリーミングおよびリアルタイム処理が可能になります。

Azure Key Vault との統合により、キーやパスワードなどの機密情報を管理します。デフォルトでは、全ての Azure Databricks のノートブックとその結果は保存時に別の暗号化キーで暗号化されます。暗号化キーを自分で管理する Bring Your Own Key (BYOK) 機能も利用できます。