Azure に展開した Delta Lake と SQL を利用することで、データレイクのクエリが容易になります。Delta Lake が可能にする、データの移動やコピー不要の SQL クエリ、および、Azure Databricks と Dela Lake の連携によるメリットについて、Web セミナーで詳しく解説しています。
詳しく見る
Azure Databricks は、一日当たりのサーバー時間が数百万時間、Azure リージョン数 30 以上の運用規模を有する数千社のお客様に利用されています。
詳しく見る
Databricks と Microsoft は、パートナー企業の協力のもと、お客様に Azure Databricks をより深く理解していただくためのイベントを開催します。イベントでは、急成長を見せているデータ・AI サービスの Azure 展開についての詳しい情報をご紹介します。ぜひご参加ください。詳細は下記のリンクをご覧ください。
詳しく見る
Azure Databricks にサインインするには、Azure Active Directory(Azure AD)を使用したシングルサインオンが最適です。Azure Databricks は、Azure AD を利用する自動ユーザープロビジョニングをサポートしており、新規ユーザーの作成、適切なアクセス権限の付与、ユーザーの削除に伴うアクセスのプロビジョニング解除が可能です。
Azure Databricks の ADLS へのネイティブコネクタは、データレイクへの複数のアクセス方法をサポートしています。Azure Active Directory の認証情報パススルーにより、Azure Databricks へのアクセスと同一の Azure AD 認証が使用できるため、データアクセスのセキュリティ管理がシンプルになります。また、データアクセスは、事前に設定した ADLS のロールとアクセス制御リストによって管理されます。
Azure Data Factory(ADF)を使用して Azure Databricks のジョブをシームレスに実行し、90 以上のビルトインデータソースコネクタを活用して、全てのデータソースを単一のデータレイクに取り込みます。ADF は、ビルトインおワークフロー制御、データ変換、パイプラインのスケジューリング、データ統合など多くの機能を提供し、信頼性の高いデータパイプラインの作成を支援します。
Azure Databricks は、MLflow を介して Microsoft の Azure Machine Learning (AML)と統合して ML 実験を一元追跡し、Azure コンテナにモデルを展開してオンデマンド推論を実行します。また、Azure Databricks では、AML SDK を介した AML の自動機械学習機能の使用が可能です。
Azure Databricks は、Azure Synapse と統合し、分析、ビジネスインテリジェンス(BI)、データサイエンスを Microsoft の最新のデータウェアハウスのソリューションアーキテクチャに統合します。Azure Databricks と Azure Synapse 間の高性能コネクタにより、ストリーミングデータのサポートなど、サービス間の高速データ転送が可能になります。
Azure Databricks は Azure DevOps と連携し、継続的インテグレーションと継続的デリバリー(CI/CD)の実施を支援します。また、Azure DevOps を Git プロバイダとして構成することで、バージョン管理機能を利用できます。
Azure Databricks の展開は、デフォルトでは、仮想ネットワーク(VNet)を含む Azure 上のフルマネージドサービスとなります。Azure Databricks は、ネットワークセキュリティルールの完全な制御を可能にする独自の仮想ネットワーク内での展開(VNet インジェクションとも呼ばれる)もサポートしています。
リアルタイムデータインジェストサービスの Azure Event Hubs を Azure Databricks に接続し、メッセージを受信した時点で処理することで、ライブストリーミングデータを分析できます。Event Hubs と Azure Databricksre の統合により、あらゆる IoT デバイスや Web サイトのクリックストリームのログからの毎秒数百万件のイベントのストリーミングおよびリアルタイム処理が可能になります。
Azure Key Vault との統合により、キーやパスワードなどの機密情報を管理します。デフォルトでは、全ての Azure Databricks のノートブックとその結果は保存時に別の暗号化キーで暗号化されます。暗号化キーを自分で管理する Bring Your Own Key (BYOK) 機能も利用できます。
データのリアルタイム処理により、顧客にとって意味のある製品・サービスを推薦
大規模で最速の DNASeq パイプラインによってテクノロジースタックを近代化し、患者や医師のエクスペリエンスを改善
完全な履歴データとリアルタイムのデータストリームを活用し、不審な金融取引を迅速に特定