最近開催されたData + AI Summit 2024は、当社にとって過去最大規模のサミットとなりました。 16,000 名を超える主要顧客、見込み客、パートナーが直接参加し、さらに 40,000 名以上がバーチャルで視聴しました。 重要な製品発表、トレーニング、認定、パートナー紹介、そして数百のブレイクアウトセッションでいっぱいの 4 日間でした。 最も重要なことは、データと AI コミュニティ全体が団結して学習を共有し、ネットワークを構築し、成果を祝い、データと AI の将来に向けて協力し続ける機会となったことです。
サミットでは、CIO Circleの125人以上の参加者を含む、1,000人以上の技術系エグゼクティブがエグゼクティブフォーラムに集まりました。 Databricksの共同設立者と幹部は、10,000 を超える組織がデータ +AI 企業として成長できるよう支援してきた の経験から得た貴重な知見と教訓を共有しました。ここでは、エグゼクティブフォーラムでの講演の一部をご紹介します。
- Databricks の共同設立者兼フィールドエンジニアリング担当 SVP であるArsalan Tavakoli は、生成 AI の運用化における Compound AI の極めて重要な役割について説明し、現代のアーキテクチャにおけるオープン フォーマットと標準の重要性を強調しました。
- 当社の CIO である Naveen Zutshi は、Databricks の IT 部門が、ガバナンス、ウェアハウス、ETL 向けの当社製品の活用とテスト、そして生成 AI を活用して効率性を高める取り組みの最前線に立ってきたことを強調しました。
- 当社の学習およびイネーブルメント担当副社長である Rochana Golani は、データ中心の企業がスキル評価、ワークショップ、トレーニング、認定、卓越センターの設立を通じて、データと AI の文化を継続的に育成し、拡大していく方法について説明しました。
- 当社のフィールド CTO である Robin Sutara は、データ + AI 戦略を成功させるための強固な基盤を構築する上で、3 つの P (ピープル、プロセス、プラットフォーム) の重要性を強調しました。
お客様に最高のサービスを提供するために、当社はお客様のフィードバックに耳を傾け、最も差し迫った懸念に対処することを優先しています。 今年は、3つの重要なテーマが浮かび上がりました。
- 誰もが生成 AI を望んでいる:すべての組織が生成 AI を本番運用向けに実装したいと考えています。 しかし、これを達成するのは困難であり、 AIプロジェクトの 85% 以上が本番運用に到達できません。 顧客は、最新モデルの標準ベンチマークにはあまり関心がなく、これらのモデルが自社の企業データに対してどの程度のパフォーマンスを発揮するかに重点を置いています。 彼らは、プライバシーと反復機能を維持しながら、AI を迅速かつコスト効率よく安全に導入することを目指し、幻覚のない質の高い AI 応答を求めています。
- セキュリティとプライバシーが圧迫されている:生成 AI への関心と採用により、数多くの AI 関連の規制、訴訟、そして AI サイバー攻撃の新たな波が起こっています。 組織には、データとダッシュボードを超えて、モデル、テーブル、コネクタ、ノートブックなどのデータ資産全体を網羅する包括的なガバナンス ソリューションが必要です。
- データ資産は高度に断片化されている:企業は互換性のない独自の形式を持つ多くのプラットフォームとソフトウェア ソリューションを扱っています。 その結果、ベンダーロックイン、データサイロ、セキュリティとガバナ ンスに対する断片的なアプローチが発生し、低速で複雑で高価なデータプラットフォームにつながります。
Databricksでは、これらの課題に対処するためにデータ インテリジェンス プラットフォームを構築しました。これにより、顧客はベンダー ロックインや独自の形式にとらわれることなく、独自のエンタープライズ データのセキュリティとプライバシーを維持しながら、信頼性が高くコスト効率の高いデータとAIイニシアチブを本番運用に取り入れることができます。
以下は、DAIS 2024 で発表された主要な製品の概要です。
- Mosaic AI : 本番運用品質の複合AIシステムを構築および展開
Databricks Mosaic AI を、本番運用品質の複合AIシステムを構築、展開、評価、管理するための最適なプラットフォームとして確立する新しい機能を発表しました。 主な機能には、高品質の検索拡張生成 (RAG) およびエージェント アプリケーションを開発するための包括的なツールキットとワークフローであるMosaic AI Agent Frameworkと、プライベート データを使用してオープンソース 基盤モデルをファインチューニングするための強力なツールであるMosaic AI Model トレーニングが含まれます。 当社の生成 AI イノベーションの詳細については、こちらのブログをご覧ください。
- Unity Catalog オープンソース: 業界唯一のデータとAIのオープンカタログ
クラウドとプラットフォーム全体にわたるデータとAIガバナンスのための業界唯一の統合ソリューションとして、 Unity Catalogオープンになりました。 Unity Catalog OSS v0.1が本日リリースされ、オープンソースへの第一歩を踏み出しました。 この取り組みは、Databricks のオープン エコシステムへの取り組みを強化します。 ベンダー ロックインなしで顧客に必要な柔軟性と制御を提供し、データと AI のオープン カタログ標準の新しい時代を切り開きます。 詳細については、オープンソースUnity Catalogブログをご覧ください。
- Databricks + Tabular : 相互運用性の単一のオープンな共通標準
Apache Iceberg ™ のオリジナル作成者によって設立されたデータ管理会社 Tabular の買収により、 DatabricksにはDelta LakeとIcebergの第一人者が揃い、オープンソース コミュニティと緊密に連携して、これら 2 つの形式間の相互運用性と互換性を実現できるようになります。 Delta Lake UniForm は、Delta Lake、Iceberg、Hudi 間での相互運用性を提供します。 Iceberg REST Catalog APIをサポートしているため、企業はあらゆるデータに対して、使い慣れたアナリティクス エンジンとツールを簡単に使用できます。 Tabular の買収の詳細については、こちらのブログをご覧ください。
- Databricks AI/BI : リアルワールドデータのためのインテリジェントなアナリティクス
サミットでは、データのセマンティクスを深く理解し、誰でも自分でデータを分析できるように設計された革新的なビジネスインテリジェンス製品であるDatabricks AI/BIを紹介しました。 複合AIシステム上に構築されており、 Databricksプラットフォーム全体のデータのライフサイクル全体から知見を引き出します。 AI/BIは、2 つの補完的なエクスペリエンスを提供します。AI/BI ダッシュボードは、AI従来のBI 機能向けの 搭載のローコード ソリューションで、固定のビジネス上の質問に答えます。AI/BI Genie は、人間のフィードバックから継続的に学習し、より広範なビジネス上の質問に正確に答えるチャットのようなインターフェイスです。Databricks AI/BIビジネスインテリジェンス環境をどのように変革できるかをご覧ください。
- Databricks LakeFlow : データエンジニアリングのための統合されたインテリジェントなソリューション
Databricks LakeFlow、取り込み、変換、オーケストレーションのための単一の統合データエンジニアリング ソリューションであり、サーバーレス コンピュート上で本番運用データパイプラインを構築、運用、管理するために必要なすべてを提供します。 LakeFlow により、お客様はより新しく、より完全で、より高品質なデータをビジネスに提供できるようになると確信しています。 LakeFlow は、取り込み用の LakeFlow Connect から始まり、まもなくプレビューに入ります。 詳細については、Databricks LakeFlow ブログをご覧ください。
- Databricks Clean Rooms: データ分析とAIのためのプライバシー保護されたコラボレーション
Databricksでは、オープンな共有とコラボレーションを通じてデータとAIを民主化することに取り組んでいます。 Databricks Clean Rooms は、あらゆるクラウド上でプライバシーが保護されたコラボレーションを実現します。 当社の Delta Sharing プロトコルにより、安全なデータと AI 資産の共有が可能になり、イノベーションが促進されます。 Databricks Marketplace は、ユーザーを幅広いデータおよび AI リソースに結び付け、コラボレーションとイノベーションを促進します。 最近、Delta Sharing エコシステムに 12 社の新しいパートナーを迎え入れ、新機能と、近日公開予定の Databricks Clean Rooms のパブリック プレビューを発表できることを嬉しく思っています。 詳細については、データ共有とコラボレーションに関するブログをご覧ください。
これらは主要な製品発表のほんの一部です。 DAIS 2024 サイトで、その他のすべての製品の発表とリリース、基調講演、500 以上のセッションをご覧ください。生成 AI やデータウェアハウジングのベスト プラクティスから、ガバナンス、アーキテクチャ、データ戦略のベ スト プラクティスまで、 Databricks顧客、パートナー、 Databricks主要エキスパートによるあらゆる内容が取り上げられます。 今年は参加できませんでしたか? 次回の Data + AI Summit の日程は 2025 年 6 月 9 日から 12 日です。ぜひご予定に余裕を持ってお越しください。