メインコンテンツへジャンプ

最近開催されたData + AI Summit 2024は、当社にとって過去最大規模のサミットとなりました。 16,000 名を超える主要顧客、見込み客、パートナーが直接参加し、さらに 40,000 名以上がバーチャルで視聴しました。 重要な製品発表、トレーニング、認定、パートナー紹介、そして数百のブレイクアウトセッションでいっぱいの 4 日間でした。 最も重要なことは、データと AI コミュニティ全体が団結して学習を共有し、ネットワークを構築し、成果を祝い、データと AI の将来に向けて協力し続ける機会となったことです。

サミットでは、CIO Circleの125人以上の参加者を含む、1,000人以上の技術系エグゼクティブがエグゼクティブフォーラムに集まりました。 Databricksの共同設立者と幹部は、10,000 を超える組織がデータ +AI 企業として成長できるよう支援してきた の経験から得た貴重な知見と教訓を共有しました。ここでは、エグゼクティブフォーラムでの講演の一部をご紹介します。

  • Databricks の共同設立者兼フィールドエンジニアリング担当 SVP であるArsalan Tavakoli は、生成 AI の運用化における Compound AI の極めて重要な役割について説明し、現代のアーキテクチャにおけるオープン フォーマットと標準の重要性を強調しました。
  • 当社の CIO である Naveen Zutshi は、Databricks の IT 部門が、ガバナンス、ウェアハウス、ETL 向けの当社製品の活用とテスト、そして生成 AI を活用して効率性を高める取り組みの最前線に立ってきたことを強調しました。
  • 当社の学習およびイネーブルメント担当副社長である Rochana Golani は、データ中心の企業がスキル評価、ワークショップ、トレーニング、認定、卓越センターの設立を通じて、データと AI の文化を継続的に育成し、拡大していく方法について説明しました。
  • 当社のフィールド CTO である Robin Sutara は、データ + AI 戦略を成功させるための強固な基盤を構築する上で、3 つの P (ピープル、プロセス、プラットフォーム) の重要性を強調しました。

お客様に最高のサービスを提供するために、当社はお客様のフィードバックに耳を傾け、最も差し迫った懸念に対処することを優先しています。 今年は、3つの重要なテーマが浮かび上がりました。

  • 誰もが生成 AI を望んでいる:すべての組織が生成 AI を本番運用向けに実装したいと考えています。 しかし、これを達成するのは困難であり、 AIプロジェクトの 85% 以上が本番運用に到達できません。 顧客は、最新モデルの標準ベンチマークにはあまり関心がなく、これらのモデルが自社の企業データに対してどの程度のパフォーマンスを発揮するかに重点を置いています。 彼らは、プライバシーと反復機能を維持しながら、AI を迅速かつコスト効率よく安全に導入することを目指し、幻覚のない質の高い AI 応答を求めています。
  • セキュリティとプライバシーが圧迫されている:生成 AI への関心と採用により、数多くの AI 関連の規制、訴訟、そして AI サイバー攻撃の新たな波が起こっています。 組織には、データとダッシュボードを超えて、モデル、テーブル、コネクタ、ノートブックなどのデータ資産全体を網羅する包括的なガバナンス ソリューションが必要です。
  • データ資産は高度に断片化されている:企業は互換性のない独自の形式を持つ多くのプラットフォームとソフトウェア ソリューションを扱っています。 その結果、ベンダーロックイン、データサイロ、セキュリティとガバナンスに対する断片的なアプローチが発生し、低速で複雑で高価なデータプラットフォームにつながります。

Databricksでは、これらの課題に対処するためにデータ インテリジェンス プラットフォームを構築しました。これにより、顧客はベンダー ロックインや独自の形式にとらわれることなく、独自のエンタープライズ データのセキュリティとプライバシーを維持しながら、信頼性が高くコスト効率の高いデータとAIイニシアチブを本番運用に取り入れることができます。

以下は、DAIS 2024 で発表された主要な製品の概要です。

  • Mosaic AI : 本番運用品質の複合AIシステムを構築および展開

    Databricks Mosaic AI を、本番運用品質の複合AIシステムを構築、展開、評価、管理するための最適なプラットフォームとして確立する新しい機能を発表しました。 主な機能には、高品質の検索拡張生成 (RAG) およびエージェント アプリケーションを開発するための包括的なツールキットとワークフローであるMosaic AI Agent Frameworkと、プライベート データを使用してオープンソース 基盤モデルをファインチューニングするための強力なツールであるMosaic AI Model トレーニングが含まれます。 当社の生成 AI イノベーションの詳細については、こちらのブログをご覧ください。
     
  • Unity Catalog オープンソース: 業界唯一のデータとAIのオープンカタログ

    クラウドとプラットフォーム全体にわたるデータとAIガバナンスのための業界唯一の統合ソリューションとして、 Unity Catalogオープンになりました。 Unity Catalog OSS v0.1が本日リリースされ、オープンソースへの第一歩を踏み出しました。 この取り組みは、Databricks のオープン エコシステムへの取り組みを強化します。 ベンダー ロックインなしで顧客に必要な柔軟性と制御を提供し、データと AI のオープン カタログ標準の新しい時代を切り開きます。 詳細については、オープンソースUnity Catalogブログをご覧ください。
     
  • Databricks + Tabular : 相互運用性の単一のオープンな共通標準

    Apache Iceberg ™ のオリジナル作成者によって設立されたデータ管理会社 Tabular の買収により、 DatabricksにはDelta LakeとIcebergの第一人者が揃い、オープンソース コミュニティと緊密に連携して、これら 2 つの形式間の相互運用性と互換性を実現できるようになります。 Delta Lake UniForm は、Delta Lake、Iceberg、Hudi 間での相互運用性を提供します。 Iceberg REST Catalog APIをサポートしているため、企業はあらゆるデータに対して、使い慣れたアナリティクス エンジンとツールを簡単に使用できます。 Tabular の買収の詳細については、こちらのブログをご覧ください。
     
  • Databricks AI/BI : リアルワールドデータのためのインテリジェントなアナリティクス

    サミットでは、データのセマンティクスを深く理解し、誰でも自分でデータを分析できるように設計された革新的なビジネスインテリジェンス製品であるDatabricks AI/BIを紹介しました。 複合AIシステム上に構築されており、 Databricksプラットフォーム全体のデータのライフサイクル全体から知見を引き出します。 AI/BIは、2 つの補完的なエクスペリエンスを提供します。AI/BI ダッシュボードは、AI従来のBI 機能向けの 搭載のローコード ソリューションで、固定のビジネス上の質問に答えます。AI/BI Genie は、人間のフィードバックから継続的に学習し、より広範なビジネス上の質問に正確に答えるチャットのようなインターフェイスです。Databricks AI/BIビジネスインテリジェンス環境をどのように変革できるかをご覧ください。
     
  • Databricks LakeFlow : データエンジニアリングのための統合されたインテリジェントなソリューション

    Databricks LakeFlow、取り込み、変換、オーケストレーションのための単一の統合データエンジニアリング ソリューションであり、サーバーレス コンピュート上で本番運用データパイプラインを構築、運用、管理するために必要なすべてを提供します。 LakeFlow により、お客様はより新しく、より完全で、より高品質なデータをビジネスに提供できるようになると確信しています。 LakeFlow は、取り込み用の LakeFlow Connect から始まり、まもなくプレビューに入ります。 詳細については、Databricks LakeFlow ブログをご覧ください。
     
  • Databricks Clean Rooms: データ分析とAIのためのプライバシー保護されたコラボレーション

    Databricksでは、オープンな共有とコラボレーションを通じてデータとAIを民主化することに取り組んでいます。 Databricks Clean Rooms は、あらゆるクラウド上でプライバシーが保護されたコラボレーションを実現します。 当社の Delta Sharing プロトコルにより、安全なデータと AI 資産の共有が可能になり、イノベーションが促進されます。 Databricks Marketplace は、ユーザーを幅広いデータおよび AI リソースに結び付け、コラボレーションとイノベーションを促進します。 最近、Delta Sharing エコシステムに 12 社の新しいパートナーを迎え入れ、新機能と、近日公開予定の Databricks Clean Rooms のパブリック プレビューを発表できることを嬉しく思っています。 詳細については、データ共有とコラボレーションに関するブログをご覧ください。

これらは主要な製品発表のほんの一部です。 DAIS 2024 サイトで、その他のすべての製品の発表とリリース、基調講演、500 以上のセッションをご覧ください。生成 AI やデータウェアハウジングのベスト プラクティスから、ガバナンス、アーキテクチャ、データ戦略のベスト プラクティスまで、 Databricks顧客、パートナー、 Databricks主要エキスパートによるあらゆる内容が取り上げられます。 今年は参加できませんでしたか? 次回の Data + AI Summit の日程は 2025 年 6 月 9 日から 12 日です。ぜひご予定に余裕を持ってお越しください。

Databricks 無料トライアル

関連記事

Mosaic AI:本番運用のための複合AIシステムの構築とデプロイ

Translation Review by saki.kitaoka 過去1年間で、一般知識タスクにおける優れた推論能力を示す商用およびオープンソースの基礎モデルの急増を目の当たりにしました。 一般モデルは重要な構成要素ですが、実際のAIアプリケーションは、調整されたモデル、検索、ツールの使用、および推論エージェントなど、複数のコンポーネントを活用する 複合AIシステム が採用されることが多くなっています。AIシステムは基礎モデルを強化し、品質を大幅に向上させることで、顧客がこれらの生成AIアプリケーションを自信を持って運用に導入できるようにします。 本日、Data and AI Summitで、Databricks Mosaic AIが本格的なAIシステムを構築するための最良のプラットフォームとなる新機能を発表しました。これらの機能は、数千の企業と協力してAI駆動アプリケーションを運用に投入してきた経験に基づいています。本日の発表には、基礎モデルのファインチューニングのサポート、AIツールのエンタープライズカタ

Unity Catalogのオープンソース化を発表します!

Translation Review by saki.kitaoka Unity Catalogのオープンソース化を発表できることを非常に嬉しく思います。 これは、クラウド、データ形式、データプラットフォーム全体でデータとAIのガバナンスを行う業界初のオープンソースカタログです。ここでは、Unity Catalogビジョンの最も重要な柱をご紹介します: オープンソースのAPIと実装: OpenAPI仕様に基づいて構築され、Apache 2.0ライセンスのもとでオープンソースのサーバー実装があります。Apache HiveのメタストアAPIやApache IcebergのRESTカタログAPIとも互換性があります。 マルチフォーマットサポート: 拡張性があり、Delta Lake、UniForm経由のApache Iceberg、Apache Parquet、CSVなど、すべての形式をサポートします。 マルチエンジンサポート: オープンAPIを使用して、Unityにカタログされたデータはほぼすべてのコンピュートエン

Databricks + Tabular

私たちは、データマネジメント会社であるTabular, Incを買収することに合意したことを発表できることを非常に嬉しく思います。この会社はRyan Blue、Daniel Weeks、Jason Reidによって設立されました。この買収により、Apache Iceberg™のオリジナルの作成者と、Linux Foundation Delta Lakeの作成者たちが一堂に会することになります。これにより、データの形式に縛られることなくデータ互換性を実現するための道が開かれます。本ブログでは、短期的にはDelta Lake UniForm内で、長期的には単一でオープンかつ共通の相互運用性の標準へと進化させることを目指し、IcebergおよびDelta Lakeコミュニティと緊密に連携してフォーマット互換性を実現する方法について説明します。取引が完了次第、このチームを迎えることを楽しみにしており、オープンレイクハウスのビジョンに向けて共同で取り組むことに興奮しています。 レイクハウスアーキテクチャの台頭とフォーマット
データ戦略一覧へ