生成 AI | Databricks Blog

ページ 4

革新を解き放て：DatabricksがジェネレーティブAIスタートアップチャレンジを発表！

September 18, 2024 アンドリュー・ファーガソン、Steve Sobel による投稿 in 生成 AI

Databricksを基盤にした画期的なGenerative AIのユースケースを持つ起業家やスタートアップですか？それなら、私たちのチャレンジに挑戦してみませんか？Databricksは、 Databricks Generative AI Startup Challenge を紹介することを大変嬉しく思います - これは、Generative AIの力を利用して実際の顧客の問題を解決する革新的な製品を開発している初期段階のスタートアップ向けの賞金総額が100万ドル以上のコンペティションであり、Databricks Data Intelligence Platformの力を活用しています。 Databricks Ventures と Databricks for Startups のスポンサーであり、AWSとの協力のもと、これはあなたが印象を残し、比類のない露出を得て、成功への道を加速するチャンスです。...

Mosaic AI Gatewayに高度なセキュリティとガバナンス機能が登場！

September 9, 2024 アフマド・ビラル、Kasey Uhlenhuth、アーチカ・ドグラによる投稿 in 生成 AI

私たちは、Mosaic AI Gatewayに新たな強力な機能を導入できることを嬉しく思います。これにより、お客様がAIイニシアチブをさらに簡単に、そしてセキュリティやガバナンスを強化しながら加速させることが可能になります。企業がAIソリューションの導入を急ぐ中で、セキュリティ、コンプライアンス、コストの管理がますます難しくなっています。そこで、昨年Mosaic AI Gatewayをリリースし、多くの企業がOpenAI GPT、Anthropic Claude、Meta Llamaモデルを含むさまざまなモデルのAIトラフィックを管理するために使用しています。今回のアップデートでは、使用状況の追跡、ペイロードログの記録、ガードレール設定といった高度な機能が追加され、Databricksデータインテリジェンスプラットフォーム内のあらゆるAIモデルに対してセキュリティとガバナンスを適用できるようになりました。このリリースにより、Mosaic AI Gatewayは最も機密性の高いデータやトラフィックに対しても、プ

重機メンテナンスへの洞察を革新するGenAI

September 5, 2024 Trevor Giannetti (Kubrick)、ヤヒヤ・ラディワラ（Kubrick）、ジャロン・ホルム（Kubrick）、神戸陳（キューブリック）、ヤレド・グデタによる投稿 in 生成 AI

重機械資産、例えば油田、農業用コンバイン、車両のフリートのメンテナンスは、グローバル企業にとって非常に複雑な課題をもたらします。これらの資産はしばしば世界中に広がっており、そのメンテナンススケジュールやライフサイクルは通常、企業全体のレベルで決定されます。主要なコンポーネントの故障は、1日あたり数百万ドルの収益損失をもたらすだけでなく、顧客への下流への影響も生じます。そのため、多くの企業が、これらの資産が毎日生成するテラバイト単位のデータから洞察を得るために、生成的AIに頼っています。これらの洞察は、停電を予測し、メンテナンス、修理、運用（MRO）のワークフローを改善することで、大幅な時間とコストの節約を実現するのに役立ちます。 Kubrick は、 Databricksのコンサルティングパートナーとして、業界を問わずクライアントと協力して、重機械のメンテナンス要件を予測し対応する能力を革新しています。これらの組織は、KubrickとDatabricksの技術と専門知識を活用することで、価値チェーン全体のビジネ

Databricksがエージェント評価の組み込みLLM判断に大幅な改善を発表

September 5, 2024 Max Marion、アルナヴ・シンヴィ、Samraj Moorjani、アヴェシュ・シン、マイケル・カービン、アルキス・ポリゾティスによる投稿 in 生成 AI

エージェント評価における改良された回答正確性判断機能エージェント評価は、Databricksの顧客がGenAIアプリケーションの品質を定義し、測定し、改善する方法を理解するのを可能にします。顧客データを扱う業界特有の文脈でのGenAIアプリケーションのML出力の品質を測定することは、新たな複雑さの次元を持っています：入力は複雑なオープンエンドの質問を含むことがあり、出力は文字列マッチングメトリクスを使用して参照回答と簡単に比較できない長い形式の回答になることがあります。エージェント評価は、2つの補完的なメカニズムでこの問題を解決します。最初の一つは、組み込みのレビューUI で、人間の専門家がアプリケーションの異なるバージョンとチャットして生成されたレスポンスにフィードバックを提供することができます。二つ目は、組み込みのLLMジャッジのスイートで、自動的なフィードバックを提供し、評価プロセスを大量のテストケースにスケールアップすることができます。組み込みのLLMジャッジは、生成された回答が参照回答に対し

Databricks上で高度にスケーラブルなディープ推薦システムを訓練する（パート1）

September 4, 2024 リスウィック・エディガ・ラカムサニ、アスファンディヤール・クレシ、Karan Jariwala、リン・ユアン、ル・ワン（モザイクAI）、Saaketh Narayan、Ning Wang による投稿 in 生成 AI

推薦システム（RecSys）は、さまざまなプラットフォームでパーソナライズされたコンテンツの提案を支える現代のデジタル体験の不可欠な部分となっています。これらの洗練されたシステムとアルゴリズムは、ユーザーの行動、好み、アイテムの特性を分析し、興味のあるアイテムを予測し、推奨します。ビッグデータと機械学習の時代において、推薦システムは単純な協調フィルタリングのアプローチから、深層学習技術を活用する複雑なモデルへと進化しています。これらの推薦システムをスケールすることは、特に何百万人ものユーザーや何千もの製品を扱う場合には、困難な場合があります。これを行うには、コスト、効率、精度のバランスを見つける必要があります。このスケーラビリティの問題に対処する一般的なアプローチは、2段階のプロセスを含みます：初期の効率的な「広範な検索」に続いて、最も関連性の高いアイテムに対するより計算的に集中的な「狭範な検索」です。例えば、映画の推薦では、効果的なモデルはまず検索空間を数千からユーザーごとに約100項目に絞り込み、その後、

Twelve Labs + Databricks Mosaic AIを用いた高度なビデオ理解のためのマルチモーダルAIの習得

August 28, 2024 James Le (Twelve Labs)、ニーナ・ウィリアムズ、オースティン・ザッコー、フェルナンダ・ヘレディアによる投稿 in 生成 AI

Twelve Labs Embed API は、開発者がセマンティックビデオ検索やデータキュレーションからコンテンツ推奨やビデオRAGシステムまでの高度なビデオ理解ユースケースを支えるマルチモーダル埋め込みを取得することを可能にします。 Twelve Labsを使用すると、ビデオ内の視覚的表現、ボディランゲージ、話された言葉、全体的なコンテキストの関係を捉えた文脈的なベクトル表現を生成することができます。Databricks Mosaic AI Vector Search は、高次元ベクトルのインデックス作成とクエリに堅牢でスケーラブルなインフラストラクチャを提供します。このブログ記事では、これらの補完的な技術を活用して、ビデオAIアプリケーションで新たな可能性を引き出す方法をガイドします。なぜTwelve Labs + Databricks Mosaic AIなのか？ Twelve Labs Embed APIをDatabricks Mosaic...

Mosaic AI Vector Searchのハイブリッド検索の一般提供を開始

August 26, 2024 セルゲイ・ツァレフ、エリック・リンドグレンによる投稿 in 生成 AI

Mosaic AI Vector Searchにおけるハイブリッド検索の一般提供開始を発表することを嬉しく思います。ハイブリッド検索は、事前に訓練された埋め込みモデルの強みとキーワード検索の柔軟性を組み合わせた強力な機能です。このブログ投稿では、ハイブリッド検索がなぜ重要で、どのように機能し、どのようにして検索結果を改善するためにそれを使用できるかを説明します。ハイブリッド検索の理由は何ですか？事前学習済みの埋め込みモデルは、非構造化データを表現する強力な方法であり、意味を圧縮し、簡単に検索可能な形式で捉えます。しかし、それは外部データを使用して訓練されており、あなたのデータについての明確な知識はありません。ハイブリッド検索は、ベクトル検索インデックスの上に学習したキーワード検索インデックスを追加します。キーワード検索インデックスはあなたのデータで訓練されており、そのため、あなたの検索状況に重要な名前、製品キー、その他の識別子についての知識を持っています。ハイブリッド検索を選ぶタイミングハイブリッド検索は

「Generative AI World Cup」の発表：Databricksによるグローバルハッカソン

August 13, 2024 ジャッキー・ザン、クリステン・スタフィエリ、ジューン・タン、リンダ・アブーブによる投稿 in 生成 AI

ようこそ、 Generative AI World Cup へ、これは参加者が実世界の問題を解決する革新的な生成AIアプリケーションを開発するためのグローバルハッカソンです。参加者は、総額50,000ドル以上の賞金、トロフィー、およびData + AI Summit 2025のパスを競います。参加者はまた、ハッカソンの過程で生成AIのスキルアップに役立つ資料も入手できます。参加して勝つ方法を学びましょう！誰が参加できますか？ Generative AI World Cupの参加資格は以下の通りです：参加者は、所属組織内でデータまたはAIに関する役割を担っている必要があります登録には法人のメールアドレスが必要ですチームは2人から4人で構成される必要があります Databricksのスタッフ、パートナー、コンサルタント、学生は対象外です参加者は20歳以上で、こちらにリストアップされている対象国のいずれかに居住している必要があります何を作るか...

ロールスロイスの画像生成に Databricks Mosaic AI のパワーを活用する

August 7, 2024 ジャック・ケレハー、マージョリー・アドリアンセンズ、プネート・ジャインによる投稿 in 生成 AI

ロールス・ロイスは、様々なAIプロジェクトにおいて Databricksデータインテリジェンスプラットフォームの変革的な力を目の当たりにしてきました。その一例として、ロールス・ロイスとDatabricksの協力プロジェクトがあります。このプロジェクトは条件付き敵対的生成ネットワーク（cGAN）の学習プロセスの最適化に焦点を当てており、 Databricks Mosaic AIツールを使用することの多くの利点を実証しています。このcGAN学習最適化の共同プロジェクトでは、チームは数値、テキスト、画像データの使用を検討しました。主な目標は、ロールス・ロイスの設計空間探索能力を向上させ、パラメトリックモデルの限界を克服することでした。これは、従来の形状モデリングとシミュレーションプロセスを必要とせずに、特定の設計条件を満たす革新的な設計コンセプトの識別と評価を推進するために、過去のシミュレーションデータを再利用できるようにすることで達成されました。ビデオを見る：ロールスロイスがクラウドベースの生成AI を使用

「Photon」で特徴量エンジニアリングを加速せよ！

August 2, 2024 チェン・イン、Xiao Zhu による投稿 in 生成 AI

高品質な機械学習モデルの訓練には、慎重なデータと特徴量の準備が必要です。Databricksにテーブルとして保存された生データをフルに活用するためには、ETLパイプラインの実行や特徴量エンジニアリングが必要となり、生データを有用な特徴量テーブルに変換することが求められます。テーブルが大きい場合、このステップは非常に時間がかかることがあります。今回、Databricks Machine Learning RuntimeでPhoton Engineを有効にできることを発表できることを嬉しく思います。これにより、Sparkジョブや特徴量エンジニアリングのワークロードを2倍以上高速化することが可能になります。「Photonを有効にし、新しいPITジョインを使用することで、私たちのフィーチャーストアを使用してトレーニングデータセットを生成するための時間が20倍以上短縮されました。」 - Sem Sinchenko, Advanced Analytics Expert Data Engineer, Raiffeisen