Databricks ブログ

ページ 27

Databricks モデルサービングの新たなアップデートで生成 AI アプリ開発を加速

May 9, 2024 アフマド・ビラル、Kasey Uhlenhuth による投稿 in 生成 AI

昨年、 Databricksモデルサービングにおける基盤モデルのサポートを開始し、企業が統合データおよび AI プラットフォーム上で安全でカスタマイズされた生成 AI アプリを構築できるようにしました。それ以来、何千もの組織がモデルサービングを使用して、独自のデータセットに合わせてカスタマイズされた生成 AI アプリを展開してきました。本日、生成 AI アプリの実験、カスタマイズ、展開を容易にする新しいアップデートを発表できることを嬉しく思います。これらの更新には、新しい大規模言語モデル (LLM) へのアクセス、より簡単な検出、よりシンプルなカスタマイズオプション、および改善されたモニタリングが含まれます。これらの改善により、生成 AI...

本番運用 - Databricksを使用した高品質の RAG アプリケーション

May 8, 2024 アキル・グプタ、オリバー・チウによる投稿 in データサイエンス・ML

12 月に、Databricks は Retrieval Augmented Generation (RAG) を使用して AI アプリケーションを本番運用するための新しいツールを発表しました。それ以来、 Databricks Data Intelligence Platform 上で何千もの顧客によって構築される RAG アプリケーションが爆発的に増加しています。本日、 DatabricksVector Searchの一般提供やモデルサービングのメジャーアップデートなど、...

データと AI でイノベーションの限界を押し広げる：Databricks データチームトランスフォーメーションアワード 2024 ファイナリストを発表

May 7, 2024 バベシュ・パテルによる投稿 in 導入事例

Data Team Awards は、さまざまなセクターの企業が最も差し迫った課題に直面するのを支援する上で、エンタープライズデータチームが果たす重要な役割を称えるものです。 200以上のノミネートがあり、最終選考に残った企業は、データと人工知能における目覚ましいイノベーションを披露しています。 Data + AI Summit が近づいており、Databricks はノミネートされたすべての企業の成功事例を共有できることを嬉しく思っています。 2024 年のトランスフォーメーションアワードは、データと AI を通じて組織を変革するために全力を尽くしたチームを表彰するために設けられる名誉ある賞であり、前例のない規模でこの変革を推進する変革の設計者を称えます。企業チーム内でのデータの役割を再考し、最先端のデータおよび AI テクノロジーを活用して、ビジネスモデル、ワークフロー、意思決定プロセスを根本的に変えています。彼らの仕事はトランスフォーメーションの本質を体現しており、データが戦略的イノベーション、オペ

Databricksで実現する高品質で信頼できるデータプロダクト作成法

May 6, 2024 アムル・アリ、ベルンハルト・ワルター、フラン・メディナ・カストロ、グレン・ウィービー、カーティク・スバラオ、Lexy Kassan、マグヌス・ピエール、パワリット・ラオスンタラによる投稿 in データ戦略

序章 AIやデータドリブンを目指す組織では、多くの場合、社内のチームに高品質で信頼できるデータを提供する必要があります。このようなデータプロダクトを構築することで、組織はデータと AI の目標に対する標準と信頼できるビジネス上で価値のある基盤を確立できるようになります。品質とユーザビリティを最優先するアプローチの 1 つは、データメッシュパラダイムを使用してデータ資産の所有権と管理を民主化することです。当社のブログ記事 ( パート 1 、パート 2 ) では、顧客が企業内でDatabricksを活用して、データメッシュの基本的な柱 (その 1...

通信、メディア、エンターテインメントにおけるデータガバナンスの重要な役割

May 6, 2024 ブライアン・サフトラーによる投稿 in 業界

データ分析とAIガバナンスは、データとAIの民主化の取り組みにおいて、おそらく最も重要でありながら最も難しい側面です。データ分析とAIのニーズに合わせて、ビジネスインテリジェンス用のデータウェアハウスとAI用のデータレイクという 2 つの異なるシステムを導入している可能性があります。そして今、それぞれが異なるガバナンスモデルを持つ2つのシステム間でデータを移動するデータサイロを作成しました。ただし、データはファイルやテーブルに限定されません。また、ダッシュボード、ML モデル、ノートブックなどの資産にはそれぞれ独自の権限モデルがあり、これらすべての資産に対するアクセス権限を一貫して管理することが困難になっています。データ資産が、アクセス管理ソリューションが異なる複数のクラウドに存在する場合、問題はさらに大きくなります。良いニュースです。データガバナンスを統合する方法があります。しかし、なぜ気にする必要があるのでしょうか? 堅牢なデータガバナンスがなければ、チームや企業はオーディエンスを完全に理解でき

概要：オープンな基盤モデルの台頭

May 3, 2024 ジョシュ・ハワードによる投稿 in データ戦略

生成 AI アプリケーションを概念実証段階から本番運用段階に移行するには、制御、信頼性、データガバナンスが必要です。組織は、モデルとトレーニングに使用するデータの両方をより厳密に管理することで、制御と出力へのより良い影響を与える能力を求めて、オープンソースの基盤モデルに注目しています。 Databricks は、何千ものお客様が生成 AI のユースケースを評価し、組織に最適なアーキテクチャを決定するのを支援してきました。当社の顧客は、多くの場合困難でコストがかかる、本番運用品質のAIモデルの構築と展開の課題を私たちと共有しています。その結果、ほとんどの CIO はモデルを本番運用に導入することに不安を感じています。これには、制御、所有権、品質の欠如、予測不可能なパフォーマンス、これらの基本モデルのスケーリングに関連する高いコストなど、さまざまな理由があります。私たちは顧客の行動の変化に気づきました。効率性の向上とコストの削減のために、オープンソースモデルを採用する組織が増えています。これに応えて、

スポーツにおけるデータ革命：Databricks Marketplace と Delta Sharing の画期的な影響

May 2, 2024 ライアン・スタンフォードによる投稿 in 業界

一瞬一瞬、あらゆるプレーが結果を左右する、変化の速いスポーツの世界では、高度な分析とリアルタイムデータ知見の必要性がかつてないほど重要になっています。スポーツ業界は、パフォーマンスを向上させ、ファンを惹きつけ、競争力を確保するための革新的な戦略を常に模索しています。 Databricks MarketplaceとDelta Sharing は、前例のないデータの取得、共有、コラボレーションを促進することで、スポーツアナリティクスの状況を一変させています。スポーツにおける Databricks Marketplace の力 Databricks Marketplace は、オープンソースの Delta Sharing 標準を利用した、データ、分析、AI のオープンマーケットプレイスです。これは、独自のプラットフォームや複雑な ETL プロセス、または高価なレプリケーションの制約なしに、組織が機械学習モデル、ノートブック、アプリケーション、ダッシュボードなどの膨大な資産にアクセスできる中央ハブとして機能します

データエンジニアのための Databricks Assistant のヒントとコツ

May 1, 2024 ジャッキー・ザン、ラフィー・カーランシック、リチャード・トムリンソンによる投稿 in 製品

生成AI革命はチームの働き方を変えつつあり、Databricks Assistantはこれらの進歩を最大限に活用しています。会話型インターフェイスを介してデータをクエリできるため、 Databricksワークスペース内での生産性が向上します。アシスタントは Databricks用のデータインテリジェンスエンジンであるDatabricksIQ を搭載しており、データのセキュリティを確保し、応答が正確で、企業の詳細に合わせて調整されていることを確認します。 Databricks Assistantを使用すると、タスクを自然言語で記述して、開発者のエクスペリエンスを中断することなく、複雑なコードを生成、最適化、またはデバッグできます。この投稿では、ブログ「 Databricks Assistantを最大限に活用するための5つのヒント」を拡張し、アシスタントが退屈な作業の排除、生産性と没入感の向上、価値実現までの時間の短縮によってデータエンジニアの生活をどのように改善できるかに焦点を当てます。さまざまなデータ

Databricks でコストの最適化と信頼性のバランスを賢く実現

May 1, 2024 ヴオン・グエン、ワシム・アフマドによる投稿 in 業界

Databricks データインテリジェンスプラットフォームは比類のない柔軟性を提供し、ユーザーはほぼ瞬時に水平方向にスケーラブルなコンピュートリソースにアクセスできます。この作成の容易さは、適切に管理されない場合、制御不能なクラウドコストにつながる可能性があります。オブザーバビリティを実装してコストを追跡し、チャージバック Databricks でコストを追跡およびチャージバックするために可観測性を効果的に使用する方法複雑な技術エコシステムを扱う場合、未知の要素を積極的に理解することが、プラットフォームの安定性を維持し、コストを管理するための鍵となります。オブザーバビリティ（可観測性）は、システムが生成するデータに基づいてシステムを分析および最適化する方法を提供します。これは、既知の問題を追跡するのではなく、新しいパターンを特定することに重点を置くモニタリングとは異なります。 Databricks のコスト追跡の主な機能タグ：タグを使用して、リソースと料金を分類します。これにより、よりきめ

モダンデータスタック：データアーキテクチャの進化がどのようにしてデータインテリジェンスプラットフォームをもたらしたのか

May 1, 2024 マニッシュ・アガルワルによる投稿 in データ戦略

モダンデータスタックは、データの量と複雑さが増加し続ける中で、データの収集、保存、分析の難しさに対処するために設計されています。ビジネスの成功がデータ主導の洞察とAIに依存するようになるにつれ、効果的で信頼性の高いデータ管理が不可欠です。では、モダンデータスタックとはどのようなもので、データ活用を最適化するためにどのように設計されているのでしょうか。モダンデータスタックとレガシーなデータスタックの違い、あらゆる業界のビジネスにもたらすメリット、データから成功を収めるために必要なモダンデータスタックツールについて理解しましょう。データとAIの目標を加速させる方法については、新しいエグゼクティブ・ガイドをご覧ください。モダンデータスタックとはどういう意味ですか？「データスタック」とは、生データを処理するさまざまなテクノロジーの集合体を指します。モダンデータスタックは、データの取り込み、整理、保存、変換に使用されるツールで構成されています。これらのツールは、データを「食べられないデータ」（扱えないデ