Databricks ブログ

ページ 26

DatabricksでのMosaic AI Vector Searchの一般提供開始を発表

May 21, 2024 セルゲイ・ツァレフ、オリバー・チウによる投稿 in データサイエンス・ML

検索拡張生成（RAG）用のツールスイートに関する発表に続き、本日、 Databricks での Mosaic AI Vector Search （ベクトル検索）の一般提供を発表できることを嬉しく思います。 Mosaic AI Vector Search とは何か? Vector Search を使用すると、開発者は PDF、Office ドキュメント、Wiki などの非構造化ドキュメントの類似性検索を通じて、検索拡張生成（RAG）...

Databricksアシスタントに自動補完機能が登場！

May 19, 2024 ジャッキー・ザン、ジェイソン・メッサー、キンバリー・マホーニーによる投稿 in 生成 AI

Databricks Assistant オートコンプリートのパブリックプレビューを発表できることを嬉しく思います。この機能は、リアルタイムでAI駆動のアシスタントがパーソナライズされたコード提案を提供します。ノートブックやSQLエディタに直接統合されており、Assistant Autocompleteの提案が開発の流れに自然に溶け込み、エディタに集中したまま作業を続けることができます。 AI によるコード提案で生産性を向上 Databricks Assistant オートコンプリートは、SQLおよびPythonでの入力中に自動的に高速なコード提案を提供します。AIコード補完は、現在のコードセルや周囲のコードセル、Unity Catalogメタデータ、DataFrameデータなどのコンテキストを使用して、入力中に非常に関連性の高い提案を生成します。 SQL Python Databricks Assistant Autocompleteを最大限に活用する方法 Databricks Assistant Autoc

Databricksプライベートエクスチェンジでデータ共有の可能性を解き放とう！

May 16, 2024 ハリッシュ・ガウル、ダルシャナ・シヴァクマール、萌えDerakhshani による投稿 in プラットフォーム

Databricksマーケットプレイスに、新しいエキサイティングな機能が追加され、すべてのDatabricksユーザーがプライベートエクスチェンジを簡単に設定できるようになりました。この機能により、プライベートエクスチェンジプロバイダーになることがこれまで以上に簡単になります。このブログ投稿では、Databricksマーケットプレイスのプライベートエクスチェンジ機能について深く掘り下げて解説します。さまざまなエクスチェンジメカニズム（パブリックマーケットプレイスとプライベートエクスチェンジ）を比較し、プライベートエクスチェンジプロバイダーになるプロセスを簡素化する新機能を詳しく見ていきます。プライベートエクスチェンジとパブリックマーケットプレイスの比較データ共有と収益化の進化する分野において、企業はデータやAIモデルを配布するための複数の方法を持っています。それぞれの方法は異なる利点を提供し、さまざまな戦略的ニーズに対応します。以下に、パブリックマーケットプレイスとプライベートエクスチェンジの2つのシナリオ

データインテリジェンスプラットフォーム上の半導体

May 16, 2024 デビッド・ロジャース、パウロ・ボルヘスによる投稿 in 業界

半導体業界では、研究開発タスク、製造プロセス、企業計画システムによって、さまざまなデータ成果物が生成され、それらを融合してインテリジェントな半導体企業を構築できます。インテリジェントなデータの使用により、インテリジェントな半導体企業は市場投入までの時間を短縮し、製造歩留まりを高め、製品の信頼性を強化します。

Databricks は Glassdoor の 2024 年ベストリーダーシップ企業に選出されました

May 15, 2024 Sam Plecque による投稿 in お知らせ

Databricks は、2024 年に初めて実施された Glassdoor Award のベストリーダーシップ企業リストで第 2 位にランクされたことを発表します。 Databricks では、最先端のテクノロジーを構築するだけでなく、透明性の文化を育んでいます。私たちのリーダーシップは、協調的で透明性の高い仕事の実践に対する社内のコミットメントを反映しています。 Databricks、Glassdoor のベストリーダーシップ企業に選出当社の CEO 兼共同創設者である Ali Ghodsi のリーダーシップは、真実の追求と第一原則の考え方に根ざしています。これらは、学術界における当社の起源に忠実であり続ける Databricks の...

大手ベンチャーキャピタル会社が Databricks で GenAI を構築する方法

May 14, 2024 コルトン・ペルティエによる投稿 in 生成 AI

GenAI アプリケーションをうまく構築するには、最先端の最新モデルを活用するだけでは不十分です。データ、モデル、インフラストラクチャを柔軟かつスケーラブルに統合し、本番運用に対応した複合AIシステムを開発する必要があります。これには、オープンソースモデルと独自モデルの両方、ベクターデータベースへのアクセス、モデルの微調整、構造化データのクエリ、エンドポイントの作成、データの準備、コストの管理、ソリューションの監視を行う機能が必要です。このブログでは、 Databricksへの投資も行っている大手ベンチャーキャピタル会社 (このブログでは「VC」と表記) の GenAI 変革について見ていきます。この VC は、社内でイノベーションを推進するだけでなく、将来の投資を導く GenAI アプリケーションを構築する機会をより深く理解したいと考えていました。この VC は、構造化ファンドデータから「 Databricksにいくら投資したか、現在の価値はいくらか」などの情報を照会する Q&A...

調査：Databricks Assistant による生産性の向上

May 14, 2024 サマンサ・バンチク、ジャッキー・ザン、リチャード・トムリンソンによる投稿 in 生成 AI

データサイエンスとエンジニアリングの急速に進歩する分野では、生産性を向上させるために人工知能 (AI) の統合が不可欠になっています。数多くのツールが登場し、データ実務者の生活を一変させ、複雑なタスクを容易にし、イノベーションを促進してきました。 2023 年 7 月に Databricks Assistant をパブリックプレビューでリリースしたとき、私たちはデータサイエンティスト、アナリスト、エンジニア間の効率を合理化することのみを目的として設計しました。この目標をどの程度達成しているかをよりよく理解するために、経験の異なる複数の組織のトップユーザーを対象に調査を行うことにしました。調査の目的 Databricks Assistant がデータプロフェッショナルに与える影響をより深く理解するために、幅広いユーザーエクスペリエンスを捉えられるようにこの調査を綿密に設計しました。このアンケートを実施した目的は、アシスタントがユーザーの日常生活に与える影響をよりよく理解するだけでなく、アシスタント

Mosaic AI TrainingでDBRX級のカスタムLLMを構築しよう！

May 14, 2024 アンナ・プフォール、チェン・リー、ミヒル・パテル、ワイ・ウー、ウィル・グライヒ、アジャイ・サイニ、ハゲイ・ルペスコによる投稿 in モザイクリサーチ

私たちは最近、 DBRX という最新の汎用LLM（大規模言語モデル）を発表しました。DBRXは、Mosaic AI Trainingを使用してトレーニング、ファインチューニング、および評価されました。トレーニングは3072台のNVIDIA H100を使用してスケーリングされ、処理したトークン数は12兆を超えました。 LLMのトレーニング、特にDBRXのようなMoE（専門家の集合）モデルのトレーニングは難しいです。これには、多くのインフラ、パフォーマンス、科学的な課題を克服する必要があります。Mosaic AI Trainingはこれらの課題に対応するために意図的に構築され、 DBRX 、 MPTシリーズのモデル、および Ola の Krutrim 、 AI2 の OLMo 、 Dynamo AIの...

Databricks で Text2SQL のパフォーマンスを簡単に向上

May 12, 2024 Matthew Hayes、エビオン・キム、Linqing Liu、アルヌール・アリ、Ritendra Datta、サム・シャーによる投稿 in 生成 AI

Databricksでの巧みなプロンプトとファインチューニングにより、Llama3 8B で Spider dev データセットの 79.9% に到達した方法。

データと AI で現状を打破：2024 年データチームディスラプター賞ノミネート者を称える

May 9, 2024 シェリダン・マクドナルドによる投稿 in 導入事例

毎年恒例の Data Team Awards は、ビジネス界が直面している最も一般的で複雑な問題のいくつかに、多様なエンタープライズデータチームがどのように取り組んでいるかにスポットライトを当てています。今年は、世界中のさまざまな業界から 200 以上のノミネートが寄せられました。 6 つの異なるカテゴリーにまたがるこれらのファイナリストは、組織がデータと AI の取り組みに適用する並外れた創造性と独創性を強調しています。私たちは、この画期的な成果をデータの専門家や愛好家のコミュニティと共有できることを嬉しく思っています。データチームディスラプターアワードは、各分野のデータ管理とアクティベーションへの取り組み方を根本的に変えているエンタープライズデータチームを表彰するものです。この賞は、現状に挑戦する人々を称えるものであり、データと AI をビジネス慣行に統合して、それぞれの業界で新しい基準を確立したチームに贈られます。以下は、2024...