メインコンテンツへジャンプ

コンテキストを認識するAIアシスタント、Databricks Assistantの紹介

Share this post

翻訳:Junichi Maruyama.  -  Original Blog Link

本日、Databricks Notebooks、SQLエディタ、ファイルエディタでネイティブに利用可能な、コンテキストを意識したAIアシスタント、Databricks Assistantのパブリックプレビューを発表します。Databricks Assistantを使えば、会話形式のインターフェイスでデータを照会することができ、Databricks内での生産性が向上します。タスクを英語で説明すると、アシスタントが SQL クエリを生成し、複雑なコードを説明し、エラーを自動的に修正します。アシスタントは、Unity カタログのメタデータを活用して、テーブル、カラム、説明、および会社全体で人気のあるデータ資産を理解し、あなたにパーソナライズされた応答を提供します。

データおよびAIプロジェクトの迅速な構築

SQLまたはPythonコードの生成

Databricks Assistant は Databricks の各編集画面にネイティブに統合されています。編集サーフェス (ノートブック、SQL エディタ、ファイルエディタ) に応じて、関連する SQL クエリや Python コードを返します。定型的なコードを書いたり、最初のコードを提供することで、プロジェクトを加速させることができます。その後、コードを実行したり、コピーしたり、新しいセルに追加して開発を進めることができます。

Build data and AI projects

オートコンプリートコードまたはクエリ

ノートブック・セルやクエリ・エディタの中からアシスタントを使用して、コード・スニペットを提案することができます。コメントを入力し、control + shift + space(Windows)またはoption + shift + space(Mac)を押すと、オートコンプリート候補が表示されます。

Autocomplete code

コード変換

アシスタントは、ある言語やフレームワークから別の言語にコードを変換することもできるので、常に現在のタスクに最適な言語を使うことができる。例えば、pandasのコードを書き直すことなくPySparkに変換することができます。

Transform code

コードまたはクエリの説明

Databricks Assistant は、複雑なコードやクエリをわかりやすく簡潔に説明します。不慣れなプロジェクトの理解を深めるのに役立ちます。

Databricks Assistant

問題の修正

Databricks Assistant はコード内のエラーを特定し、修正を推奨します。構文エラーのような問題が発生すると、アシスタントは問題を説明し、修正案を含むコードスニペットを作成します。

LakehouseIQ

お客様のためにパーソナライズされた、文脈に即した回答を得る

Databricks Assistantは、より正確で適切な結果を提供するために多くのシグナルを使用します。コードセル、ライブラリ、一般的なテーブル、Unity Catalogスキーマ、タグなどのコンテキストを使用して、自然言語による質問をクエリやコードにマッピングします。

将来的には、LakehouseIQとの統合を追加し、リクエストに対してさらに多くのコンテキストを提供する予定です。

Databricks Assistantが利用可能に

こちらの手順に従ってアシスタントを有効にしてください。アカウントをお持ちでない場合は、無料トライアルでDatabricksを始めることができます。

Databricks 無料トライアル

関連記事

LakehouseIQのご紹介: あなたのビジネスを独自に理解するAIエンジン

翻訳:Junichi Maruyama. - Original Blog Link 本日、LakehouseIQを発表いたします。LakehouseIQは、お客様のビジネスとデータのユニークなニュアンスを学習し、様々なユースケースで自然言語によるアクセスを可能にするナレッジエンジンです。LakehouseIQは、組織内のどの従業員でも自然言語でデータを検索、理解、照会することができます。LakehouseIQは、お客様のデータ、使用パターン、組織図に関する情報をもとに、専門用語や独自のデータ環境を理解し、素朴なLarge Language Models (LLM)よりもはるかに優れた回答を提供します。 ラージ・ランゲージ・モデルはもちろん、データに言語インターフェースをもたらすと約束されており、どのデータ会社もAIアシスタントを追加しているが、現実には、これらのソリューションの多くは企業データでは不十分である。どの企業も独自のデータセット、専門用語、ビジネス上の質問に答えるために必要な内部知識を持っており、質問に

Databricks + MosaicML

翻訳:Junichi Maruyama. - Original Blog Link 本日、私たちはMosaicMLの買収を完了したことをお伝えできることを嬉しく思います。MosaicMLは、企業向けにジェネレーティブAIモデルを作成し、カスタマイズするための先進的なプラットフォームです。Databricksの創業以来、私たちのミッションは、あらゆる企業のためにデータとAIを民主化することでした。MosaicMLと共に、ジェネレーティブAIアプリケーションのトレーニング、カスタマイズ、デプロイのためのクラス最高のエクスペリエンスを提供する予定です。 私たちはMosaicMLチームと協力し、ジェネレーティブAIを企業の主流にするために必要な3つの最も重要な開発を加速させます: モデル能力の迅速な民主化: 私たちは、すべての企業がモデルを広く利用できる未来を確信しています。あらゆるテクノロジーの民主化には、価格の引き下げとアクセスの向上が必要です。MosaicMLチームは、大規模な言語モデルのトレーニングとカスタマイズ

MetaのLlama 2とDatabricksでジェネレーティブAIアプリを構築する

翻訳:Junichi Maruyama. - Original Blog Link 本日、Meta社は最新の大規模言語モデル(LLM)である Llama 2 をオープンソースとして公開し、商用利用を開始した1。これはオープンソースAIにとって重要な進展であり、ローンチ・パートナーとしてMetaと協力できたことはエキサイティングでした。私たちは、Llama 2のモデルを事前に試すことができ、その能力とあらゆる可能性のあるアプリケーションに感銘を受けました。 今年初め、メタ社は LLaMA をリリースし、オープンソース(OSS)LLMのフロンティアを大きく前進させた。v1モデルは商用利用はできないが、生成AIとLLMの研究を大きく加速させた。 Alpaca と Vicuna は、高品質な指示フォローとチャットデータがあれば、LLaMAをChatGPTのように振る舞うようにファインチューニングできることを実証した。この研究結果に基づいて、Databricksは databricks-dolly-15k 命令追跡データセ
プラットフォームブログ一覧へ