プラットフォーム | Databricks Blog

ページ 20

Databricks SQLのマテリアライズド・ビューとストリーミング・テーブルの紹介

June 28, 2023 ポール・ラッパス、Michael Armbrust、Yannis Papakonstantinou、Nitin Sharma による投稿 in プラットフォーム

翻訳：Junichi Maruyama. - Original Blog Link AWSとAzure上の Databricks SQL でマテリアライズド・ビューとストリーミング・テーブルが公開されたことをお知らせできることを嬉しく思います。ストリーミングテーブルは、クラウドストレージやメッセージキューからの増分インジェストを提供します。マテリアライズド・ビューは、新しいデータが到着すると自動的にインクリメンタルに更新されます。これら2つの機能を組み合わせることで、インフラストラクチャを必要としないデータパイプラインが実現し、セットアップが簡単で、新鮮なデータをビジネスに提供することができます。このブログポストでは、アナリストやアナリティクス・エンジニアがデータウェアハウスでデータとアナリティクス・アプリケーションをより効果的に提供するために、これらの新機能がどのように役立つかを探ります。背景データウェアハウスとデータエンジニアリングは、データ駆動型の組織にとって極めて重要である。データウェアハウスはアナリ

Data and AI Summit 2023におけるUnityカタログの最新情報

June 28, 2023 Matei Zaharia、ジョナサン・ケラー、サチン・タクール、Michael Milirud、ポール・ルーム、トッド・グリーンスタイン、Kasey Uhlenhuth、Can Efeoglu、アドリアナ・イスパス、Cyrielle Simeone、エリカ・エーリ、アミット・カラ、Anum Rehman による投稿 in プラットフォーム

翻訳：Junichi Maruyama. - Original Blog Link データ管理に不可欠な、説明責任、コンプライアンス、品質、透明性といったガバナンスの基本原則は、今やAIにとっても同様に不可欠なものとなっています。Databricksは Unity Catalog で、クラウドとデータプラットフォームにわたるデータとAIガバナンスのための業界唯一の統合ソリューションをリリースすることで、先駆的なアプローチを取りました。組織はUnity Catalogを使用することで、あらゆるデータプラットフォームやクラウドでファイル、テーブル、MLモデル、ノートブック、ダッシュボードを安全に発見、アクセス、監視、コラボレーションすることができます。私たちは、 Lakehouse Federation 、 Governance for AI 、AIを活用したガバナンス（ Lakehouse Monitoring、Lakehouse Observability...

LakehouseIQのご紹介：あなたのビジネスを独自に理解するAIエンジン

June 28, 2023 Ali Ghodsi、Matei Zaharia、サム・シャー、ウェストン・ハッチンズ、Austin Green、エリカ・エーリによる投稿 in プラットフォーム

翻訳：Junichi Maruyama. - Original Blog Link 本日、LakehouseIQを発表いたします。LakehouseIQは、お客様のビジネスとデータのユニークなニュアンスを学習し、様々なユースケースで自然言語によるアクセスを可能にするナレッジエンジンです。LakehouseIQは、組織内のどの従業員でも自然言語でデータを検索、理解、照会することができます。LakehouseIQは、お客様のデータ、使用パターン、組織図に関する情報をもとに、専門用語や独自のデータ環境を理解し、素朴なLarge Language Models (LLM)よりもはるかに優れた回答を提供します。ラージ・ランゲージ・モデルはもちろん、データに言語インターフェースをもたらすと約束されており、どのデータ会社もAIアシスタントを追加しているが、現実には、これらのソリューションの多くは企業データでは不十分である。どの企業も独自のデータセット、専門用語、ビジネス上の質問に答えるために必要な内部知識を持っており、質問に

Lakehouse AI: Generative AIアプリケーション構築のためのデータ中心アプローチ

June 28, 2023 Patrick Wendell（パトリック・ウェンデル）、Matei Zaharia、クレイグ・ワイリー、Kasey Uhlenhuth、エリック・ピーター、プレム・プラカシュによる投稿 in プラットフォーム

翻訳: Masahiko Kitamura オリジナル記事: Lakehouse AI: a data-centric approach to building Generative AI applications ジェネレーティブAIは、あらゆるビジネスに変革をもたらすでしょう。Databricksは10年にわたりAIイノベーションのパイオニアとして、AIソリューションを提供するために何千ものお客様と積極的に協力し、月間1,100万ダウンロードを誇るMLflowのようなプロジェクトでオープンソースコミュニティと協力してきました。Lakehouse AIとそのユニークなデータ中心アプローチにより、私たちはお客様がスピード、信頼性、完全なガバナンスでAIモデルを開発・展開できるよう支援します。本日開催されたData and AI Summitでは、Lakehouse AIがお客様のジェネレーティブAI制作の旅を加速させる最高のプラットフォームとなるよう、いくつかの新機能を発表しました。これらのイノベーションには、V

UnityカタログにLakehouseフェデレーション機能を導入

June 28, 2023 Matei Zaharia、アンドリュー・リー、Can Efeoglu、Cyrielle Simeone、サチン・タクールによる投稿 in プラットフォーム

翻訳: Masahiko Kitamura オリジナル記事: Introducing Lakehouse Federation Capabilities in Unity Catalog データチームは、データの断片化、データの統合にかかる時間とコスト、多数のシステムにわたるデータガバナンスの管理の難しさなどが主な原因で、適切なデータに素早くアクセスするために多くの課題に直面しています。そのため、本日 Data+AI Summit で、組織が統一されたガバナンスを備えた、拡張性とパフォーマンスの高いデータメッシュアーキテクチャを構築できるUnity CatalogのLakehouse Federation機能を発表できることを嬉しく思います。 Unity Catalog は、データとAIのための統合ガバナンスソリューションを提供します。Unity CatalogのLakehouseフェデレーション機能により、MySQL、PostgreSQL、Amazon Redshift、Snowflake、Azure...

Lakehouse Apps のご紹介

June 21, 2023 Matei Zaharia、シャンク・ニヨギ、プレム・プラカシュによる投稿 in プラットフォーム

翻訳：Saki Kitaoka. Original Blog Link Lakehouse Apps は、Databricksのネイティブアプリケーションを構築する新しい方法です。Lakehouse Appsは、Databricksのセキュリティとガバナンス機能をフルに活用し、革新的なデータおよびAIアプリケーションを Databricks Lakehouse Platform 上で構築、配布、実行する最も安全な方法を提供します。データおよびAIソリューションを構築する開発者にとっては、Databricks Marketplaceを通じてLakehouse Appsを配布することで、10,000社を超えるDatabricksの顧客にアクセスでき、採用までの時間が劇的に短縮されます。お客様にとっては、Lakehouse Appsは、Lakehouse内のデータの価値を最大限に引き出し、Databricksネイティブサービスを活用し、新しい機能でDatabricksを拡張するアプリケーションを実行する最も安全な方法

Databricks Notebooksの新機能について

June 16, 2023 Jim Allen Wallace、Austin Ford、ウェストン・ハッチンズ、Neha Sharma による投稿 in プラットフォーム

翻訳：Junichi Maruyama. Original Blog Link Databricks Notebooksは、データチームやAIチームが効率的に共同作業を行えるオーサリングエクスペリエンスを開発者向けに提供しています。今月末に開催されるData + AI SummitでNotebooksのエキサイティングな新機軸を共有するために、このチームは懸命に働いています。 Weston HutchinsとNeha Sharmaが担当するセッション「 Develop Like a Pro in Databricks Notebooks 」にぜひご参加ください。ウォームアップとして、Notebooksに最近追加された機能を簡単に振り返ってみたいと思います。 SQLウェアハウスでDatabricks...

DatabricksとGoogle Cloudでリアルタイムデータ処理のパワーを解き放つ

June 15, 2023 リチャード・トムリンソンによる投稿 in プラットフォーム

Original Blog , 翻訳: junichi.maruyama Databricks Lakehouse Platform の Google Pub/Sub コネクタの正式リリースをお知らせします。この新しいコネクタは、外部データソースコネクタの広範なエコシステムに追加され、Databricksから直接Google Pub/Subに簡単に登録し、リアルタイムでデータを処理・分析することができます。 Google Pub/Sub connector を使用すると、Pub/Subトピックを介して流れる豊富なリアルタイムデータを簡単に利用することができます。IoTデバイスからのストリーミングデータ、ユーザーインタラクション、アプリケーションログなど、Pub/Subストリームをサブスクライブする機能は、リアルタイム分析および機械学習のユースケースの可能性を広げます：また、Pub/Subコネクタを使用して、Google Cloudからのリアルタイムデータを燃料とする低レイテンシーの運用ユースケースを推進する

ゲスト投稿： Laminiを使用してDatabricksのデータで独自のLLMをトレーニングする

June 14, 2023 Sharon Zhou による投稿 in プラットフォーム

Original : Guest Post: Using Lamini to train your own LLM on your Databricks data 翻訳：Junichi Maruyama これは私たちのスタートアップパートナーである Lamini からのゲスト投稿です。上の写真のLLMは、 Lamini のドキュメントで訓練されたものです。遊んでみてください。...

Welcome Rubicon to Databricks: これからのAIストレージとサービングシステムにむけて

June 13, 2023 Reynold Xin（レイノルド・シン）による投稿 in お知らせ

Original: Welcome Rubicon to Databricks: The Future of AI Storage and Serving Systems 翻訳: saki.kitaoka RubiconのチームがDatabricksに参加することを発表でき、大変嬉しく思っています。大規模インフラ構築者であるAkhil GuptaとSergei Tsarevによって設立されたRubiconは、AIのためのストレージシステムの構築に取り組むスタートアップです。私たちは10年以上前に、データとAIアプリケーションの構築を劇的に容易にすることを目標に、Databricksを会社としてスタートしました。私たちはすぐに、AIアプリケーションに必要なデータを処理するには、企業のデータウェアハウスなどの従来のストレージシステムでは不十分であることに気づきました。そこで、データウェアハウスとデータレイクストレージの長所を組み合わせたレイクハウスのコアストレージ基盤であるDelta Lakeを構築しました。 LL