Databricks ブログ

ページ 49

Delta Live TablesとUnity Catalogを使用したガバメント・パイプラインの構築

June 28, 2023 ゾーイ・デュラン、Mukul Murthy、Jon Mio、Yuhong Chen による投稿 in プラットフォーム

翻訳: Masahiko Kitamura オリジナル記事： Build governed pipelines with Delta Live Tables and Unity Catalog Delta Live Tables（DLT）のUnity Catalogサポートのパブリックプレビューを発表できることを嬉しく思います。このプレビューにより、どのようなデータチームでも、Delta Live Tablesによって生成されたデータ資産に対して、きめ細かいデータガバナンスポリシーを定義し、実行することができます。私たちは、データエンジニアリングパイプラインにUnity Catalogのパワーをもたらします。パイプラインとDelta Live Tablesは、他のUnity...

レイクハウスのデータ共有とコラボレーションの新機能のご紹介

June 28, 2023 ザヒーラ・ヴァラニ、Steve Mahoney、ジェイ・バンカリア、ダルシャナ・シヴァクマール、エリカ・エーリ、サチン・タクール、ケリー・アルバノ、キャシー・ミャオによる投稿 in プラットフォーム

翻訳：Saki Kitaoka. - Original Blog Link Databricksは、データ、アナリティクス、AIを横断するデータ共有とコラボレーション( data sharing and collaboration )のための初のオープンソースアプローチを提供します。お客様は、ベンダーに依存することなく、プラットフォーム、クラウド、地域を超えて、ライブデータセット、AIモデル、アプリケーション、ノートブックを共有することができます。プロバイダーは、革新的なデータ製品を提供する機会を拡大することで、イノベーションを加速し、新たな収益源を生み出すことができます。この柔軟性は、 Delta Sharing を Databricks Unity Catalog と統合して、共有データセットへのアクセスを管理、追跡、監査することで、強固なセキュリティとガバナンスとともに実現されます。Lakehouse Collaboration Platformを進化させる新機能を発表できることを嬉しく思います。Datab

Databricks SQLのマテリアライズド・ビューとストリーミング・テーブルの紹介

June 28, 2023 ポール・ラッパス、Michael Armbrust、Yannis Papakonstantinou、Nitin Sharma による投稿 in プラットフォーム

翻訳：Junichi Maruyama. - Original Blog Link AWSとAzure上の Databricks SQL でマテリアライズド・ビューとストリーミング・テーブルが公開されたことをお知らせできることを嬉しく思います。ストリーミングテーブルは、クラウドストレージやメッセージキューからの増分インジェストを提供します。マテリアライズド・ビューは、新しいデータが到着すると自動的にインクリメンタルに更新されます。これら2つの機能を組み合わせることで、インフラストラクチャを必要としないデータパイプラインが実現し、セットアップが簡単で、新鮮なデータをビジネスに提供することができます。このブログポストでは、アナリストやアナリティクス・エンジニアがデータウェアハウスでデータとアナリティクス・アプリケーションをより効果的に提供するために、これらの新機能がどのように役立つかを探ります。背景データウェアハウスとデータエンジニアリングは、データ駆動型の組織にとって極めて重要である。データウェアハウスはアナリ

Data and AI Summit 2023におけるUnityカタログの最新情報

June 28, 2023 Matei Zaharia、ジョナサン・ケラー、サチン・タクール、Michael Milirud、ポール・ルーム、トッド・グリーンスタイン、Kasey Uhlenhuth、Can Efeoglu、アドリアナ・イスパス、Cyrielle Simeone、エリカ・エーリ、アミット・カラ、Anum Rehman による投稿 in プラットフォーム

翻訳：Junichi Maruyama. - Original Blog Link データ管理に不可欠な、説明責任、コンプライアンス、品質、透明性といったガバナンスの基本原則は、今やAIにとっても同様に不可欠なものとなっています。Databricksは Unity Catalog で、クラウドとデータプラットフォームにわたるデータとAIガバナンスのための業界唯一の統合ソリューションをリリースすることで、先駆的なアプローチを取りました。組織はUnity Catalogを使用することで、あらゆるデータプラットフォームやクラウドでファイル、テーブル、MLモデル、ノートブック、ダッシュボードを安全に発見、アクセス、監視、コラボレーションすることができます。私たちは、 Lakehouse Federation 、 Governance for AI 、AIを活用したガバナンス（ Lakehouse Monitoring、Lakehouse Observability...

LakehouseIQのご紹介：あなたのビジネスを独自に理解するAIエンジン

June 28, 2023 Ali Ghodsi、Matei Zaharia、サム・シャー、ウェストン・ハッチンズ、Austin Green、エリカ・エーリによる投稿 in プラットフォーム

翻訳：Junichi Maruyama. - Original Blog Link 本日、LakehouseIQを発表いたします。LakehouseIQは、お客様のビジネスとデータのユニークなニュアンスを学習し、様々なユースケースで自然言語によるアクセスを可能にするナレッジエンジンです。LakehouseIQは、組織内のどの従業員でも自然言語でデータを検索、理解、照会することができます。LakehouseIQは、お客様のデータ、使用パターン、組織図に関する情報をもとに、専門用語や独自のデータ環境を理解し、素朴なLarge Language Models (LLM)よりもはるかに優れた回答を提供します。ラージ・ランゲージ・モデルはもちろん、データに言語インターフェースをもたらすと約束されており、どのデータ会社もAIアシスタントを追加しているが、現実には、これらのソリューションの多くは企業データでは不十分である。どの企業も独自のデータセット、専門用語、ビジネス上の質問に答えるために必要な内部知識を持っており、質問に

Lakehouse AI: Generative AIアプリケーション構築のためのデータ中心アプローチ

June 28, 2023 Patrick Wendell（パトリック・ウェンデル）、Matei Zaharia、クレイグ・ワイリー、Kasey Uhlenhuth、エリック・ピーター、プレム・プラカシュによる投稿 in プラットフォーム

翻訳: Masahiko Kitamura オリジナル記事: Lakehouse AI: a data-centric approach to building Generative AI applications ジェネレーティブAIは、あらゆるビジネスに変革をもたらすでしょう。Databricksは10年にわたりAIイノベーションのパイオニアとして、AIソリューションを提供するために何千ものお客様と積極的に協力し、月間1,100万ダウンロードを誇るMLflowのようなプロジェクトでオープンソースコミュニティと協力してきました。Lakehouse AIとそのユニークなデータ中心アプローチにより、私たちはお客様がスピード、信頼性、完全なガバナンスでAIモデルを開発・展開できるよう支援します。本日開催されたData and AI Summitでは、Lakehouse AIがお客様のジェネレーティブAI制作の旅を加速させる最高のプラットフォームとなるよう、いくつかの新機能を発表しました。これらのイノベーションには、V

UnityカタログにLakehouseフェデレーション機能を導入

June 28, 2023 Matei Zaharia、アンドリュー・リー、Can Efeoglu、Cyrielle Simeone、サチン・タクールによる投稿 in プラットフォーム

翻訳: Masahiko Kitamura オリジナル記事: Introducing Lakehouse Federation Capabilities in Unity Catalog データチームは、データの断片化、データの統合にかかる時間とコスト、多数のシステムにわたるデータガバナンスの管理の難しさなどが主な原因で、適切なデータに素早くアクセスするために多くの課題に直面しています。そのため、本日 Data+AI Summit で、組織が統一されたガバナンスを備えた、拡張性とパフォーマンスの高いデータメッシュアーキテクチャを構築できるUnity CatalogのLakehouse Federation機能を発表できることを嬉しく思います。 Unity Catalog は、データとAIのための統合ガバナンスソリューションを提供します。Unity CatalogのLakehouseフェデレーション機能により、MySQL、PostgreSQL、Amazon Redshift、Snowflake、Azure...

DatabricksのLakehouseがTD銀行グループのデータ・トランスフォーメーションの新時代をどのように支えているか

June 22, 2023 Satish Narayanan、Jon Hollander、Paul Wellman、John Lynch による投稿 in 業界

このブログは、TD Bankのデータ・プラットフォーム変革およびDaaS（Data as a Service）組織の実現に関する3回シリーズの第1回です。Satish Narayanan氏、Paul Wellman氏、Jon Hollander氏に感謝します。翻訳：Saki Kitaoka. Original Blog Link TDでは、組織全体で信頼できるデータを保護し、活用することの重要性を認識しています。データはTDを「より良い銀行」にするために不可欠なものであり、お客様をサポートするために有意義な洞察とインパクトを生み出すデータの育成に注力しています。このようなデータの管理、処理、分析、対処は、しばしば複雑で時間のかかるものでした。今日の環境では、お客様のニーズや刻々と変化する市場の需要に対応するため、リアルタイムの意思決定と洞察が求められています。規制当局からの圧力や顧客からの要求の高まりにより、すべての組織はデータの管理と正確性をより厳しく管理する必要に迫られています。最近では、データの可用性を

Databricksを活用したジェットブルーにおけるイノベーションの加速

June 22, 2023 Sai Ravuru、ヤレド・グデタによる投稿 in 導入事例

This blog is authored by Sai Ravuru Senior Manager of Data Science & Analytics at JetBlue 翻訳：Junichi Maruyama. - Original Blog Link 航空業界におけるデータの役割には歴史があります。航空会社はメインフレームコンピュータの最初のユーザーの1つであり、今日、データの使用はビジネスのあらゆる部分をサポートするために発展してきました。データの質と量のおかげもあって、航空会社は世界で最も安全な交通手段のひとつとなっています。...

ヘルスケアの未来はデータコラボレーションにかかっている：IQVIAとDatabricks Lakehouseでどのようにより良いアウトカムが実現されるか

June 22, 2023 Bill Zanine、Michael Sanky、アダム・クラウンによる投稿 in 業界

Original Blog: The future of healthcare relies on data collaboration: how IQVIA and the Databricks Lakehouse enable better outcomes 翻訳: motokazu.ishikawa ヘルスケアデータを取り込み、統合し、共有する能力は、新たなイノベーションを推進し、医学研究を進め、患者のアウトカムを改善する上で基礎的な役割を果たします。世界中のすべての人が毎年約270 GBものヘルスケアおよびライフサイエンス・データを生成すると予想される中[...