プラットフォーム | Databricks Blog

ページ 9

Lakehouse FederationとLakeFlow ConnectのためのSalesforceコネクタの紹介

July 31, 2024 Can Efeoglu、Dan Zuckerberg、エリーゼ・ジョリス、ニコール・ブラウン、ライリー・マリス、サラ・ブランフマンによる投稿 in プラットフォーム

お客様がSalesforce CRMとData Cloudのデータからシームレスに洞察を得ることができる新たな統合を発表することを楽しみにしています。昨年、私たちは Salesforceとの戦略的パートナーシップを発表しました。それ以来、私たちはさまざまな面での統合を構築するために努力を続けてきました。2024年3月には、Salesforceは、 Salesforce Bring Your Own Model (BYOM) with Databricks （Databricks Mosaic Model Servingを基盤とする）と Databricks SQLウェアハウスとのZero Copy Data...

Databricksデータインテリジェンスプラットフォームで実現する責任あるAI

July 28, 2024 Lexy Kassan、Scott Starbird、オマール・カワジャ、Jonathan Frankle、サチン・タクール、アルン・パムラパティ、エリカ・エーリ、ケリー・アルバノ、Moe Steller による投稿 in プラットフォーム

人工知能（AI）の変革的な可能性は明白です。生産性の向上、コスト削減、そしてあらゆる業界での意思決定の改善に至るまで、AIはバリューチェーンを革新しています。特に2022年後半からの生成AIの登場、特にChatGPTのリリース以来、この技術に対する市場の関心と熱意はさらに高まっています。 McKinsey and Co. によると、生成AIの経済的潜在能力、つまりAIによって可能になるユースケースや労働者の生産性は、世界経済に17兆ドルから26兆ドルの価値をもたらす可能性があるとされています。この結果として、ますます多くの企業が、競争優位性を築くためにAIをビジネス戦略の中心に据えようとしています。ゴールドマン・サックス経済研究所は、2025年までにAIへの投資が米国で1,000億ドル、世界全体で2,000億ドルに達する可能性があると予測しています。しかし、企業がAIを導入する際には、AIの目標に対する信頼を確立するために、品質、セキュリティ、およびガバナンスをカバーする責任あるAIの実践を優先することが

Databricks における Databricks：Unity Catalog でガバナンスへの旅を始める

July 23, 2024 スアン・ワン、アルパン・ゴーシュ、ナブニート・カプールによる投稿 in プラットフォーム

Databricks のデータプラットフォームチームとして、私たちは独自のプラットフォームを活用して、直感的で構成可能な包括的なデータおよび AI プラットフォームを社内のデータ担当者に提供し、彼らが安全に使用状況を分析し、製品とビジネスオペレーションを改善できるようにしています。当社は成長するにつれて、安全でコンプライアンスに準拠した費用対効果の高いデータ運用を可能にするデータガバナンスを確立することに特に意欲を持っています。何千人もの従業員と何百ものチームがデータを分析しているため、大規模なデータガバナンスと継続的なコンプライアンスを達成するには、一貫した基準を構築して実装する必要があります。当社では、2022 年 8 月に一般公開された Unity Catalog (UC) を標準的なガバナンスプラクティスを確立するための基盤として特定し、社内レイクハウスの 100% を Unity Catalog に移行することが会社の最優先事項となりました。データガバナンスを実現するために...

Databricksレイクハウスモニタリングで高品質な予測を確保する

July 18, 2024 ピーター・パークによる投稿 in プラットフォーム

予測モデルは、多くの企業が将来のトレンドを予測するために重要ですが、その精度は入力データの品質に大きく依存します。データの品質が低いと、予測が不正確になり、最適な意思決定ができなくなる可能性があります。ここで、 Databricksレイクハウスモニタリングが登場します。これは、予測モデルに流入するデータの品質とモデルのパフォーマンス自体の両方を監視するための統合ソリューションを提供します。モニタリングは、予測モデルにとって特に重要です。予測は時系列データを扱うため、データの時間的コンポーネントとシーケンシャルな性質により、複雑さが増します。入力データの統計的プロパティが時間の経過とともに変化するデータドリフトなどの問題は、迅速に検出および対処しないと、予測精度を大幅に低下させる可能性があります。さらに、予測モデルのパフォーマンスは、予測値と実際の値を比較する平均絶対パーセント誤差 (MAPE) などのメトリクスによって測定されることがよくあります。ただし、グラウンドトゥルース値はすぐには利用でき

ノートブック、ワークフロー、Delta Live Tables 用のサーバーレスコンピューティングの一般提供開始のお知らせ

July 15, 2024 ビラル・アスラム、ルシアン・ポパによる投稿 in プラットフォーム

Translation Reviewed by Hiroyuki Nakazato ノートブック、ジョブ、Delta Live Tables（DLT）のサーバーレスコンピューティングが AWS および Azure で一般提供開始となりましたので、お知らせいたします。お客様は Databricks SQL および Databricks モデルサービング用の高速でシンプル、かつ信頼性の高いサーバーレスコンピューティングをすでに利用しています。同じ機能が、Apache Spark や...

Databricksがストリーム処理とクラウドデータパイプラインのリーダーとして認定

July 8, 2024 マット・ジョーンズ、Sonya Vargas、ケイリ・ベルリン、Ori Zohar による投稿 in プラットフォーム

データエンジニアリングとデータストリーミングの分野でDatabricksを評価する2つの新しいアナリストレポートを発表できることを誇りに思います： IDC MarketScape: Worldwide Analytic Stream Processing Software, 2024 (リーダー) Forrester Wave™: Cloud Data Pipelines, Q4 2023 (リーダー) IDCレポートはこちらから、Forresterレポートはこちらからダウンロードできます。...

Unity Catalogでの発見を加速！新しくなったカタログエクスプローラーの魅力

June 26, 2024 張宏毅、ジャック・レイディ、クリステン・ワイルダー、タオ・フェン、ケリー・アルバノによる投稿 in プラットフォーム

日々のやり取りを効率化するために改良されたカタログエクスプローラーが、Unity Catalog 対応のワークスペース全体で利用できるようになりました。カタログエクスプローラーは、 Unity Catalog での検出とガバナンスのプロセスを一元的に管理するツールとして機能し、すべてのデータとAIアセットを検索して管理できます。このブログでは、カタログエクスプローラーエクスペリエンスの 5 つの主要な更新内容 (新しいクイックアクセスエクスペリエンス、合理化されたナビゲーション、更新された資産概要ページ、リネージ保持の向上、エンティティリレーションシップダイアグラム) について説明します。クイックアクセスエクスペリエンスの更新新しいクイックアクセスセクションで簡単に作業に戻ることができます。...

Unity Catalogのオープンソース化を発表します！

June 13, 2024 Matei Zaharia、Ali Ghodsi、Reynold Xin（レイノルド・シン）、Arsalan Tavakoli-Shiraji（アルサラン・タバコリ・シラジ）、Patrick Wendell（パトリック・ウェンデル）による投稿 in プラットフォーム

Translation Review by saki.kitaoka Unity Catalogのオープンソース化を発表できることを非常に嬉しく思います。これは、クラウド、データ形式、データプラットフォーム全体でデータとAIのガバナンスを行う業界初のオープンソースカタログです。ここでは、Unity Catalogビジョンの最も重要な柱をご紹介します：オープンソースのAPIと実装: OpenAPI仕様に基づいて構築され、Apache 2.0ライセンスのもとでオープンソースのサーバー実装があります。Apache HiveのメタストアAPIやApache IcebergのRESTカタログAPIとも互換性があります。マルチフォーマットサポート: 拡張性があり、Delta Lake、UniForm経由のApache Iceberg、Apache Parquet、CSVなど、すべての形式をサポートします。マルチエンジンサポート: オープンAPIを使用して、Unityにカタログされたデータはほぼすべてのコンピュートエン

Databricks LakeFlowの登場: データエンジニアリングのための統一されたインテリジェントソリューション

June 13, 2024 Michael Armbrust、ビラル・アスラムによる投稿 in プラットフォーム

Translation Review by saki.kitaoka 本日、私たちはDatabricks LakeFlowを発表します。これは、プロダクションデータパイプラインを構築および運用するために必要なすべてを含む新しいソリューションです。MySQL、Postgres、SQL Server、Oracleなどのデータベースや、Salesforce、Microsoft Dynamics、NetSuite、Workday、ServiceNow、Google Analyticsなどの企業アプリケーション向けの新しいネイティブで高スケーラビリティのコネクタが含まれています。ユーザーは標準SQLおよびPythonを使用して、バッチおよびストリーミングでデータを変換できます。さらに、Apache Spark向けのリアルタイムモードを発表し、従来のマイクロバッチよりもはるかに高速なレイテンシでストリーム処理が可能になります。最後に、CI/CDを使用してワークフローをオーケストレーションおよびモニタリングし、本番環境にデプ

Data + AI Summit 2024：データ共有とコラボレーションの最新情報

June 13, 2024 ザヒーラ・ヴァラニ、Tianyi Huang、ダルシャナ・シヴァクマール、Giselle Goicochea、ハリッシュ・ガウルによる投稿 in プラットフォーム

Translation Review by saki.kitaoka Databricksでは、データとAIの民主化をミッションとしています。オープンなアプローチによる共有とコラボレーションは、そのリーチとインパクトを最大化するために重要です。当社のデータインテリジェンスプラットフォーム内では Delta Sharing オープンプロトコルが顧客のデータとAI資産の共有を簡単かつ安全にし、イノベーションを加速させます。サードパーティデータとのコラボレーションには、 Databricks Marketplace がすべてのデータ、分析、AIのニーズに対応するオープンマーケットプレイスを提供します。データパートナーのエコシステムが拡大する中で、さまざまなデータとAI資産を共有し、データ消費者がイノベーションを実現できるようにします。 Databricks Clean Rooms は、ビジネスがどのクラウド上でも安全な環境で簡単にコラボレーションできるプライバシー保護されたコラボレーションを提供します。先週、Delta