メインコンテンツへジャンプ
<
ページ 2
>

Databricks Data + AI サミット 2024にGoogle Cloud登場!業界リーダーとパイオニアたちが集結!

June 7, 2024 ケイティ・カミスキー による投稿 in パートナー
これはDatabricksと Google クラウドの共同投稿です。 データ クラウドのパートナー マーケティング マネージャーで ある Nicole Huynh の 貢献に感謝します。 データ + AIサミット 2024: 今すぐ登録して、 6 月 10 日から 13 日まで開催される対面およびバーチャルイベントに参加し、グローバル...

Databricks Marketplaceに42社の新データプロバイダーが参入しました!(Q1 2024)

2023年6月、Databricks Marketplaceを、データ、分析、AIのすべてのニーズに応えるオープンマーケットプレイスとして、オープンなDelta Sharingプロトコルを活用して立ち上げました。これには、データセット、MLモデル、ノートブック、ソリューションアクセラレーターが含まれ、さまざまな業界のニーズに対応しています。 マーケットプレイスの目覚ましい成長を強調するために、新しい四半期シリーズを開始することに興奮しています。このシリーズでは、最新のリスティング、新しいプロバイダー、およびエキサイティングなノートブックを紹介します。 新しいデータプロバイダーのご紹介 この四半期では、42社の新しいプロバイダーが追加され、合計で200以上のデータプロバイダーになりました。これに加えて、200件の新しいリスティングを導入し、合計で1,900件以上のリスティングに達しました。 Databricks Marketplaceに追加された新しい5つの注目データプロバイダー 新しいデータプロバイダー40社以上

Azure Databricksが登場!Data + AI サミット 2024で業界リーダーとパイオニアが集結します。

June 6, 2024 ケイティ・カミスキー による投稿 in パートナー
これは Databricks と Microsoft の共同投稿です。 シニア製品マーケティングマネージャーの Mohini Verma 氏の 貢献に感謝します。 データ + AIサミット 2024: 今すぐ登録して、 6 月 10 日から 13 日まで開催される対面および仮想イベントに参加し、グローバル データ コミュニティから学びましょう。...

ShutterstockのコンテンツデータセットがDatabricks Marketplaceに登場!

今日のデータドリブンの世界では、視覚的な資産と分析機能の融合により、未開発の可能性の領域が開かれます。 画像データセットは、生成AI (GenAI) テクノロジの開発とトレーニングに不可欠です。 Shutterstock の画像の膨大なコレクションを Databricks Marketplace に 提供する画期的なコラボレーションを発表できることを嬉しく思います。これは、Marketplace におけるボリューム (非表形式) データセットの最初のリストです。 この無料サンプル データセットは、Shutterstock の 5 億 5000 万点以上の画像ライブラリから抽出された 1,000 枚の画像と付随するメタデータ ソース...

直感的かつパワフル!次世代のDatabricksノートブック

過去1年間、私たちはフィードバックに耳を傾け、新しいアイデアを試行錯誤してきました。その目的はただ一つ、データサイエンティスト、エンジニア、およびSQLアナリストのために、最高のデータ中心の開発体験を構築することです。そして本日、洗練されたモダンなインターフェースと強力な新機能を備えた次世代のDatabricksノートブックを発表できることを大変嬉しく思います。これにより、コーディングとデータ分析がさらに簡単になります。 主な 機能強化は次のとおりです。 最新のUX: 新しいノートブックUIとその他の機能のGAにより、コーディング体験がスムーズになり、ノートブックの整理が向上します。 新しい結果テーブル: 出力結果に対して直接検索やフィルタリングを実行し、コードなしでのデータ探索が可能です。 より強力なPython機能: ステップスルーのデバッガー、エラーの強調表示、強化されたコードナビゲーション機能を使用して、Pythonコードをより効率的に記述できます。 AIによる開発支援: Databricksアシスタント

Snowplowでデータチームを強化:ファーストパーティデジタルイベントデータ収集の新時代

顧客とのやり取りがますますデジタル領域に移行するにつれて、組織がオンライン顧客行動に関する知見を開発することがますます重要になります。 これまで、多くの組織はサードパーティのデータ収集業者に依存していましたが、プライバシーに関する懸念の高まり、データへのよりタイムリーなアクセスの必要性、カスタマイズされた情報収集の要件により、多くの組織がこの機能の社内への移行を進めています。 Snowplow などの顧客データ インフラストラクチャ (CDI) プラットフォームと Databricks のリアルタイム データ処理および予測機能を組み合わせることで、これらの組織は、より深く、より豊富で、よりタイムリーで、よりプライバシーに配慮した知見を開発し、オンライン顧客エンゲージメントの可能性を最大限に引き出すことができます (図 1)。 ただし、このデータの可能性を最大限に引き出すには、これらのデータがサードパーティのインフラストラクチャを介して流れていたときには行わなかった方法で、デジタル チームが組織のデータ エンジニア

Delta Sharingと新時代のレイクハウス顧客データプラットフォーム (CDP) の登場

このブログに貴重な知見と貢献を提供してくれた Amperity の Caleb Benningfield 氏と Sam Malissa 氏に特に感謝します。 今日、企業はプライバシー規制に準拠しながら、大規模なパーソナライゼーションを実現するために、より膨大で複雑な顧客データを処理しなければならないという大きな課題に直面しています。 これは、データ品質を優先し、効果的なガバナンスレイヤーを実装することを意味しますが、企業が依存していた既存のツールや方法では、この課題に対応できません。 この課題に対処するために、多くの企業がクラウドデータウェアハウスとデータレイクからデータレイクハウスアーキテクチャに移行しました。 データレイクハウスは、これまでのシステムの最高の機能を組み合わせて、企業がデータを保存および管理する方法を合理化し、貴重な知見に簡単にアクセスできるようにします。 では、次は何でしょうか? 次のフロンティアは、 Databricksと Delta Sharing 上に構築されます。これにより、レプリケー

Databricks向けSalesforce BYOM『Bring Your Own Model』を始めよう!

SalesforceとDatabricksは、強力な新しい統合「Salesforce Bring Your Own Model (BYOM) for Databricks」を提供するための 戦略的パートナーシップの拡大 を発表しました。このコラボレーションにより、データサイエンティストや機械学習エンジニアは、Salesforceの堅牢な顧客データとビジネス機能、およびDatabricksの高度な分析とAI機能をシームレスに活用できるようになります。この統合を使用すると、DatabricksでカスタムAIモデルを構築、トレーニング、デプロイし、それらをSalesforceに簡単に統合して、インテリジェントでパーソナライズされた顧客体験を提供することができます。データの可能性を最大限に引き出し、顧客とのエンゲージメントを革命的に変える準備を整えましょう。 仕組み Salesforce Data Cloudは、チームが多様なソースからデータを収集し、それを下流のSalesforce CRMアプリケーションやワークフロー

MLflowでGiskardを使ってLLMを評価しよう!

過去数年間、大規模言語モデル (LLM) は、トランスフォーマーベースのアーキテクチャと大規模なデータセットでの広範なトレーニングにより、自然言語の分野を再形成してきました。 特に、検索拡張世代(RAG)は著しい増加を経験しており、ベクトルデータベースとLLMを組み合わせて企業データを効果的に探索および検索するための一般的な方法に急速に普及しています。 一般的なアプリケーションとしては、顧客サポートボット、社内ナレッジグラフ、Q&A システムの開発などがあります。 しかし、この驚異的な進歩はさまざまな課題も生み出しており、最も顕著なものの 1 つは、生成された出力をテストおよび検証するという複雑な作業です。 ---- LLMのアウトプットの品質をどのように測定するのですか? ---- 慎重に作成されたプロンプトがうっかり対抗できなかった可能性のある隠れた脆弱性を明らかにするにはどうすればよいでしょうか? ---- 特定のユースケースに合わせてテスト、メトリック、敵対的プロンプトを自動的に生成するにはどうす

Delta Sharingで実現する安全なエンドツーエンドのコラボレーション

Reviewed by saki.kitaoka 現代のデジタル環境において、セキュアなデータ共有は運用効率とイノベーションに不可欠です。DatabricksとLinux Foundationは、データ、分析、AI全体でのデータ共有に対する初のオープンソースアプローチとして Delta Sharing を開発しました。Databricksは、安全なデータ交換を提供し、プラットフォーム、クラウド、地域をまたいだシームレスな共有を促進します。あらゆる規模の企業が、幅広いアプリケーションと多様なデータ形式をサポートするDelta Sharingを信頼しています。この柔軟性により、データ資産の可能性を最大限に引き出そうとする組織にとって信頼できるツールとなります。 本ブログでは、Databricks Delta Sharingのセキュリティアーキテクチャを、 Databricks顧客間共有(D2D) 、 Databricks顧客からオープン共有(D2O) 、クロスクラウドデータ共有の3つの異なる共有シナリオを通じて検討し