Databricks Unity CatalogとTredence UnityGO!でデータ共有からビジネス価値をさらに向上させましょう!
企業のリーダーは、ビジネスチームが洞察力を高め、より良い意思決定を行い、イノベーションを加速するために活用できる高品質なデータの集中ソースを作成するために、 Databricks Data Intelligence Platform を活用しています。 最近の 調査では、最高データ責任者(CDO)は、明確で効果的なデータガバナンスの確立(51%)、データ品質の向上(48%)、高度なアナリティクス機能の構築と維持(42%)、ビジネスインテリジェンス機能の構築と維持(36%)、データ収益化機能の開発(21%)、データ、アナリティクス、人工知能(AI)倫理の向上(21%)を望んでいると回答しています。データ変革が最重要課題であることは明らかです。 歴史的に、データ、IT、セキュリティの各チームは、データの統一と民主化に関連する以下の課題に取り組んできました: データの保護と管理: 企業チームは、大規模な言語モデルやドメイン固有のモデルの導入を急いでおり、これらのモデルは広範なクリーンデータを必要とするため、データガバナ
Databricks Vector Search パブリックプレビューのご紹介
昨日 発表した RAG(Retrieval Augmented Generation )に続き、本日、Databricks Vector Searchのパブリックプレビューを発表します。6月に開催されたData + AI Summitでは、限られたお客様を対象としたプライベートプレビューを発表しましたが、今回はすべてのお客様にご利用いただけるようになりました。Databricks Vector Searchは、PDF、Officeドキュメント、Wikiなどの非構造化ドキュメントに対する類似検索を通じて、開発者がRAG(Retrieval Augmented Generation)や生成AIアプリケーションの精度を向上させることを可能にします。Vector Search は Databricks Data Intelligence Platform の一部であり、RAG およびジェネレーティブ...
Databricksで高品質のRAGアプリケーションを作成する
RAG(Retrieval-Augmented-Generation )は、独自のリアルタイムデータを LLM(Large Language Model) アプリケーションに組み込む強力な方法として、急速に台頭してきた。 本日Databricksユーザーが企業データを使用して高品質な本番LLMアプリケーションを構築するためのRAGツール群を発表できることを嬉しく思う。 LLMは、新しいアプリケーションを迅速にプロトタイプ化する能力において、大きなブレークスルーをもたらした。 しかし、RAGアプリケーションを構築している何千もの企業と仕事をした結果、彼らの最大の課題は、これらのアプリケーションを 本番で用いることができる品質にすること であることがわかった。 顧客向けアプリケーションに要求される品質基準を満たすためには、AIの出力は正確で、最新で、そして企業のコンテキストを認識し、安全でなければならない。 高品質なRAGアプリケーションを構築するためには、開発者はデータとモデル出力の品質を理解するための豊富なツール
米国最大級の自動車メーカーがDatabricksでデータをビジネス価値に変える
この記事は、 Kin + Carta のデータサイエンスディレクター、Andrew Mullinsとの共同執筆である。 テレマティクスから自動運転車に至る新技術の台頭により、自動車業界ではデータとAIがイノベーションの舵を切っており、メーカー各社は、革新的な技術を採用して正確かつ効率的に前に進むために急速にギアをシフトしている。その先頭に立つのは、16万5000人の従業員を擁し、自動車のエンジニアリング、設計、技術の限界に挑むことに注力しているアメリカ最大級の自動車メーカーである。 IT、データをフルに活用しようとする機知に富んだ他の企業同様、この米国の大手自動車会社も、大量にある未加工データを価値あるビジネス上の洞察に変える必要があることを認識していた。最新のクラウドプラットフォームとAIを搭載したデータソフトウェアを組み合わせることで、同ブランドはデータをより適切に管理できるようになっただけでなく、自社の製品に適していると思われる箇所でイノベーションを推進することもできるようになった。 データドリブンのモダナ
Databricksの中東展開とAzureカタールのローンチを発表
私たちは、Azureカタールの提供開始を発表できることを嬉しく思います。Azure Databricksの利用可能範囲が拡大されたことで、中東全域の 組織が Databricks Data Intelligence Platform を 活用し、 Azureのグローバルでスケーラブルかつ弾力性のあるネットワーク上で、 データエンジニアリング、データサイエンス、機械学習 、アナリティクスを統合することがこれまで以上に容易になりました。 AzureカタールリージョンにおけるDatabricksインフラストラクチャーのローンチは、カタール航空などの最も革新的で先進的なカタールの組織が、Azure Databricksを活用してデータドリブンなアプリケーションやユースケースでビジネスを変革することをサポートするものです。 今回の事業拡大は、カタールにおける当社の広範な関係を基盤としています。今月初め、カタール投資庁(QIA)は、ポストマネー評価額が430億ドルとなったDatabricksの シリーズI を通じて同社に投資
Delta Lakeを用いたバーコード・トレーサビリティによるリコール管理
最近のデータによると、製品の欠陥によるリコールキャンペーンは増加の一途をたどっている。さらに、風評リスクや事業継続リスクは、各リコールが「底なしの穴」であることのマイナス面の可能性を示している。製品リコールは、あらゆる規模の伝統的な製造企業だけの問題ではなく、製薬会社など製品を生産するあらゆる企業に関連する。この記事では、複数の生産工場の上にある中央のデルタ湖が、問題解決のサイクルタイムを短縮することで、影響を受ける被害を劇的に減らすのに役立つ理由を論じる。さらに、運用上の欠陥を検出するためにプロセスグラフを走査するための実例を含むソリューション・アクセラレータを紹介する。 効果的なリコール管理のためのデータ分析の課題と可能性 リコールについて メーカーが製品を生産し、顧客に出荷している状況において、重大な品質問題が発見され、どちらか一方か ら製品の返品を要求されることを製品リコールという。例えば、メルセデスは燃料ポンプに欠陥があったとして約14万4千台をリコールし( こちらを 参照)、BSHは爆発の恐れがあるガス
保険業界におけるDatabricks:Guidewire Marketplaceに掲載されました
DatabricksがGuidewire Marketplaceに掲載されたことを記念して、保険業界GTMディレクターのマルセラ・グラナドスとアライアンス担当シニアディレクターのジャスティン・フェントンが、『DatabricksがGuidewire Marketplaceに掲載されたことがなぜ保険会社にとって重要であるか』について対談しました。 ジャスティン: まずマルセラさんから、保険業界におけるDatabricksの現状について教えてください。導入状況はいかがですか?保険会社の顧客はDatabricksについてどのように考えていますか? マルセラ: もちろんです、ジャスティン!このようなお話をいただき、感激しています。2022年、私たちは保険のお客様の間でDatabricksの活用が大きく進化していることを目の当たりにしました。従来、DatabricksはETLエンジンとみなされ、その処理能力と計算上の優位性が評価されていました。しかし、Databricks製品の進化により、保険会社はエンドツーエンドのデ ータ
ヘルスケア領域におけるデータドリ ブン・タレントインテリジェンス戦略とは?
このブログは、People Data Labsのイノベーション担当副社長であるベン・アイゼンバーグ氏と、LinkUpのChief Revenue Officerであるトム・アシェンマッカー氏との共同執筆によるものです。 あらゆる業界において、優秀な人材に対する需要は常に供給を上回っている。 例えば、バイオテクノロジー業界では、data scientists から生物医学エンジニアに至るまで、あらゆる職務において高度に専門化されたスキルが要求される。 ITこの分野の爆発的な成長(最近の成長率は 79%であるのに対し、 他の職種は8%である)により、これらの組織が熟練労働者を最も必要としているのは当然のことである。 人事・採用チームは、最高の人材を調達し、惹きつけ、維持するための革新的なデータドリブンソリューションを常に模索している。 結局のところ、組織の競争力の源泉は、提 供する製品やサービスだけではないのだ。IT 、アイデアを実現する人的資本である。 マッキンゼーの調査に よると、 組織の上位25~50の役割が、企
Partner Connectに新たに5つのインテグレーションを追加しました
Databricks Data Intelligence Platform のデータでパートナーソリューションを使用し、ビジネス要件に最適なものをシームレスに採用できるようにするワンストップポータルであるDatabricks Partner Connect に、新たに5つのインテグレーションを追加し、みなさまに紹介できることを嬉しく思っています。 この四半期で、Data Ingestionカテゴリに3社、Data GovernanceとMachine Learningの両方に1社のパートナーを追加しました。また、Partner Connectの機能を拡張し、パートナー製品の本番環境との直接統合をサポートするように なりました。 これは何を意味しているのでしょうか? Monte Carlo との統合は、これらの機能を活用しており、Databricksから Monte Carlo のアカウントに直接接続し、本番データパイプラインの品質監視を開始することができます。これは、エコシステム内のデータとAIツールへの接続をこれ
ヘルスケア領域におけるPHIデータのガバナンスの自動化
背景:データデリバリーの近代化 今日の企業のデータ資産は、10年前とは大きく異なっています。各業界のアナリティクスは、モノリシックなデータプラットフォーム(リレーショナル・データベースやデータウェアハウス・アプライアンスなど)から、分散型でスケーラブルな、ほぼ無限のコンピューティングおよびストレージ機能(データレイクなど)へと移行しています。また、データは指数関数的なペースで増加しており、相互運用性の新たな機能を推進し、これまで以上に接続されたエコシステムを構築し、データが私たちの生活様式を形成する新たな機会を引き出しています。 データ資産のこの劇的な変化は、急速なペースで指数関数的なデータ配信の課題に対応するための新しい方法を見つける必要性をチームに促しています。その結果、 データメッシュ のようなフレームワークが人気を博し、成功を収めています。その中核となるデータメッシュは、セルフサービスによるデータデリバリーでビジネスチームのボトルネックを軽減し、「データを製品として」扱うことで、データインサイトの最大化を