メインコンテンツへジャンプ
<
ページ 12
>

ノートブック、ジョブ、パイプラインのサーバーレスコンピューティングにおけるコスト削減

私たちは最近、ノートブック、ジョブ、パイプラインのための サーバーレスコンピューティングの一般提供開始 を発表しました。サーバーレスコンピューティングは、ワークロードの迅速な起動、自動的なインフラストラクチャのスケーリング、およびDatabricksランタイムのシームレスなバージョンアップグレードを提供します。私たちはサーバーレスの提供における革新を続け、あなたのワークロードのための価格/パフォーマンスを継続的に改善することに専念しています。今日は、サーバーレスのコスト体験を改善するためのいくつかの発表を行うことを楽しみにしています: ほとんどの顧客、特に短期間のワークロードを持つ顧客にとって、 コストを25%以上削減 する効率改善。 強化されたコストの可視性 は、個々のノートブック、ジョブ、パイプラインレベルでの支出を追跡し監視するのに役立ちます。 ジョブとパイプラインに対して、 パフォーマンスよりもコストを最適化するという選択を示すことができる シンプルなコントロール(将来利用可能)。 新しいサーバーレスコン

強化されたワークフローUIがデバッグ時間を短縮し、生産性を向上

データチームは問題のトラブルシューティング、パッチの適用、失敗したワークロードの再起動に多くの時間を費やしています。エンジニアが一日中、自分のワークロードの調査とデバッグに費やすことは珍しくありません。 これで、データエンジニアが自分の仕事の問題を監視し、診断するのがより簡単になりました。これらの機能により、ジョブの実行が失敗したり、通常よりも長い時間がかかったりしたとき、失敗の理由を理解し、問題の根本原因を迅速に修復することができます。 タイムラインビューでのジョブの実行の視覚化 データエンジニアとして、ワークロードを最適化する最初のステップは、時間がどこで費やされているかを理解することです。複雑なデータワークフローでは、針を干草の山から探すような感じになることがあります。新しいタイムラインビューは、ジョブの実行をタイムライン上の水平バーとして表示し、タスクの依存関係、持続時間、ステータスを示します。これにより、DAGの実行におけるボトルネックや大幅な時間消費エリアを素早く特定することができます。タスクがどのよ

Databricks上で高度にスケーラブルなディープ推薦システムを訓練する(パート1)

推薦システム(RecSys)は、さまざまなプラットフォームでパーソナライズされたコンテンツの提案を支える現代のデジタル体験の不可欠な部分となっています。これらの洗練されたシステムとアルゴリズムは、ユーザーの行動、好み、アイテムの特性を分析し、興味のあるアイテムを予測し、推奨します。ビッグデータと機械学習の時代において、推薦システムは単純な協調フィルタリングのアプローチから、深層学習技術を活用する複雑なモデルへと進化しています。 これらの推薦システムをスケールすることは、特に何百万人ものユーザーや何千もの製品を扱う場合には、困難な場合があります。これを行うには、コスト、効率、精度のバランスを見つける必要があります。 このスケーラビリティの問題に対処する一般的なアプローチは、2段階のプロセスを含みます:初期の効率的な「広範な検索」に続いて、最も関連性の高いアイテムに対するより計算的に集中的な「狭範な検索」です。例えば、映画の推薦では、効果的なモデルはまず検索空間を数千からユーザーごとに約100項目に絞り込み、その後、

組織内の全員とAI/BIダッシュボードを共有する方法

Databricksでは、企業がデータを活用してビジネスプロセスを加速し、意思決定を強化することを簡単にすることを目指しています。 AI/BI は、Databricksプラットフォームにネイティブに統合されたAIファーストのビジネスインテリジェンス製品です。これは現在、 Databricks SQL のすべての顧客に利用可能です。 AI/BIダッシュボードは、組織全体で重要なビジネス指標、視覚化、洞察を安全に共有する強力な方法です。これらは、Databricksワークスペース内の他のユーザー、組織内の他のワークスペースのユーザー、およびDatabricksの 閲覧専用ユーザー (Databricksアカウントに追加されたが、ワークスペースには追加されていないユーザー)と共有できます。この記事では、組織全体でダッシュボードの共有を可能にするAI/BIダッシュボードの主要な機能について見ていきます。 共有可能なダッシュボードの作成 例から始めてみましょう。私たちは、販売機会を強調する例のダッシュボードを作成し、それを

電気自動車の未来への道

September 2, 2024 Sara Steffen による投稿 in
未来の世代が楽しむことができる世界を築くためには、私たちの運営方法を変える必要があります。この運動の最前線には、Rivianという電気自動車メーカーがあり、私たちの惑星のエネルギーと交通システムを完全に化石燃料から離れることに焦点を当てています。今日、Rivianのフリートには個人用車両が含まれており、Amazonとのパートナーシップを通じて100,000台の商用バンを提供しています。各車両はIoTセンサーとカメラを使用して、車両の運転方法から各部品の機能までのペタバイト単位のデータをキャプチャします。これらのデータを手元に持つことで、Rivianは機械学習を使用して、予測保守により全体的な顧客体験を改善し、潜在的な問題がドライバーに影響を与える前に対処しています。 Rivianが初めてEAVを出荷する前には、データの可視性とツールの制限が出力を減らし、協力を防ぎ、運用コストを増加させる問題に直面していました。一時期に30から50の大規模で運用上複雑な計算クラスターを持っていましたが、これはコストがかかりました。

ThomasがGenAIを使用して職場の協力を改善

September 2, 2024 Sara Steffen による投稿 in
40年以上にわたり、Thomasの中心的な理念は、企業が職場で人々が互いにどのように交流するかをよりよく理解することで、仕事の満足度と生産性を向上させることができるというものでした。人間科学の分野での影響を拡大し深めようとしたThomasは、伝統的なデータ管理と利用のアプローチに大きな障害に直面しました。彼らは、データワークフローの改善 - 取り込みと変換から分析、顧客と従業員向けのソリューションまで - をDatabricksに依頼しました。さらに、GenAIのベクター検索と取得拡張生成(RAG)を通じた統合は、コンテンツの検索可能性と自動コンテンツ生成をさらに向上させました。 従業員の評価をAI時代に持ち込む Thomasの基本的な心理測定評価モデルは、紙ベースのプロセスに根ざし、一対一の解釈に設計されていましたが、顧客基盤を拡大するにつれてますます制限が増えてきました。これらの伝統的な方法はスケールアップに苦労するだけでなく、現代の労働環境で必要な典型的なアプリケーションに接続されていませんでした。 会社と

データインテリジェンスを理解するための短いガイド

September 1, 2024 Databricksスタッフ による投稿 in
「データガバナンス」、「生成AI」、「大規模言語モデル」などの用語は、職場で一般的になりつつあります。 しかし、ビジネスリーダーにとっては、それらを会話やプレゼンテーションにただ散りばめるだけでは不十分です。彼らはこれらのトレンド、技術、そしてテクノロジーが実際に何を意味し、自分たちの組織の未来でどのような役割を果たすのかを理解しなければなりません。 私たちは、データインテリジェンスの主要な要素を定義し、リーダーに次世代のオペレーションを支えるバズワードを理解することがなぜ重要なのかを概説することで、お手伝いしたいと考えています。 データインテリジェンス: これは単なる情報以上のものです。データインテリジェンスとは、AIを用いて独自のデータから正確で関連性のあるユニークな洞察を抽出することです。これにより、新たな収益源の特定、従業員の生産性向上、効率的な運営など、市場での競争優位性を企業が築くのに役立ちます。 データのサイロ化: データインテリジェンスを動かすために必要な情報は、ビジネス全体のアプリケーションやシ

Databricksデータインテリジェンスプラットフォームに関するコミュニティのヒント

September 1, 2024 Databricksスタッフ による投稿 in
Databricksコミュニティ内には、コミュニティメンバーがデータ分析、データエンジニアリング、機械学習に関するベストプラクティス、チュートリアル、洞察を共有する技術ブログがあります。まだDatabricksコミュニティのメンバーでない場合は、 こちらをチェック してみてください。 今月は、Databricksデータインテリジェンスプラットフォームの新機能や機能を活用するためのヒントを提供する最近の技術ブログをいくつかハイライトしています。 マルチモデルLLM開発の簡素化:LiteLLMとDatabricksを使った開発者ガイド DatabricksとLiteLLMをどのように始め、LiteLLMとDatabricksがどのように補完し合い、litellm.completionを使用してDatabricks Foundation Models APIからモデルを呼び出すクイックスタート例。 新しいデータアナリスト:AIの時代にDatabricks GenieでBIを変革する アナリストがDatabricks G

Databricksマーケットプレイスの新規プロバイダー

Databricksマーケットプレイスは拡大を続け、現在では230以上のデータプロバイダーと2,200以上のリストが含まれています。 最近、40以上の新しいデータプロバイダーと100以上の新しいリストを追加しました。これには、マーケティング、不動産、ヘルスケア、AIの新しいプロバイダーとデータセットが含まれています。 最新のデータ協力パートナーを歓迎します: マーケティング&消費者洞察 Gain Dynamics は、スペインとラテンアメリカの消費者行動領域で公開およびオープンデータソースを提供します。彼らはスペインとラテンアメリカの200万世帯以上の行動を監視しています。 NCSolutions は、CPGの洞察を提供することでマーケターやメディア企業が広告のパフォーマンスを向上させるのを支援します。 金融と経済分析 OptionMetrics は、オプション、先物、ベータ、配当予測データベースを配布しており、組織が投資戦略を構築・テストし、実証研究を行い、リスクを評価することができます。 Stocktwits

Data + AI Summitのトップビジネスインテリジェンスセッション

企業が求める速度、効率、生産性で運営するためには、より多くの従業員が企業のユニークな運営に関する質問に対する正確で迅速でカスタマイズされた回答を必要とし、結果をシームレスに視覚化して組織全体で広く共有できるツールが必要です。それがデータインテリジェンス時代のビジネスインテリジェンスです。 最近開催されたData + AI Summitからのいくつかの注目セッションは、リーダーがデータインテリジェンスとその役割を理解し、全ての従業員に対するより良く、よりダイナミックなビジネスインテリジェンスを推進するのに役立ちます。 Databricks Data Intelligence Platform: 初級者向け概要 スピーカー: Ari Kaplan, Databricksのテクニカルエバンジェリストヘッド 私たちの代表的なソリューションに関する「101」コースは、AIとレイクハウスアーキテクチャがどのようにビジネスインテリジェンスを次のレベルに引き上げるかを理解しようとするすべての人にとって「必読」です。 すべての企業