製品 | Databricks Blog

ページ 4

Data + AI Summitからのデータウェアハウジングのトレンド

August 30, 2024 Databricksスタッフによる投稿 in プラットフォームブログ

データ管理の急速に進化する風景の中で、データウェアハウジングは、データ資産の力を引き出そうとするビジネスにとって引き続き基石となっています。組織がデータ駆動型の洞察にますます依存するようになるにつれて、最新のデータウェアハウジングのトレンドは、より洗練された、スケーラブルで、安全なソリューションに向かってシフトしています。最近の Data + AI Summit では、データとAIのリーダーたちが集まり、データの未来を形成するトレンドと、組織がデータの効率とアクセシビリティを向上させるための新技術について議論しました。ここにいくつかのトップセッションを紹介します： Data + AI Summit 2024からのトップ5データウェアハウジングセッション AI/BI Genieの導入-ビジネスユーザー向けの新しい会話型分析体験スピーカー: Hanlin Sun、Chao Cai データ専門家として忙しいあなたは、質問に答えたり視覚化を作成したりするリクエストを実際に対応できる時間よりも多く受け取っている可能性

データインテリジェンスを用いて、すべての顧客に合わせた特別なコンテンツ体験を提供

August 30, 2024 Sara Steffen による投稿 in プラットフォームブログ

37以上の異なるブランドを持つグローバルメディアコングロマリットであるCondé Nastは、断片化したデータサイロの中で、ブランドごとにターゲットとした消費者体験を提供するという課題に直面していました。この障壁を克服し、競争力を維持するために、彼らはDatabricksに頼りました - 洞察への時間と意思決定を大幅に加速しました。さらに、グローバルスケールで一貫したレポートを提供する能力は、データの正確性と運用効率を向上させました。Databricksを使用することで、Condé Nastはインフラを最適化し、600万ドルのコスト削減を達成するだけでなく、多様な視聴者にパーソナライズされたコンテンツ体験を提供するための迅速性を向上させ、消費者のエンゲージメントとロイヤリティを強化しました。パーソナライゼーションの時代のデータサイロのナビゲーションメディア業界が進化するにつれて、消費者の期待も変化します。Vogue、The New Yorker、GQなどのグローバルブランドを持つメディアとエンターテイメントの

Databricksノートブックの画像：私の鮮やかな夏のインターンシップ

August 30, 2024 ケネス・チョイによる投稿 in プラットフォームブログ

このブログ投稿を書いている時点で、私はDatabricksの探索的データ分析（EDA）チームでの夏のインターンシップが終わるまであと一週間です。夏がこんなに早く過ぎ去ったなんて信じられません。まるで昨日のことのように、私がチームのリポジトリをクローンし、オンボーディングの仲間に助けを求めていたように感じます！12週間の間に、私は一つのテーマを基にした三つのプロジェクトフェーズを完成させました：Databricksノートブックで画像を操作するユーザーエクスペリエンスを改善すること。 Databricksノートブックあなたがコードを通じてデータと交流したことがあるなら、おそらくノートブックを使用したことがあるでしょう。ノートブックはPython、SQL、Scala、Rのコードエディタの一種で、データサイエンスや機械学習でデータを抽出し使用する手段として一般的です。データ＋AIの会社として、Databricksはプラットフォームと深く統合された独自のノートブックを顧客に提供しています。 Databricksノートブッ

Databricksコミュニティからのハイライト

August 30, 2024 Databricksスタッフによる投稿 in プラットフォームブログ

Databricksコミュニティ内には、コミュニティメンバーがデータ分析、データエンジニアリング、機械学習に関するベストプラクティス、チュートリアル、洞察を共有する技術ブログがあります。まだDatabricksコミュニティのメンバーでない場合は、こちらをチェックしてみてください。今月は、AIアプリの構築、モデルのプロンプト、データ分布のシフトの監視についてのヒントを提供する最近の技術ブログをいくつか紹介します。 8週間、2人の開発者、1つの本番AIカンファレンスアシスタント Databricksチームが最近のData + AI Summitで参加者がセッション、出展者、一般的なカンファレンス情報についての質問に答えるためのAIアシスタントをどのように構築したか。 Foundation Models APIプロンプトガイド1：プロンプトのライフサイクル Databricks Foundation Model APIを通じてアクセス可能なモデルのためのプロンプトツールとテクニック、例えばLlama 3。 MLO

2024年のデータ+AIワールドツアーへようこそ

August 30, 2024 Databricksスタッフによる投稿 in プラットフォームブログ

2024年のデータ+AIワールドツアーの開催を大変うれしく思います。これは、世界各地の都市で開催される無料の対面イベントの一連のシリーズです。各地でのイベントでは、その地域の最も重要な課題やユースケースに対応できるスピーカー陣を特別に揃えています。参加者が体験する内容の一部をご紹介します： Databricksデータインテリジェンスプラットフォームの最新の進歩を探求しましょう： Databricksの技術専門家、顧客、パートナーから、Databricksプラットフォームの最新の革新について聞くことができます。これには、GenAI、ビジネスインテリジェンス、データウェアハウジング、データガバナンスなどが含まれます。これらの技術は、地元の企業がデータとAIの戦略を大きく前進させるのを助けています。トレーニングやライブデモで知識を深めましょう私たちの製品とGenerative AI、データエンジニアリングなどのユースケースに深く潜り込むための現地トレーニングセッションに参加してください。また、あなたの近くの最

GenAI Journey：企業が一般目的からカスタムLLMへと進化している方法

August 30, 2024 Databricksスタッフによる投稿 in プラットフォームブログ

企業におけるGenAIについては、興奮が現実と衝突しています。リーダーたちはこの技術の力を認識し、自分たちの業務に熱心に適用したいと考えています。しかし、多くの人々が継続的なパフォーマンスの問題に悩まされています。企業は、広範で一般的なモデルがインターネットの広大なアーカイブを要約するように設計されているとき、自分たちのビジネスに関する特別な洞察を提供することが期待されるときには不十分であることを認識しています。現在、焦点はこれらのますます強力なシステムをビジネスの競争優位を支えるカスタマイズされたソリューションの基盤として使用することにあります。基礎からカスタマイズされたLLMへのこの道のりは、各企業で異なりますが、リーダーが求める正確で統制されたGenAIを開発者が提供するための新しいツールが必要となります。旅の理解ほとんどのビジネスでは、GenAIの旅は大きな基本的なモデルを試すことから始まります。これらは独自のモデルであるか、またはますますオープンソースのシステムである可能性があります。この初期

データエンジニアリングとGenAI：実践者が必要とするツール

August 30, 2024 Databricksスタッフによる投稿 in プラットフォームブログ

最近のMIT Tech Review Reportによると、調査対象の組織の71％が自社のGenAIモデルを構築する予定であることが示されています。これらのモデルのために独自のデータを活用する作業が増えるにつれて、多くの人が同じ厳しい真実に直面します：良いデータがなければ、世界で最も優れたGenAIモデルも成功しません。この現実は、大量のデータを効率的に取り込んだり、ストリームしたりし、高いデータ品質を確保できる信頼性の高いデータパイプラインを構築する重要性を強調しています。言い換えれば、良好なデータエンジニアリングは、GenAIを含むすべてのデータとAIのイニシアチブにおいて成功の重要な要素です。この努力に関与する多くのタスクは、最終的なワークロードに関係なく同じままですが、GenAIアプリケーションを構築する際にデータエンジニアが準備する必要がある新たな課題があります。コア機能データエンジニアの仕事は通常、3つの主要なタスクにわたります：取り込み：多くのソースからデータを取得し - オンプレミスま

GenAIでの勝利：データインテリジェンスの未来のための適切なプロセスを構築する

August 30, 2024 ロビン・スタラ、デール・ウィリアムソンによる投稿 in プラットフォームブログ

すべてのビジネスは、データとAIの先駆者になりたいと考えています。しかし、それを実現するためには、企業はGenAIのビジョンと戦略にコミットし、そのビジョンを管理可能なステップに分解する必要があります。言い換えれば、企業はビジネス全体でAIを解放し活用するための適切なプロセスが必要です。過去のブログで取り上げたように、企業が人々を管理する方法と基礎となるIT基盤は、Generative AI採用の旅の重要なステップです。しかし、適切なプロセスを設定することが、企業が労働力と技術を結びつける方法です。これが唯一、ビジネスを目標に向けて前進させる結果を実際に推進する方法です。新しいシステムを採用することは一つのことです。それらから実際に価値を得ることは別のことです。企業はAIが活躍できる環境を構築する必要があります。彼らは採用への技術的な障壁を排除する必要があります。従業員は、これらの新しいシステムを自信を持って使用し、移行期間中に管理者からサポートを受ける必要があります。リーダーはAIの力を示す適切なプ

世界をリードする企業からのデータ + AIユースケース

August 30, 2024 マイケル・グリフィスによる投稿 in プラットフォームブログ

Data + AI Summitで最もエキサイティングなパートの一つは、10,000以上のグローバルな顧客がDatabricksをどのように使用してビジネスを改善しているかを聞くことです。データインテリジェンスプラットフォームを使用することで、すべての従業員が生のデータを洞察に変換し、仕事をより良く行うのに役立つ結果を生み出し、内部プロセスをより効率的にすることができます。 GM、Block、マクドナルド、J.P.モルガン・チェース、テキサス・レンジャーズ、ユニリーバ、その他250以上の顧客が、データとAIをどのように使用し、どのような結果を達成し、それを実現するためにどのようなツールを使用したかを共有しました。これらの素晴らしいストーリーを一つの場所にまとめ、他のビジネスがデータインテリジェンスの変革的な効果を見るのを助けたいと思いました。データ + AIサミットで紹介されたユースケース Texas Rangers は、Data Intelligence Platformを使用して、選手のメカニクスを分析し

Databricksワークフローで反復的なタスクを合理化

August 28, 2024 アンソニー・ポドゴルサク、エザナ・タデセ、ガボール・ラトキーによる投稿 in プラットフォームブログ

Databricksワークフローのタスクループ化に For Each を使用したループが一般に利用可能になったことをお知らせします！この新しいタスクタイプは、ランタイムで定義された動的なパラメーターセットをループすることにより、反復的なタスクを自動化することがこれまで以上に簡単になります。これは、 Databricksワークフローの強化された制御フロー機能への我々の継続的な投資の一部です。 For Each を使用すると、ワークフローの効率とスケーラビリティを向上させ、複雑なロジックではなく洞察に集中する時間を確保できます。ループ処理は繰り返しタスクの処理を劇的に改善します複雑なワークフローの管理は、しばしば複数のデータセットの処理や複数の操作の実行を必要とする反復的なタスクを扱うことを含みます。ループのサポートがないデータオーケストレーションツールは、いくつかの課題を提示します。複雑なロジックの簡略化以前は、ユーザーは反復的なタスクを管理するために手動で、保守が難しいロジックに頼ることが多かったで