Databricks ブログ

ページ 56

Databricksクラスタinitスクリプトの安全化

May 1, 2023 Elia Florio、 Florian Roth、Marius Bartholdy による投稿 in エンジニアリングのブログ

This blog was co-authored by Elia Florio, Sr. Director of Detection & Response at Databricks and Florian Roth and Marius Bartholdy, security researchers...

リテールメディアネットワークの力を引き出す：データ駆動型広告がリテールプロモーションの展望を変える方法

May 1, 2023 Sam Steiny、Rob Saker による投稿 in 業界

Unlocking the Power of Retail Media Networks: How Data-Driven Advertising is Changing the Retail Promotions Landscape 翻訳： junichi.maruyama 薄利多売と顧客獲得競争の激化により、小売業者は常に新しい収益化の方法を模索し、時代の先端を走っています。CPG企業がより柔軟で消費者をターゲットにすることを求める中、従来はトレードプロモーションに費やされていたマーケティング予算は、FacebookやGoogleなどのデジタル広告に一部移行しています。このような販促費のシフトは、小売業者の犠牲の上に成り立っています。米国では、FacebookとGoogleがデジタル広告費全体の 50% 近くを占めています。しかし、アマゾンは2012年に独自のリテール・メディア・ネットワーク（RMN）を設立してこれに挑戦し、販促費を小売業のエコシステムに戻しました。このように、新しいテクノロジーとデータアク

edXの新しい専門家主導の大規模言語モデル（LLMs）コースに登録する

April 30, 2023 Matei Zaharia、Patrick Wendell（パトリック・ウェンデル）、ロチャナ・ゴラニ、Brooke Wenig、ジョセフ・ブラッドリー、Chengyin Eng、Sam Raymond による投稿 in ニュース

Original : Enroll in our New Expert-Led Large Language Models (LLMs) Courses on edX 翻訳： junichi.maruyama edXの入門コースに今すぐ登録する！コースは2023年夏開始予定です edXの新しい大規模言語モデルコース Large Language Model (LLM)アプリケーションが無数の産業を破壊する中、生成AIは重要な基盤技術になりつつある。LLMベースのアプリケーションの需要は急増しており、それを構築できるエンジニアの需要も高まっています。今日、私たちは新しい...

ソフトウェア開発およびDevOpsのベストプラクティスをDelta Live Tableパイプラインに適用

April 27, 2023 Alex Ott による投稿 in プラットフォーム

Original Blog : Applying software development & DevOps best practices to Delta Live Table pipelines 翻訳： junichi.maruyama Databricks Delta Live Tables（DLT）は、データエンジニアが記述・維持する必要のあるコード量を減らすことで、堅牢なデータ処理パイプラインの開発を根本的に簡素化します。また、環境間でコードとパイプラインの構成をシームレスに推進できるようにしながら、データのメンテナンスとインフラ運用の必要性を低減します。しかし、パイプラインに含まれるコードのテストを行う必要があり、それを効率的に行う方法についてよく質問を受けます。このブログでは、複数のお客様との共同作業の経験に基づき、以下の項目を取り上げます： DevOpsのベストプラクティスをDelta...

Databricks Marketplaceのパブリックプレビュー発表

April 26, 2023 ザヒーラ・ヴァラニ、Steve Mahoney、ジェイ・バンカリア、エリカ・エーリ、サチン・タクール、ダルシャナ・シヴァクマール、キャシー・ミャオによる投稿 in プラットフォーム

Original Blog : Announcing Public Preview of Databricks Marketplace 翻訳： junichi.maruyama この度、オープンソースの Delta Sharing 規格を利用した、あらゆるデータ、アナリティクス、AIのためのオープンマーケットプレイス、 Databricks Marketplace のパブリックプレビューを発表します。Databricks Marketplaceは、データ消費者とデータ提供者の広大なエコシステムを結集し、データセット、ノートブック、MLモデルなど、さまざまなデータ資産を、プラットフォームの依存関係や複雑なETL、高価なレプリケーションなしに共有・共同利用できます。データコンシューマーは、組織のAI、ML、アナリティクスイニシアチブを革新・推進し、ベンダーロックインすることなく、より迅速なインサイトを提供することができます。データプロバイダーは、ビジネスを拡大し、新しいユーザーを獲得し、収益を上げることができます。

Databricks ❤️ Hugging Face

April 26, 2023 Ali Ghodsi、Patrick Wendell（パトリック・ウェンデル）、マディ・ドーソン、Lu Wang、Xiangrui Meng、ニコラス・ペラエスによる投稿 in オープンソース

Original Blog : Databricks ❤️ Hugging Face 翻訳： junichi.maruyama ジェネレーティブAIが世界を席巻しています。データ＆AIカンパニーである私たちは、オープンソースの大規模言語モデル「Dolly」と、そのファインチューニングに使用した研究・商用利用のための社内クラウドソーシングデータセット「databricks-dolly-15k」をリリースし、この旅に参加しています。モデルもデータセットも、Hugging Faceで公開されています。そして今日、私たちはHugging Faceコードベースへの最初の公式コミットを発表し、ユーザーがApache Spark™データフレームからHugging Faceデータセットを簡単に作成できるようにすることに興奮しています。「Databricksがモデルやデータセットをコミュニティに公開することは素晴らしいことですが、今回、Hugging Faceに直接オープンソースを提供することで、その作業を拡張していることがわか

Lakehouseの価値を最大化するためのデータアーキテクチャパターン

April 25, 2023 ベルンハルト・ワルター、マグヌス・ピエール、Marco Scagliola、Matthieu Lamairesse による投稿 in プラットフォーム

Original Blog : A data architecture pattern to maximize the value of the Lakehouse 翻訳： junichi.maruyama Lakehouseの優れた成果の1つは、従来のBI、機械学習＆AIといったモダンなユースケースのワークロードを1つのプラットフォームで組み合わせることができることです。このブログ記事では、「1つのプラットフォームに2つのサイロがある」というリスクを軽減するアーキテクチャ・パターンを説明しています。本ブログで紹介するアプローチに従えば、機械学習やAIを利用するデータサイエンティストは、組織のビジネス情報モデルから得られる信頼性の高いデータに容易にアクセスできるようになります。同時に、ビジネスアナリストは、中核となるエンタープライズデータウェアハウス（EDW）の安定性と適合性を維持しながら、レイクハウスの機能を活用してデータウェアハウス（DWH）プロジェクトのデリバリーを加速させることができます。データレイクと

Databricksが実現するデータとAIの運用モデルとは：Part 1

April 25, 2023 ファビアン・ランツによる投稿 in データ戦略

Original Blog : How Databricks enables your operating model for Data and AI: Part 1 翻訳： junichi.maruyama "今、（AIの）ボトルネックは、テクノロジーではなく、マネジメント、実装、ビジネスイマジネーションにあります。" -Erik Brynjolfsson データとAIは、ここ数年、ほとんどの組織にとって戦略的な必須事項として浮上しています。大企業も中小企業も、データおよびAIの専門家を多数採用し、データプラットフォームのアップグレードと進化に多大な投資を行ってきました。これまでのところ、投資のほとんどは、データとAIを活用し、進化し続けるデータ環境の規模と複雑性に伴って出現した技術的課題を解決するために必要なテクノロジーと技術スキルに焦点を当てています。Databricksでは、レイクハウスパラダイムを発明したり、 Delta...

大規模言語モデル(LLM)による商品検索の強化

April 25, 2023 ティム・ロルツ、Peyman Mohajerian、Ali Sezer、Nicole Lu、ブライアン・スミス（Bryan Smith）による投稿 in 業界

Original Blog : Enhancing Product Search with Large Language Models (LLMs) 翻訳： junichi.maruyama ChatGPTやDollyなどのテキスト生成能力は実に素晴らしく、AIの分野での大きな一歩として当然のように認識されています。しかし、これらのモデルによってもたらされる未来への興奮が落ち着くにつれて、多くの組織が、これらのテクノロジーを今日どのように活用できるのか、という疑問を持ち始めています。多くの新技術と同様、大規模言語モデル（LLM）の完全な応用範囲は現時点では不明ですが、以前のブログで紹介したように、私たちが現在行っていることを補強し強化するために使用できるいくつかの領域を特定することができます。大量の文章を要約し、十分な情報を得た上で意見を述べたり、指導したりするような場は、まさにうってつけです。製品カタログの検索にお困りのお客様へ小売業や消費財メーカーにとって、コスト削減だけでなく、成長促進にもつながる

Predictive I/O for Readsの一般提供開始を発表

April 25, 2023 Shoumik Palkar、Justin Breese、シャント・ホヴセピアン、ケント・マーテン、Cyrielle Simeone による投稿 in プラットフォーム

Original Blog : Announcing the General Availability of Predictive I/O for Reads 翻訳： junichi.maruyama 本日、 Databricks SQL (DB SQL) 向けのPredictive I/Oの一般提供を開始します：機械学習を利用した機能で、ポイントのルックアップをより速く、より安くすることができます。Predictive I/Oは、Databricksが大規模なAI/MLシステムを構築してきた長年の経験を活用し、追加のインデックスや高価なバックグラウンドサービスなしで、Lakehouseを最もスマートなデータウェアハウスにすることができます。実際、ポイント検索では、Predictive I/Oは、インデックスと最適化サービスのすべての利点を提供しますが、それらを維持するための複雑さとコストは必要ありません。...