Databricks ブログ

ページ 54

Apache SparkによるCOMTRADEファイルを用いたグリッドエッジ分析の高速化

May 16, 2023 Dan Sabin、コルトン・ペルティエ、Eric Golinko、Nichole Lu による投稿 in 業界

このソリューションアクセラレータとブログは、シュナイダーエレクトリック社との共同作業により作成されました。Schneider Electric Distinguished Technical Expert であり、COMTRADE-2013 規格の改訂に焦点を当てた IEEE/IEC Dual Logo Maintenance Team の幹事を務める Dan Sabin 氏に、その専門知識を提供していただいたことに感謝します。 Original : Accelerating Grid-Edge Analytics...

機密データを保護するために、HabuとDatabricksはどのように連携しているか

May 16, 2023 Lauren Kaufman による投稿 in 業界

Original : How Habu Integrates With Databricks to Protect Sensitive Data 翻訳：saki.kitaoka 先日、 Databricks との提携を発表( announce )し、すべてのLakehouseにマルチクラウドデータクリーンルームコラボレーション機能を提供することを発表しました。Databricksとの統合は、 Databricks's Lakehouse technology とHabuのクリーンルームオーケストレーションプラットフォームの長所を組み合わせ、クラウドやデータプラットフォーム間でのコラボレーションを可能にし、コラボレーションによるデータサイエンス作業のアウトプットをビジネス関係者に提供するものです。このブログポストでは、以下の質問に答えることで、HabuとDatabricksがどのようにこれを実現しているかを説明します：データクリーンルームとは何ですか？ Databricksの既存のデータクリーンルーム機能は何です

Apache Spark Structured Streamingでレイテンシが1秒未満になりました

May 15, 2023 Jerry Peng、Pranav Anand、Sourav Gulati、Karthik Ramasamy、Michael Armbrust、Matei Zaharia による投稿 in エンジニアリングのブログ

Original: Latency goes subsecond in Apache Spark Structured Streaming 翻訳: saki.kitaoka Apache Spark Structured Streaming は、オープンソースのストリーム処理プラットフォームの代表格です。 the Databricks Lakehouse Platform のストリーミングを支える中核技術でもあり、バッチ処理とストリーム処理のための統一APIを提供しています。ストリーミングの採用が急速に進む中、多様なアプリケーションがストリーミングを活用してリアルタイムな意思決定を行いたいと考えています。これらのアプリケーションのうち、特に運用型のアプリケーションでは、より低いレイテンシーが要求されます。Sparkの設計は、高いスループットと使いやすさを低コストで実現する一方で、サブセカンドレイテンシーに最適化されていません。本ブログでは、Structured Streamingの固有の処理レイテンシーを低減す

Apple HealthkitとDatabricksで健康やフィットネスの目標を追跡しよう

May 15, 2023 Jesus Rodriguez による投稿 in データ戦略

Original : Track health and fitness goals with Apple Healthkit and Databricks 翻訳：saki.kitaoka データは、健康を含む私たちの生活の多くの側面を改善するために使用することができる強力なツールです。ウェアラブル・フィットネス・トラッカー、健康アプリ、その他のモニタリング・デバイスの普及により、私たちの健康に関するデータを収集し、分析することはかつてないほど容易になりました。これらのデータを追跡・分析することで、私たちは自分の健康とウェルネスに関する貴重な洞察を得ることができ、ライフスタイルや習慣についてより多くの情報に基づいた決定を下すことができるようになります。健康機器を使えば、自分の健康状態を一元的に把握することができ、自分の健康について十分な情報を得た上で意思決定することができます。このブログでは、デバイスとそのデータを使って、さらに実用的なインサイトを提供する方法を紹介します。今回ご紹介する例では、Apple Hea

レイクハウスが保険業界のカスタマーサービス分析にNLPを活用した理由

May 11, 2023 マルセラ・グラナドス、Rafael Pierre、アンナ・キュイジアによる投稿 in 業界

Original : How Lakehouse powers NLP for Customer Service Analytics in Insurance 翻訳： junichi.maruyama Download the Databricks Insurance NLP Solution Accelerator はじめに現在の経済・社会情勢は、お客様の期待や嗜好を再定義しています。社会はデジタル化を余儀なくされ、それは保険会社における顧客サービスにも及んでいます。...

クラスターポリシーオンボーディング入門

May 10, 2023 Anindita Mahapatra、Stephen Carman による投稿 in 業界

Original : Cluster Policy Onboarding Primer 翻訳： junichi.maruyama はじめにこのブログは、Databricks環境を管理・維持するために重要なトピックに焦点を当てる「Admin Essentials」シリーズの一部です。ワークスペース組織、ワークスペース管理、 UCオンボーディング、コスト管理のベストプラクティスについては、以前のブログをご覧ください！データは、洞察に変換されて初めて有用なものとなります。データの民主化とは、過度なプロセスのボトルネックや、高価で恥ずかしい失敗をすることなく、データを付加価値を与えることができる人々の手に届けるセルフサービスプロセスである。例えば、若手のデータアナリストが「SELECT * from <massive...

CARTOとDatabricksによるフリート最適化

May 10, 2023 Javier de la Torre、Miguel Ángel Carvajal、Cayetano Benavent、Eduardo Fernández León、ミロシュ・コリックによる投稿 in プラットフォーム

Original : Fleet optimization with CARTO & Databricks 翻訳： junichi.maruyama 近年、効率的な配送は企業にとってますます重要になってきており、特に物流企業や独自の流通網を持つ消費財（CPG）業界の企業にとって重要な課題となっています。これらの企業にとって大きな課題は、輸送ルートを最適化し、コストを最小化しながらタイムリーな配送を実現することです。そのためには、距離、交通量、道路状況、使用する輸送手段の種類（トラック、鉄道、航空など）などの要素を考慮する必要があります。さらに、CPGやロジスティクス企業は、輸送手段の選択による環境への影響を考慮し、カーボンフットプリントの削減を目指さなければなりません。燃料価格の上昇と競争の激化により、これらの企業にとって、より持続可能性を高め、輸送の問題に対処し、全体的な配送コストを削減するための明確な計画を策定することが極めて重要となっています。ルーティングソフトは、企業がこれらの課題に取り組む上

Databricks Fleet Clusters for AWSのご紹介

May 9, 2023 Ankit Batra、ピユーシュ・シン、クイン・レング、Andrew Bagshaw による投稿 in プラットフォーム

Original : Introducing Databricks Fleet Clusters for AWS 翻訳： junichi.maruyama この度、Databricks FleetクラスタのAWSでの一般提供開始を発表します。フリートクラスタとは？ Databricks Fleet Clusters は、Databricksがインテリジェントに最適化し、プロセスを自動化することで、手動でインスタンスを選択する手間をかけずにSpot価格の潜在能力を引き出します。Databricksの1クラスタ内の複数のインスタンスにまたがるフレックス機能により、可用性を確保しながら、AWS Spotインスタンスを可能な限り低コストで利用することが可能です。クラウドインフラの複雑な管理を回避し、本当に重要なこと、つまりデータドリブンなインサイトに時間を費やすことができます。 Databricksのフリートクラスタは、AWSのお客様向けに新しいフリートインスタンスファミリーのセットを導入します：m-fleet、md-

Databricks SQL AI Functionsで大規模に顧客レビューに対して行動する

May 9, 2023 Vinny Vijeyakumaar による投稿 in エンジニアリングのブログ

Original : Actioning Customer Reviews at Scale with Databricks SQL AI Functions 翻訳： junichi.maruyama スーザンは毎朝、メッセージの嵐にさらされ、何から手をつけたらいいのかわからない！スーザンは、世界的な小売企業のカスタマーサクセススペシャリストです。彼女の主な目的は、顧客が問題に遭遇したときに、必ず満足し、個人的なサービスを受けられるようにすることです。一晩で、ウェブサイト、アプリ、ソーシャルメディアへの投稿、電子メールなど、複数のチャネルで何百ものレビューやフィードバックが寄せられるようになりました。スーザンの1日の始まりは、これらのシステムにそれぞれログインし、同僚がまだ収集していないメッセージを拾い上げることから始まります。次に、これらのメッセージの意味を理解し、対応する必要があるものを特定し、お客さまへの回答を作成する必要があります。なぜなら、メッセージの形式はさまざまで、お客さまはそれぞれ独自のスタイル

Unity Catalogを通じたデルタシェアリングで構造化ストリーミングを使う

May 8, 2023 Will Girten、Josh Seidel、Lin Zhou、サチン・タクールによる投稿 in プラットフォーム

Original : Using Structured Streaming with Delta Sharing in Unity Catalog 翻訳： junichi.maruyama この度、Azure、AWS、GCPにおいて、Structured StreamingをDelta Sharingで使用するためのサポートが一般提供（GA）されたことをお知らせします！この新機能により、Databricks Lakehouse Platform上のデータ受信者は、 Unity Catalog を通じて共有されたDelta Tableからの変更をストリーミングできるようになります。データプロバイダーは、この機能を活用することで、Data-as-a-Service...