メインコンテンツへジャンプ
<
ページ 50
>

構造化ストリーミングにおける適応的なクエリの実行

Original: Adaptive Query Execution in Structured Streaming 翻訳: junichi.maruyama Databricks Runtimeでは、 Adaptive Query Execution (AQE) は、クエリ実行中にランタイム統計を使用してバッチクエリを継続的に再適正化するパフォーマンス機能です。Databricks Runtime 13.1以降、 ForeachBatch Sinkを使用するリアルタイムストリーミングクエリも、 Project Lightspeed の一環として、AQEを活用して動的再最適化を行います。...

Delta Live Table(DLT)を用いたGDPR・CCPAにおける「忘れられる権利」の取り扱いについて

June 1, 2023 Marcin Wojtyczka による投稿 in
Original: Handling "Right to be Forgotten" in GDPR and CCPA using Delta Live Tables (DLT) 翻訳: junichi.maruyama ここ数十年でデータ量は爆発的に増加し、各国政府は個人データに対する個人の保護と権利を強化するための規制を設けています。 General Data Protection Regulation (GDPR)と...

Cleanlab Studioを使ったより良いデータでより良いLLMを

June 1, 2023 Anish Athalye による投稿 in
Original: Better LLMs with Better Data using Cleanlab Studio 翻訳: junichi.maruyama この投稿とそれに付随する ノートブック と チュートリアルビデオ は、 Cleanlab Studio を使用して、大規模言語モデル(LLM、基礎モデルとも呼ばれる)のパフォーマンスを、それらが微調整されるデータを改善することによって改善する方法( Data-centric AI (DCAI)とも呼ばれるアプローチ)を示します。事例として、LLMの最も一般的な使用例の1つである、テキスト分類のためのモデルのファインチューニングを、Stanford politeness...

ようこそbit.io : 開発者エクスペリエンスへの投資

May 30, 2023 シャンク・ニヨギ による投稿 in
Original: Welcoming bit.io to Databricks: Investing in the Developer Experience 翻訳: saki.kitaoka この度、bit.ioがDatabricksの一員となったことをお知らせできることを嬉しく思います。 Databricksでは、組織が最も困難な問題をデータで解決できるようにすることに常に重点を置いています。そのためには、すべてのデータ実務者やチームにパワフルでシンプルなツールを提供し、簡単に導入でき、毎日楽しく使えるようにする必要があります。 bit.ioは、非常にユーザーフレンドリーなインターフェース、摩擦のないサインアップ体験、わかりやすいワークフローを提供することで、その存在を際立たせてきました。また、bit.ioのチームは、現代の開発者やデータエンジニアのニーズを深く理解していることも証明しました。Databricksでは、共同創業者のAdam FletcherとJonathan Mortensenとチームがその専

ファイルアップロードとデータ追加UIでLakehouseに簡単に取り込む

Original: Easy Ingestion to Lakehouse with File Upload and Add Data UI 翻訳: junichi.maruyama Lakehouseへのデータ取り込みは、多くの組織にとってボトルネックとなり得ますが、Databricksを使用すれば、様々なタイプのデータを迅速かつ容易に取り込むことができます。小さなローカルファイルでも、データベース、データウェアハウス、メインフレームなどの大規模なオンプレミスストレージプラットフォームでも、リアルタイムストリーミングデータでも、その他のバルクデータ資産でも、DatabricksはAuto Loader、COPY INTO、Apache Spark™ API、設定可能なコネクタなどの幅広い取り込みオプションであなたをサポートします。また、ノーコードまたはローコードアプローチをご希望の場合は、Databricksはインジェストを簡素化する使いやすいインターフェイスを提供します。 データインジェストブログシリーズの第

グレート・アンロック: 製造業における大規模言語モデル

May 30, 2023 Sam Steinyシヴ・トリサル による投稿 in
Original: The Great Unlock: Large Language Models in Manufacturing 翻訳: junichi.maruyama 製造業は、自動化を進め、オペレーションを可視化し、製品・技術開発を加速させるための新しい方法を常に模索しています。そのため、企業は常に深い技術的進歩の最前線にいることが求められます。製造業で最近見られる技術的進歩のひとつに、Generative AI、特にLarge Language Models(LLM)の利用があります。Generative AIは、既存のデータから認識したパターンに基づいて新しいユニークなデータを作成することができますが、LLMはさらに一歩進んで、複雑な情報を理解・整理し、人間のような対話を生成する能力を備えています。 製造業では、接続された車両、工場、建物、作業員によって生成される大量の複雑な非構造化データ(センサー、画像、ビデオ、テレメトリ、LiDARなど)が発生しますが、その多くは、データをリアルタイムでストリー

MMMとは何か、なぜマーケターにとって重要なのか?

Original: What is a MMM and why does it matter for marketers? 翻訳: junichi.maruyama MMM(Marketing or Media Mix Modeling)とは、企業が複数のチャネルにまたがるマーケティングキャンペーンの効果を特定・測定するためのデータ駆動型の方法論です。MMMの目的は、企業が広告やマーケティング戦略について十分な情報に基づいた意思決定を行うことを支援することです。MMMは、テレビ、ソーシャルメディア、Eメールマーケティングなど、さまざまなチャネルのデータを分析することで、どのチャネルが売上やその他のビジネス成果に最も貢献しているかを判断します。外部イベントや指標を含めることで、意思決定者は外部要因(祝日、経済状況、天候など)の影響をよりよく理解し、広告費だけの影響を誤って過大評価することを防ぐことができます。 MMMを使用することで、企業はどのマーケティングチャネルが最もエンゲージメント、売上、または収益を促進して

Databricksで構築: 最新のソフトウェア製品でデータとAIのイノベーションを促進する

May 25, 2023 Victor Chang による投稿 in
Original: Built on Databricks: Fueling Data and AI innovation in modern software products 翻訳: junichi.maruyama AIの時代が到来しています。すべての製品メーカーは、新しいデータとAIの能力をどのように活用するかを自問しなければ、その製品は生き残れないでしょう。従来の説明的な分析は、テーブルステークスです。最新のアプリケーションは、ユーザーの期待に応えるために、リアルタイムの洞察とAI主導のアクションを取り入れる必要があります。 クラウドは、ソフトウェア・アプリケーションの設計と運用を著しく複雑にする、目まぐるしく変化するデータスタックの選択肢を可能にしました。ベスト・オブ・ブリードのアプローチをとる製品開発者は、あっという間に互換性のない複数のデータサイロをつなぎ合わせ、管理することになります。開発者の生産性は低下し、データメンテナンスのコストは制御不能に陥ります。 Abnormal Security の

エグゼクティブのためのデータ、アナリティクス、AI変革ガイド 第5回:情報に基づいたビルドと購入の意思決定

Original : The Executive’s Guide to Data, Analytics and AI Transformation, Part 5: Make informed build vs. buy decisions translate by junichi.maruyama データおよびAIトランスフォーメーション戦略の重要な要素として、データエコシステムのどのコンポーネントを社内のエンジニアリングチームが構築し、どのコンポーネントをベンダーとの関係を通じて購入するかを決定することが挙げられます。エンジニアリング・チーム内では、「ビルダー」アプローチを取ることが重視されるようになってきています。つまり、エンジニアリング・チームは、ベンダー製品に依存するのではなく、自社で独自のソリューションを開発することを好むのです。...

顧客主導の成長を促進する: Databricks VenturesがCatalystに投資

Original: Powering Customer-Led Growth: Databricks Ventures Invests in Catalyst 翻訳: junichi.maruyama Databricks Ventures は、既存顧客との関係を最適化することでソフトウェア企業の成長加速を支援する先進的なプラットフォームであるCatalystへの 投資 を発表します。Catalystは、企業が最も重要な経常収益資産である既存顧客の生涯価値を効率的に最大化することを可能にする「 顧客主導の成長 」手法を普及させる最前線にいます。Catalystは、業界や規模を問わず、洗練された顧客主導の成長を可能にする広範な統合機能とインテリジェンスを提供します。すでにGrammarlyやFivetranなどの大手ソフトウェア企業で採用されています。 また、CatalystはDatabricks Venturesにとって、Databricksの上にコア製品を構築している企業への初めての投資となります。Cataly