Databricks ブログ

ページ 17

Delta Sharing Tableauコネクタを使用してリアルタイムのクロスプラットフォームコラボレーションを実現する

August 20, 2024 Tianyi Huang、Giselle Goicochea、ライリー・マリス、Yunbo Deng、エリック・ワンによる投稿 in プラットフォーム

Kevin Glover、Martin Ko、Kuber Sharma、Tableauのチームにこのブログへの貴重な洞察と貢献に感謝します。組織は、協力を促進し、イノベーションを推進するために、パートナー、顧客、およびサプライヤーとデータを共有する必要があります。しかし、これらの多様でしばしば孤立したデータセットをデータプラットフォーム間でアクセス、共有、保護する現実は、しばしば摩擦と複雑さを生み出し、協力を阻害します。これに対処するために、DatabricksとLinux Foundationは Delta Sharing を導入しました。これは、プラットフォームに依存しないデータ共有のための最初のオープンソースプロトコルで、組織がデータプラットフォームと組織の境界を超えて協力を安全に拡大することを可能にします。プラットフォーム間でのデータ共有を可能にし、データ駆動型の洞察を民主化するという元々の約束を果たすために、DatabricksとTableauは最近パートナーシップを拡大し、新しいDelta Sh

データの魔法：AI/BI Genieのためのデータキュレーション

August 20, 2024 イザベル・ジョウによる投稿 in Databricks ブログ

今年の夏、MBAのインターンシップ中に、私はいくつかのデータプロジェクトに取り組みました。私のお気に入りのプロジェクトは、 AI/BI Genie を使用して、私たちの戦略チームのための「バーチャルアナリスト」を構築することでした。 AI/BI Genieは、ユーザーが自然言語でデータに話しかけ、SQL生成のデータテーブルとチャートを返す新しいテキストからSQLへのデータ分析ツールです。適切に設定し、キュレーションすれば、ビジネスユーザーはデータ分析クエリを実行することができます。AIの基礎モデルに基づいて構築され、Unity Catalogガバナンスプラットフォームと完全に統合されています。データキュレーションプロセス今日の企業には、散在するテーブルに多くのデータが存在します。特定の情報を引き出すためには、しばしばSQL（または他の同等の言語）を使ってテーブルを検索、マージ、クリーニングし、ダッシュボードをコンパイルし、データを引き出す必要があります。インターンシップの一環として、私はこれらの複雑なプロセ

AI/BI Genieの利用を開始する

August 19, 2024 チャオ・ツァイ、リチャード・トムリンソンによる投稿 in プラットフォーム

Databricksでは、地球上のすべての人々がデータとAIにアクセスできるようにしたいと考えています。これが、ビジネスユーザーが、SQLを話すこともコードを書くこともなく、信頼できる洞察を迅速かつ正確に得ることができるようにする AI/BI のようなソリューションを構築している理由です。現在、ダッシュボードはほとんどの人々の日常生活の一部となっています。一方、 AI/BI Genie は新しい経験であり、まだ多くの人々が馴染みがないかもしれません。Genieを使用すると、ユーザーは自己サービスで、ダッシュボードで対処されていない質問に対する答えを得ることができ、BIツールの使用方法を学んだり、専門家に洞察を作成してもらうことなく、答えを得ることができます。この背景を踏まえて、ジニーの一日を見てみると、どのように使用するか、何を期待するかを理解するのに役立つかもしれません。「新入社員」としてのGenieへのオリエンテーション一部の人々は、Genieを作成するプロセスを、新しいアナリストをデータチームに雇うこ

DatabricksとのPyCharm統合を発表

August 19, 2024 Theresa Hammer による投稿 in プラットフォーム> 製品> お知らせ

Databricks開発者体験の最新の追加を発表することを嬉しく思います： DatabricksとのPyCharm Professional統合！この新しいプラグインはJetBrainsによって作成され、Databricksで開発する際にお気に入りのIDE機能を活用できるようにします。これにより、ソフトウェア開発のベストプラクティスが可能になり、生産への道筋をスムーズにします。私たちのJetBrainsとのパートナーシップは、開発者がどこにいても彼らのニーズに応えるというコミットメントを強調しています。お客様がお気に入りのサードパーティIDEを活用してDatabricks開発者体験を補完できるようにすることです。PyCharmプラグインは、 Databricks for Visual Studio Code や Posit workbench など、私たちがサポートしているIDEのリストに追加されました。ここでDatabricks PyCharmプラグインの簡単なデモをご覧ください： PythonのID

ライフサイエンス分野における堅牢なデータスチュワードシップツールの構築

August 16, 2024 ゴードン・ストローデル、アビナヴ・バトラ、ニティン・ジンダル、アビマニュ・ジャインによる投稿 in 業界

このブログは、データ戦略＆アナリティクス能力担当ディレクターであるGordon Strodel、エンタープライズデータ管理プラクティスリードのAbhinav Batra、エンタープライズアーキテクトのNitin Jindal、そしてZSのビジネステクノロジーソリューションマネージャーであるAbhimanyu Jainとの共同執筆です。データスチュワードシップ：組織のデータ戦略の重要な要素マスターデータ管理（MDM）システムは、長い間、あらゆる組織にとって不可欠な柱となってきました。時間の経過とともに、MDMフレームワークの進歩により、組織の顧客データを自動化、標準化、およびクレンジングする機能が大幅に強化されました。これらの機能強化にもかかわらず、データスチュワードの直接介入を必要とする未解決のエッジケースという、根強い課題が残っています。データ管理は、組織のデータ管理戦略の重要な要素であり、これらのエッジケースを対処するために手動介入に依存しています。これらのデータ管理者は、顧客プロファイルを効果的にナビ

Databricksの大学提携プログラムの加盟校が1000校を突破

August 14, 2024 Rob Reed による投稿 in Databricks ブログ

Databricksは、当社の大学提携プログラム（ University Alliance ）が1000番目の加盟校を迎えたことをお知らせできることを嬉しく思います。この節目は、世界中の大学に必要なツールとリソースを提供し、新世代のAIの才能を育てるという私たちの使命の証です。85カ国以上から10万人を超える学生が参加する本プログラムは、まさにグローバルな取り組みとなっています。Databricksのツールと教材を教員に提供することで、学生たちは実際のキャリアに備えるためのスキルと知識を身につけることができます。DatabricksはデータにAIをもたらし、加盟校の優秀な卒業生たちは、あなたがどこにいても、あなたの世界にAIをもたらす準備ができています。 Databricks University Allianceが提供するもの私たちのプログラムは、4年以上前に、データとAI技術の最新の教育と学習を支援するという使命で始まりました。私たちが提供するサービスは次の通りです。コミュニティ：アカデミックな仲間と

「Generative AI World Cup」の発表：Databricksによるグローバルハッカソン

August 13, 2024 ジャッキー・ザン、クリステン・スタフィエリ、ジューン・タン、リンダ・アブーブによる投稿 in 生成 AI

ようこそ、 Generative AI World Cup へ、これは参加者が実世界の問題を解決する革新的な生成AIアプリケーションを開発するためのグローバルハッカソンです。参加者は、総額50,000ドル以上の賞金、トロフィー、およびData + AI Summit 2025のパスを競います。参加者はまた、ハッカソンの過程で生成AIのスキルアップに役立つ資料も入手できます。参加して勝つ方法を学びましょう！誰が参加できますか？ Generative AI World Cupの参加資格は以下の通りです：参加者は、所属組織内でデータまたはAIに関する役割を担っている必要があります登録には法人のメールアドレスが必要ですチームは2人から4人で構成される必要があります Databricksのスタッフ、パートナー、コンサルタント、学生は対象外です参加者は20歳以上で、こちらにリストアップされている対象国のいずれかに居住している必要があります何を作るか...

Databricks on Google CloudでサーバーレスSQLの一般提供を開始

August 13, 2024 ガウラヴ・サラフ、シャント・ホヴセピアン、イナ・フェルスハイム、ウェイロン・ズー、ジョイス・シューによる投稿 in プラットフォーム

本日、 Databricks SQL Serverless がGoogle Cloud Platform（GCP）で一般提供開始されたことをお知らせします。Databricks SQL Serverlessは、データインテリジェンスプラットフォームの主要コンポーネントとして、瞬時に伸縮自在なコンピューティングにより最高のパフォーマンスを提供し、コストを削減して、インフラストラクチャの管理ではなくビジネス価値の提供に集中できるようにします。この一般提供リリースは、最高のデータウェアハウスはレイクハウスであり、データレイクとウェアハウスを統合して統一的なアプローチを提供するという私たちの信念を強化します。SQL Serverlessは現在、7つのGCPリージョンと、すべての主要なクラウドプロバイダー（ AWS 、 Azure 、GCP）の40以上のリージョンで利用可能です。 GCP上のDatabricks SQL Serverlessの利点過去数年間で、レイクハウス専用に設計されたデータウェアハウスであるDatab

スーパーノヴァ！ブラックホール！ストリーミングデータ！

August 12, 2024 フランク・ムンツによる投稿 in プラットフォーム

Translation Reviewed by Akihiro.Kuwano 概要このブログ投稿は、Data + AI Summit 2024でのセッションスーパーノヴァからLLMsへのフォローアップで、ここでは誰でもApache Kafkaから公開されているNASAの衛星データを消費し、処理する方法を示しました。多くのKafkaのデモとは異なり、再現性が低いか、シミュレートされたデータに依存しているのではなく、私はNASAの公開されているガンマ線座標ネットワーク（GCN）からのライブデータストリームの分析方法を示します。これは、さまざまな衛星から来るスーパーノヴァとブラックホールのデータを統合しています。オープンソースの Apache Spark™ と Apache Kafka だけを使ってソリューションを作ることも可能ですが、このタスクには...

データインテリジェンスを高める：データとAIについて業界リーダー達からの重要な洞察

August 9, 2024 Hiral Jasani、ライリー・マリスによる投稿 in データ戦略

Translation Reviewed by Akihiro.Kuwano 今日の急速に進化する技術的な風景では、データと人工知能（AI）の交差点は、業界全体の組織にとって重要な焦点となっています。Foundryの最近の CIO Tech Poll によれば、ITリーダーの大多数が2024年の投資リストのトップにAI対応ソリューションを置き、生成AIに対して興味がないと表明したのはわずか8％でした。AIの優先度が高まることは、データとAIがどのように連携してイノベーションとビジネス価値を推進するかについての深い理解の必要性を強調しています。この重要なトピックを探求するために、最近、 Informatica、Immuta、Dataikuの業界専門家をフィーチャーしたパネルディスカッションを開催しました。パネルは、高品質のデータの必要性、新たな規制、全員のための適切なデータ基盤を築く必要性について、実際の顧客シナリオから独自の視点を提供しました。ディスカッションは2つの主要な側面を中心に展開されました：テクノ