メインコンテンツへジャンプ

サービスとしての Apache Spark

Databricks 無料トライアル

サービスとしての Apache Spark(Apache Spark as Spark-as-a-Service)とは

Apache Spark は、大規模なデータの高速リアルタイム処理を実現するオープンソースのクラスタコンピューティングフレームワークです。Spark は、カリフォルニア大学バークレー校の AMPLab で 2009 年に研究が開始されて以来、目覚ましい発展を遂げてきました。Apache Spark は現在、50 を超える組織から 200 名以上が参加する、ビッグデータの最大オープンソースコミュニティとして位置付けられています。データブリックスでは、Apache Sparkの最適化されたバージョンを、Spark-as-a-Service(サービスとしてのSpark)として複数のクラウドでホストしています。サービスとしての Spark には、データアクセスおよびデータ分析を迅速に行うアプリケーションが組み込まれており、ストリーミングデータの処理、グラフ計算の実行、Hadoop で SQL の提供、機械学習機能など、ビッグデータ上で動作する Spark の多くの機能を活用しています。多くの組織が Spark がもたらすビジネスチャンスを認識していますが、依然として二の足を踏んでいます。その理由は、組織がデータストリームや膨大なデータを分析する際に直面する課題があるからです。だからといって、Spark がもたらすメリットを享受するには、必ずしもハードウェアへの投資や本格的な導入が必要ということではありません。サービスとしての Spark は、必要なコストや作業を最小限にし、インフラの課題を解決し、プロセスを高速化します。サービスとしての Spark を提供するプロバイダはすでにいくつかあり、このフレームワークを簡単かつ迅速にデプロイできるようにしています。このソリューションは、短期的なデータ分析プロジェクトに最適で、高い投資収益率で迅速に設定することができます。サービスとしての Spark を採用することで、Hive、HDFS、HBase および Amazon S3 に保存されたデータの処理とクエリが容易になります。サービスとしての Spark は、分析プロジェクトが一時的である場合の最適なサービスであり、自社のビッグデータ処理システムに大規模な投資を行う前に、ビッグデータや分析がもたらすメリットの確認を望む企業に適した選択肢です。

サービスとしての Spark を採用する主なメリット:

サービスとしての Spark を採用するメリット

  • Spark のデータアクセスが容易
  • 専門的なコーディングスキルが不要なため、テクニカルユーザーとビジネスユーザーが手軽に使用可能
  • 低コスト

Apache Spark as a Service: Gentle Intro to Spark

関連資料

用語集に戻る