メインコンテンツへジャンプ

マネージドSpark

Databricks 無料トライアル

マネージドSparkとは

マネージド Spark は、バッチ処理、クエリ、ストリーミング、機械学習などのオープンソースのデータツールを利用できるマネージドサービスです。ユーザーは、このような自動化を使用することで、オンデマンドでクラスタの迅速な作成や管理を容易し、タスクが完了したときにクラスタをオフにすることができます。ワークロード、パフォーマンス要件、または既存のリソースに基づいてクラスタのサイズを設定することも可能です。さらに、ほんの数秒で動的にスケールアップおよびスケールダウンできる、完全に管理された Spark クラスタへのアクセス権が付与されます。これは、ジョブの処理中でも実行できます。さらに、ユーザーは不要になったらクラスタをオフにすることで、コストを節約できます。マネージド Spark プロバイダーは、プロビジョニングを行い、全てのジョブのクラスタを保持する代わりに、一時クラスタを作成します。通常、マスターノードとワーカーノードを持つマシンのクラスタを使用します。マネージド Spark のサービスを採用することで、組織は貴重なリソースを運用ではなく分析に活用することができ、データから価値を引き出す作業に集中できるようになります。Managed Spark:マネージドSpark

マネージドSparkサービスを採用するメリット

クラスタ管理の自動化

特定のジョブのニーズに応じて管理された展開、ログ記録、および監視によって、クラスタに焦点を当てるのではなく、データに集中できます。安定性、拡張性のある高速なクラスタで分析作業ができます。

サイズ変更可能なクラスタ

クラスタを迅速に作成およびスケーリングするため、Spark クラスタの構築と構成による大量のリソース消費を心配する必要はありません。ノードは不要になった時点で巻き戻され、スケーリングは必要に応じて実行されます。

開発者ツール

通常、クラスタを管理する方法は複数用意されています。

自動/手動の構成

クラスタ上のハードウェアとソフトウェアは自動的に設定されますが、手動での制御も可能です。

シンプルな管理

YARNリソースマネージャーなどのツールの使用により、クラスタやリソース割り当ての優先順位付けや管理をシンプルにします。

費用対効果

従量課金制のため、ユーザーは、プロセス中に消費されるコンピューティングリソースに対してのみ料金を支払います。

関連資料

用語集に戻る