Databricksはあらゆるデータ・分析・データサイエンスのワークロードに対応可能なオープンかつシンプルなLakehouseを提供しています。そして、Databricksではその機能を無償でお試しいただけるよう、2通りの方法を用意しております。
- 2週間 の無償トライアル: Databricksのフル機能をお試しいただけます。
- Community Edition: 機能が限定されますが、期限なし・無償でご利用いただけます。
このブログでは、後者のCommunity Editionを使用したDatabricksの始め方について説明します。
Community Editionの機能と制限
Community Editionでは、Databricksのフルバージョンの機能に対して以下の制限があります。
- 作成できるクラスターは15GB RAM, 2 Core CPUのシングルノードのみ
- ワークスペースに追加できるユーザー数は最大3名まで
- クラスターのリージョンはus-westのみ
- 使用できない機能
- ジョブのスケジュール機能
- クラスターのオートスケーリング機能
- Git連携
- MLflowの一部モデル管理機能(レジストリ、RESTサービング)
- REST APIによるワークスペースの制御
- セキュリティ、ロールベースのアクセス制御、監査、シングルサインオン
- BIツール連携のサポート
一方で、使用期間の制限はありません。そのため、Databricks機能の使用感の確認や、Databricksのトレーニング教材を実行していただく環境として広くご利用いただけます。例えば、以下の機能・環境がCommunity Edition上で利用することができます。
- Databricks Workspace/Notebook環境(共同編集・コラボレーション機能)
- Spark (Databricks Runtime版)
- Delta Lake (Databricks版)
- MLflow(モデルトラッキング機能)
- Koalas(SparkのPandas API)
- MLlib(Sparkネイティブの機械学習ライブラリ)
- 一般的な機械学習ライブラリ環境(TensorFlow, Keras, Pytorch, Scikit Learn, XGBoostなど)
- 一般的なデータサイエンス環境(Scipy, Numpy, Pandas, Matplotlibなど)
プリインストールされているライブラリ一覧はこちらで確認できます。
Community Editionのアカウント作成
Community Editionのアカウント作成方法を説明いたします。
- データブリックスの無料トライアルにアクセスし、必要事項を記入後、”GET STARTED FOR FREE”をクリックします。
- 続いて、コミュニティ版の”GET STARTED”をクリックします。
2. 登録したメールアドレス宛に初期パスワード設定のリンクが送付されるので、ガイドにしたがって設定します。
3. Community Editionのログインページを開き、上記で設定したメールアドレス、パスワードでログインします。