Databricks의 데이터 사이언스와 머신 러닝

학습할 내용

MLOps 분야가 확장됨에 따라, 데이터 실무자는 머신 러닝 수명 주기를 간소화하고 프로세스를 보다 체계화하며 재현 가능성을 높이는 MLflow와 같은 도구의 필요성과 마찰을 최소화하면서 모델을 학습, 테스트 및 배포할 수 있는 통합된 개방형 머신 러닝 플랫폼의 필요성을 인식하고 있습니다.

 

실제 머신 러닝 사용 사례를 사용하여 MLflow가 엔드투엔드 머신 러닝 워크플로를 간소화하는 방법을 확인할 수 있습니다. Databricks의 MLflow를 사용하면 MLflow 추적 서버를 사용하여 데이터를 통해 실행되는 각 모델 학습을 자동으로 추적하고 카탈로그화할 수 있습니다. 또한 이 데모에서는 MLflow 프로젝트가 머신 러닝 모델 및 학습 환경을 범용 프로젝트 형식으로 체계적으로 패키징하고 MLflow 모델 레지스트리가 테스트 및 스테이징 환경을 거쳐 Databricks 내에서 직접 머신 러닝 모델을 프로덕션에 적용하는 방법을 보여 줍니다.