MLflow는 모델 개발 및 실험을 위한 최고의 플랫폼입니다. 수천 개의 데이터 사이언티스트가
매일 MLflow Experiment Tracking을 사용하여 parameter, 성능 메트릭 및 원본 정보를
기반으로 모델을 보고, 필터링하고, 정렬할 수 있는 강력한 GUI 기반 환경을 통해 최상의
후보 모델을 찾습니다.
오늘 시각적 모델 성능 인사이트를 제공하는 구성 가능한 차트 보기, 튜닝을 위한 개선된
병렬 좌표 환경, 검색 및 필터링 기능이 향상된 간소화된 테이블 보기를 포함하여
MLflow Experiment UI에 대한 몇 가지 주요 개선 사항을 발표하게 되어 기쁩니다.
이러한 개선 사항을 통해 데이터 사이언티스트의 모델 비교 속도가 크게 향상되고
가장 좋아하는 일인 멋진 모델 구축에 더 많은 시간을 할애할 수 있을 것으로 기대합니다.
새로운 MLflow Experiment UI의 몇 가지 주요 개선 사항 및 기능을 살펴보겠습니다.
새 차트 보기로 모델 성능 분석
프로덕션에 가장 적합한 모델을 식별하기 위해 데이터 사이언티스트는 모델의 parameter 및
성능 메트릭의 시각화에 크게 의존합니다. 예를 들어, 꺾은선형 차트는 정확도가 향상되고
있는지 확인하기 위해 훈련 중 모델의 진행 상황을 보여주고, 막대 차트는 여러 모델 간의
성능 차이에 대한 빠른 통찰력을 제공합니다.
MLflow Experiment 페이지에 새로운 차트 보기를 도입하게 되어 기쁩니다.
차트 보기는 모든 모델의 parameter 및 메트릭에 대한 막대, 선, 분산형 및 평행 좌표 플롯을 지원하는 사용자 지정 가능한 모델 성능 대시보드입니다. 실행을 선택하고 "비교"를 누를 필요 없이 이제 테이블과 차트 보기 간에 원활하게 전환하고 원하는 실행 비교 모드를 선택할 수 있습니다. 각 차트는 구성 가능하고 대화형이므로 표시할 축과 데이터를 선택하고, 데이터 포인트를 필터링하여 가장 관련성이 높은 결과를 찾고, 나중에 참조할 수 있도록 최상의 모델을 pin 수 있습니다. 차트 보기는 모델 개발 경험과 속도를 크게 향상시켜 수동 플로팅 및 계산의 필요성을 줄여줍니다.
개선된 평행 좌표 차트로 모델을 더 빠르게 튜닝
고품질 모델을 개발하기 위해 데이터 사이언티스트는 모델 parameter신중하게 선택해야 합니다. 이 하이퍼파라미터 튜닝 프로세스에서는 가장 중요한 것을 식별하기 위해 수십, 수백 또는 수천 개의 parameter 탐색해야 하는 경우가 많습니다. 이 프로세스 전반에 걸쳐 병렬 좌표 차트는 모델 parameter 와 성능 메트릭 간의 관계와 다양한 parameter 값이 주어진 메트릭에 영향을 미칠 수 있는 방식을 시각화하는 데 매우 유용한 도구입니다.
새로운 차트 보기에 병렬 좌표 차트가 포함되어 수천 개의 모델 학습 실행에서 parameter 조합을
동시에 원활하게 분석할 수 있습니다. 또한 병렬 좌표 차트는 고급 시각화 프레임워크를 사용하여
재구축되어 확장성이 뛰어난 대화형 환경을 제공합니다. 새로운 기능은 다음과 같습니다.
- 향상된 브러싱 – 원하는 범위의 parameter 및 메트릭 값으로
모델 학습 실행을 필터링합니다. - 실행 강조 표시 – 차트에서 특정 실행을 선택하여 모든 메트릭 및 parameter봅니다.
- 숨기기 및 고정 – 이상값을 제거하거나 중요한 실행을 볼 수 있도록 유지
개선된 평행 좌표 차트를 사용하면 모델을 훨씬 쉽게 조정할 수 있으므로 고품질 모델을 빠르게
빌드하고 배송할 수 있습니다.
간소화된 테이블 보기 및 검색 환경을 갖춘 최상의 모델 찾기
모델 개발은 반복적인 프로세스입니다. 데이터 사이언티스트는 프로덕션에 가장 적합한 모델을
선택하기 전에 수천 개의 후보 모델을 탐색하는 경우가 많습니다. 새로운 데이터가 수집되고
애플리케이션 요구 사항이 변경되면 모델이 계속해서 정확한 예측을 할 수 있도록 다시 학습됩니다. 따라서 데이터 사이언티스트는 모델 학습 결과를 검색 및 필터링할 수 있어야 할 뿐만 아니라 학습이 진행됨에 따라 최상의 모델을 추적할 수 있어야 합니다. 새 MLflow Experiment UI에는 이 환경을 간소화하기 위한 몇 가지 기능과 개선 사항이 포함되어 있습니다.
이제 만드는 모든 MLflow 실행에는 모델을 식별하고 비교하는 데 도움이 되는 기억하기 쉬운
이름이 있습니다. 또한 이제 실행 테이블의 맨 위에 실행을 pin 수 있습니다. pin 실행은 모델
학습 결과를 계속 필터링하고 탐색하는 동안 항상 표시되므로 이제 빠른 비교를 위해 "기준"
모델을 pin 할 수 있습니다. 마지막으로, Databricks AutoML 또는 MLflow 레시피를
사용하여 모델을 학습하는 경우 Experiment 페이지에 가장 관련성이 높은 성능 메트릭 및
모델 특성이 자동으로 표시되므로 최적의 모델을 빠르게 식별할 수 있습니다.
열 선택기 드롭다운을 사용하여 추가 모델 정보를 쉽게 표시할 수 있습니다.
또한 자동 제안 기능을 통합하여 Experiment 경험의 검색 환경을 크게 간소화했습니다.
검색 창에 성능 지표 또는 모델 parameter 의 이름을 입력하기만 하면 자동 제안 드롭다운에
query사용 방법이 표시됩니다. Experiment 페이지에는 구문을 빠르게 익히는 데
도움이 되는 포괄적인 예제 검색 query 목록도 포함되어 있습니다.
새 MLflow Experiment UI 시작
새롭게 향상된 MLflow Experiment UI를 사용하면 고품질 모델을 대규모로 개발하고
프로덕션에 가장 적합한 모델을 손쉽게 식별할 수 있습니다. 새로운 환경은 이미 많은
Databricks 워크스페이스에 출시되었으며 곧 모든 곳에서 사용할 수 있습니다.
워크스페이스 사이드바에서Experiment 로 이동하여 Experiment 선택하기만 하면
시작할 수 있습니다. 새로운 MLflow Experiment UI가 제공하는 모든 것을 탐색하고
피드백을 기다리는 것이 좋습니다.