Ir para o conteúdo principal

MLflow gerenciado

Crie modelos melhores e aplicativos de IA generativa

O que é o Managed MLflow?

O Managed MLflow amplia a funcionalidade do MLflow, uma plataforma de código aberto desenvolvida pela Databricks para criar melhores modelos e aplicativos de IA generativa, com foco na confiabilidade, segurança e escalabilidade da empresa. A última atualização do MLflow introduz recursos inovadores de GenAI e LLMOps que aprimoram sua capacidade de gerenciar e implantar grandes modelos de linguagem (LLMs). O suporte expandido para LLM é obtido por meio de novas integrações com ferramentas LLM padrão do setor, OpenAI e Hugging Face Transformers, bem como o MLflow Deployments Server. Além disso, a integração do MLflow com frameworks LLM (por exemplo, LangChain) permite o desenvolvimento simplificado de modelos para a criação de aplicativos de IA generativa para diversos casos de uso, incluindo chatbots, resumo de documentos, classificação de texto, análise de sentimento e muito mais.

Benefícios

model development

Desenvolvimento de modelos

Aprimore e agilize o gerenciamento do ciclo de vida do machine learning com uma estrutura padronizada para modelos prontos para produção. Managed MLflow Recipes permitem a inicialização imediata de projetos de ML, a iteração rápida e a implantação de modelos em grande escala. Crie aplicativos como chatbots, resumo de documentos, análise de sentimentos e classificação sem esforço. Desenvolva facilmente aplicativos de IA generativa (por exemplo, chatbots e resumo de documentos) com as ofertas de LLM do MLflow, que se integram perfeitamente ao LangChain, Hugging Face e OpenAI.

Deploy a model for a batch interface

Acompanhamento de experimentos

Execute experimentos com qualquer biblioteca, estrutura ou idioma de ML e acompanhe automaticamente parâmetros, métricas, códigos e modelos de cada experimento. Ao usar o MLflow na Databricks, você pode compartilhar, gerenciar e comparar com segurança os resultados do experimento, juntamente com os artefatos correspondentes e versões de código, graças às integrações incorporadas com o Databricks Workspace e os notebooks. Você também poderá avaliar os resultados dos experimentos com GenAI e melhorar a qualidade com a funcionalidade de avaliação do MLflow.

model development

Gerenciamento de modelos

Use um local central para descobrir e compartilhar modelos de ML, colaborar na migração de experimentação para testes e produção online, integrar com fluxos de trabalho de aprovação e governança e pipelines de CI/CD e monitorar implantações de ML e seu desempenho. O MLflow Model Registry facilita o compartilhamento de experiência e conhecimento e ajuda você a manter o controle.

model development

Implantação de modelos

Implemente rapidamente modelos de produção para inferência em lote no Apache Spark™ ou como APIs REST usando integração integrada com containers do Docker, Azure ML ou Amazon SageMaker. Com o Managed MLflow na Databricks, você pode operacionalizar e monitorar modelos de produção usando o Databricks Jobs Scheduler e os clusters gerenciados automaticamente para dimensionar com base nas necessidades da empresa.

As atualizações mais recentes do MLflow fornecem aplicativos de IA generativa prontos para implantação. Agora, você pode usar o Databricks Model Serving para implantar em escala seus chatbots e outros aplicativos de IA generativa, como resumos de documentos, análise de sentimento e classificação.

Features

MLflow Tracking

MLFLOW TRACKING: Automatically log parameters, code versions, metrics, and artifacts for each run using Python, REST, R API, and Java API

GENERATIVE AI DEVELOPMENT: Simplify model development to build GenAI applications for a variety of use cases such as chatbots, document summarization, sentiment analysis and classification with MLflow’s Deployments Server and Evaluation UI, supported by native integration with LangChain, and seamless UI for fast prototyping and iteration.

MLFLOW TRACKING SERVER: Get started quickly with a built-in tracking server to log all runs and experiments in one place. No configuration needed on Databricks.

EXPERIMENT MANAGEMENT: Create, secure, organize, search and visualize experiments from within the workspace with access control and search queries.

MLFLOW RUN SIDEBAR: Automatically track runs from within notebooks and capture a snapshot of your notebook for each run so that you can always go back to previous versions of your code.

LOGGING DATA WITH RUNS: Log parameters, datasets, metrics, artifacts and more as runs to local files, to a SQLAlchemy compatible database, or remotely to a tracking server.

DELTA LAKE INTEGRATION: Track large-scale datasets that fed your models with Delta Lake snapshots.

ARTIFACT STORE: Store large files such as S3 buckets, shared NFS file system, and models in Amazon S3, Azure Blob Storage, Google Cloud Storage, SFTP server, NFS, and local file paths.

MLflow Models

MLFLOW MODELS: A standard format for packaging machine learning models that can be used in a variety of downstream tools — for example, real-time serving through a REST API or batch inference on Apache Spark.

MODEL CUSTOMIZATION: Use Custom Python Models and Custom Flavors for models from an ML library that is not explicitly supported by MLflow’s built-in flavors.

BUILT-IN MODEL FLAVORS: MLflow provides several standard flavors that might be useful in your applications, like Python and R functions, Hugging Face, OpenAI and LangChain, PyTorch, Spark MLlib, TensorFlow and ONNX.

BUILT-IN DEPLOYMENT TOOLS: Quickly deploy on Databricks via Apache Spark UDF for a local machine, or several other production environments such as Microsoft Azure ML, Amazon SageMaker, and building Docker Images for Deployment.

MLflow Model Registry

CENTRAL REPOSITORY: Register MLflow models with the MLflow Model Registry. A registered model has a unique name, version, stage and other metadata.

MODEL VERSIONING: Automatically keep track of versions for registered models when updated.

MODEL STAGE: Assign preset or custom stages to each model version, like “Staging” and “Production” to represent the lifecycle of a model.

CI/CD WORKFLOW INTEGRATION: Record stage transitions, request, review and approve changes as part of CI/CD pipelines for better control and governance.

MODEL STAGE TRANSITIONS: Record new registration events or changes as activities that automatically log users, changes, and additional metadata such as comments.

MLflow Deployments Server

GOVERN ACCESS TO LLMS: Manage SaaS LLM credentials.

CONTROL COSTS: Set up rate limits.

STANDARDIZE LLM INTERACTIONS: Experiment with different OSS/SaaS LLMs with standard input/output interfaces for different tasks: completions, chat, embeddings.

MLflow Projects

MLFLOW PROJECTS: MLflow projects allow you to specify the software environment that is used to execute your code. MLflow currently supports the following project environments: Conda environment, Docker container environment, and system environment. Any Git repo or local directory can be treated as an MLflow project.

REMOTE EXECUTION MODE: Run MLflow Projects from Git or local sources remotely on Databricks clusters using the Databricks CLI to quickly scale your code.

MLflow Recipes

SIMPLIFIED PROJECT STARTUP: MLflow Recipes provides out-of-box connected components for building and deploying ML models.

ACCELERATED MODEL ITERATION: MLflow Recipes creates standardized, reusable steps for model iteration — making the process faster and less expensive.

AUTOMATED TEAM HANDOFFS: Opinionated structure provides modularized production-ready code, enabling automatic handoff from experimentation to production.

Veja nossas notícias de produtos do Azure Databricks e da AWS para conhecer nossos recursos mais recentes.

Comparação das ofertas de MLflow

Open Source MLflow

Managed MLflow on Databricks

Acompanhamento de experiments

API MLflow Tracking

Servidor de rastreamento do MLflow

Hosting interno

Totalmente gerenciado

Integração de notebooks

Integração de fluxos de trabalho

Projetos reproduzíveis

MLflow Projects

Integração do Git e Conda

Nuvem/clusters escaláveis para execução de projetos

Gerenciamento de modelos

MLflow Model Registry

Controle de versões de modelos

Transição de estágio baseada em ACL

Integrações de fluxos de trabalho CI/CD

Implementação flexível

Inferência de batch integrada

MLflow Models

Análise de streaming integrada

Segurança e gerenciamento

Alta disponibilidade

Atualizações automatizadas

Controle de acesso baseado na função

Como funciona

O MLflow é um conjunto leve de APIs e interfaces de usuário que pode ser usado com qualquer estrutura de ML em todo o fluxo de trabalho de machine learning. Inclui quatro componentes: MLflow Tracking, MLflow Projects, MLflow Models e MLflow Model Registry

Mais sobre o MLflow

managed mlflow
MLflow Tracking

Registre e consulte experimentos: código, dados, configuração e resultados.

Saiba mais
managed mlflow
MLflow Projects

Formato de embalagem para execuções reproduzíveis em qualquer plataforma.

Saiba mais
managed mlflow
MLflow Models

Formato geral para enviar modelos para diversas ferramentas de implantação.

Saiba mais
managed mlflow
MLflow Model Registry

Repositório centralizado para gerenciar os modelos de MLflow de forma colaborativa durante todo o ciclo de vida.

Saiba mais

MLflow gerenciado na Databricks

O Managed MLflow na Databricks é uma versão totalmente gerenciada do MLflow que oferece aos profissionais reprodutibilidade e gerenciamento de experimentos em notebooks, jobs e armazenamentos de dados da Databricks, com confiabilidade, segurança e escalabilidade da Databricks Data Intelligence Platform.

Leia os documentos

Log Your First Run as an Experiment MLflow

Recursos