Термин · Глоссарий B2B-ПО

MLflow (MLflow)

Открытая AI/ML-платформа, созданная Databricks в 2018 году. Включает трекинг экспериментов, управление версиями моделей (Model Registry), инструменты развёртывания и, начиная с версии 3.0 (2025), наблюдаемость LLM-агентов. Более 30 млн загрузок в месяц, 5000+ организаций-пользователей.

Буква «M» В категориях: 3 Платформ: 6+

Введение

MLflow – открытая AI/ML-платформа для управления жизненным циклом моделей машинного обучения. Создана Databricks и выпущена в июне 2018 года. Изначально фокусировалась на трекинге экспериментов для классических ML-моделей; MLflow 3.0 (2025) расширил платформу до полноценной системы наблюдаемости и управления LLM-агентами. По данным Databricks, MLflow имеет более 30 млн загрузок в месяц, более 850 контрибьюторов и используется в более чем 5000 организациях по всему миру.

История и контекст

MLflow появился как ответ на хаос в ML-разработке: разные команды использовали несовместимые форматы логирования, версии моделей терялись, воспроизвести эксперименты было невозможно. Databricks выпустили MLflow в открытый доступ в 2018 году с тремя компонентами: Tracking, Projects, Models. В 2019 добавился Model Registry. С 2023 года – поддержка LLM fine-tuning и GenAI-трассировки. MLflow 3 (2025) ввёл концепцию Logged Models, Deployment Jobs, промпт-менеджмент и LLM-evaluation – превратившись из MLOps-инструмента в полноценную AI Engineering Platform.

Как это работает

MLflow состоит из нескольких ключевых компонентов:

  • MLflow Tracking – API для логирования параметров, метрик, артефактов и версий кода во время обучения. Данные хранятся на tracking-сервере (локальном или облачном).
  • MLflow Projects – стандарт упаковки ML-кода для воспроизводимых запусков с зависимостями через Conda или Docker.
  • MLflow Models – формат упаковки модели, поддерживающий множество ML-фреймворков (sklearn, PyTorch, TensorFlow, XGBoost) и deployment-платформ (Docker, Azure ML, AWS SageMaker).
  • Model Registry – централизованный реестр версий моделей с управлением стадиями (Staging, Production, Archived) и интеграцией с Unity Catalog на Databricks.
  • MLflow Tracing – OpenTelemetry-совместимая трассировка запросов к LLM-агентам: входы, выходы, промежуточные шаги, вызовы инструментов.

MLflow поддерживает автоматическое логирование (autolog) для популярных фреймворков: достаточно вызвать mlflow.sklearn.autolog() перед обучением модели.

Где применяется

  • Команды ML-инженеров – единое место для сравнения экспериментов, воспроизводимости, управления версиями моделей.
  • MLOps-пайплайны – интеграция с CI/CD (GitHub Actions, GitLab CI) для автоматического тестирования и деплоя моделей.
  • LLM-разработка – трекинг fine-tuning runs, управление промптами, оценка качества агентов.
  • Корпоративная AI – управление доступом, аудит, lineage-трекинг через Unity Catalog на Databricks.
  • Исследования – документирование экспериментов для воспроизводимости научных результатов.

Преимущества и ограничения

Преимущества: открытый исходный код; агностик к ML-фреймворку; богатая экосистема интеграций (50+ фреймворков); единый интерфейс для классического ML и GenAI; активное сообщество (850+ контрибьюторов).

Ограничения: для production-масштаба требует либо Databricks Managed MLflow, либо существенной инфраструктурной настройки; при большом числе экспериментов UI может быть медленным; ограниченная нативная поддержка распределённого обучения (решается через KubeFlow или Ray).

Связь с другими понятиями

KubeFlow – альтернативная/дополняющая платформа оркестрации ML на Kubernetes: KubeFlow управляет пайплайнами обучения, MLflow – трекингом и реестром. DVC специализируется на версионировании данных и ML-пайплайнов через Git, часто используется совместно с MLflow. Feature Store предоставляет признаки, которые MLflow логирует как входы экспериментов. Мониторинг модели в production – следующий этап после регистрации модели в MLflow Model Registry. Evaluation (МО) реализована в MLflow через встроенные метрики и LLM-judges.

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «MLflow».

Платформы класса «MLflow»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

Нейромодуль — программный продукт класса платформ ИИ и нейротехнологий, разработанный ООО «СИТ» (ИНН 667042485...
Цена по запросу
Подробнее →
SD

SDP DataLab

Машинное обучение
SDP DataLab — ML-платформа в составе SberData Platform от СберТех для разработки, обучения и развёртывания мод...
Цена по запросу
★ 4.7
Подробнее →
БАРС.Мониторинг-ЖКХ

БАРС.Мониторинг-ЖКХ

Данные и аналитика
Информационно-аналитическая система для мониторинга и управления жилищно-коммунальным хозяйством на региональн...
Цена по запросу
★ 5.0
Подробнее →
Tarantool Data Grid

Tarantool Data Grid

Данные и аналитика
Tarantool — высокопроизводительная СУБД с поддержкой in-memory и дискового хранения данных, обеспечивающая ACI...
Цена по запросу
★ 4.8
Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «MLflow».

Где применяется

Отрасли, в которых «MLflow» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Частые вопросы про MLflow

Чем MLflow отличается от KubeFlow?

MLflow – трекинг экспериментов и управление версиями моделей, фреймворк-агностик. KubeFlow – оркестрация ML-пайплайнов на Kubernetes. Часто используются совместно.

Что такое MLflow Model Registry?

Централизованный реестр версий ML-моделей с управлением стадиями (Staging, Production, Archived), комментариями, аннотациями и интеграцией с CI/CD для управляемого деплоя.

Работает ли MLflow без Databricks?

Да, MLflow полностью опенсорс. Можно развернуть self-hosted MLflow tracking server на любой инфраструктуре. Managed MLflow на Databricks добавляет enterprise-функции.

Что нового в MLflow 3?

MLflow 3 (2025) добавил первоклассную поддержку GenAI: Logged Models, трассировку LLM-агентов (OpenTelemetry), промпт-менеджмент, AI gateway, LLM-evaluation suite.

Как MLflow логирует параметры модели?

Через API: mlflow.log_param('lr', 0.001) и mlflow.log_metric('accuracy', 0.95). При autolog() фреймворк логирует параметры автоматически без ручных вызовов.