Иви (ivi.ru) — ML-система двухэтапных рекомендаций с Feature Store
Описание проекта
ML-команда онлайн-кинотеатра ivi построила и развивает комплексную двухэтапную архитектуру рекомендательных систем, которая обеспечивает персонализацию всех ключевых сценариев потребления контента:
1. Candidate Generation (первый этап) Из всего каталога (десятки тысяч тайтлов) алгоритмы отбирают релевантный пул кандидатов для конкретного пользователя. Используется алгоритм EASE-DAN (улучшенная версия EASE).
2. Reranking (второй этап) Модель переранжирует кандидатов с учётом множества признаков (фичей) пользователя, контента и контекста.
Feature Store «Groot» — внутренняя инфраструктура быстрого и медленного хранилищ для признаков всех рекомендательных моделей. Позволяет добавлять десятки новых признаков за 1–2 дня.
A/B-тестирование — новые гипотезы запускаются в эксперимент за 1 час; для приоритизации используются ICE, RICE и методы Causal Inference.
Покрытие: рекомендации фильмов и сериалов на главной, персонализированный набор кнопок-фильтров, рекомендации коротких видео (запущены), раздел мини-драм (вертикальные сериалы, запущен в 2025).
Задача
Онлайн-кинотеатр с тысячами тайтлов сталкивается с проблемой «паралича выбора» у пользователей. Стандартные рекомендации по жанру или популярности не учитывают индивидуальные вкусы. Кроме того, высокая скорость добавления нового контента (в том числе коротких видео) требует гибкой инфраструктуры для быстрого развёртывания новых сценариев.
Цели внедрения
-
Максимизировать релевантность рекомендаций для каждого пользователя
-
Ускорить цикл разработки и тестирования новых ML-гипотез
-
Обеспечить масштабируемость системы для новых форматов (короткие видео, мини-драмы)
-
Увеличить вовлечённость пользователей и время просмотра
Результаты
-
Финансы
-
Не раскрыты Время
-
Добавление новых ML-признаков: 1–2 дня (ранее — недели)
-
Запуск нового A/B-эксперимента: 1 час
-
EASE-прототип быстро показал положительный результат на A/B-тесте Качество и эффективность
-
Алгоритм EASE-DAN: положительный результат на A/B-тесте; улучшение качества рекомендаций похожего контента
-
Персонализация охватывает: главную страницу, фильтры, рекомендации похожего, рекомендации новинок Нагрузка и масштаб
-
Охват: все пользователи ivi (миллионы подписчиков)
-
Новые форматы: раздел коротких видео, вертикальные мини-драмы (2025) Надёжность
-
Feature Store обеспечивает согласованность признаков между обучением и инференсом
-
Nvidia Triton Inference Server — промышленный уровень обслуживания моделей Импортозамещение и compliance
-
Полностью российская разработка; хранение данных на собственной инфраструктуре Качественный эффект (если цифры не раскрыты): ML-команда ivi: «Мы делаем так, чтобы каждому пользователю показывался именно тот контент, который будет ему интересен. Это касается всего: от рекомендаций фильмов и сериалов до персонализированного набора кнопок с различными фильтрациями контента».