Авито Недвижимость — ML-рекомендации, прогноз цен и автомодерация объявлений
Описание проекта
Авито развивает комплекс ML-решений для вертикали Недвижимость с 2015 года (запуск персонализированной ленты рекомендаций). Ключевые компоненты: (1) Рекомендательная система — персональная лента на главной странице и в категории Недвижимость на основе item2vec и поведенческих моделей; (2) Прогноз цены — модель предсказания цены, которая делает приблизительный расчёт и предлагает его пользователям при размещении; (3) Автомодерация — ML-система проверяет 99% всех объявлений (включая Недвижимость) без участия человека; (4) NLP-анализ описаний — выявление аномалий, мошенничества, нарушений; антифрод в объявлениях.
Задача
Авито обрабатывает десятки миллионов объявлений. Ручная модерация невозможна — система должна автоматически фильтровать нарушения. Пользователи не знают рыночную цену и занижают/завышают стоимость объектов при размещении. Персонализация ленты критически важна для удержания аудитории и монетизации.
Цели внедрения
-
Автоматизировать модерацию объявлений Недвижимости (и других вертикалей)
-
Предоставить пользователям справедливую рыночную цену при размещении
-
Повысить конверсию за счёт персонализированных рекомендаций
-
Снизить мошенничество и нарушения в объявлениях
Результаты
-
Финансы
-
Результаты не раскрыты публично
-
Персонализация ленты напрямую влияет на выручку через монетизацию продвижения объявлений Время
-
Автомодерация: 99% объявлений проверяются мгновенно (без участия модератора)
-
Прогноз цены для пользователя — мгновенно при заполнении формы Качество и эффективность
-
ML-автомодерация охватывает 99% всех объявлений на платформе (все вертикали, включая Недвижимость)
-
Рекомендательная система: персонализированная лента работает с 2015 года, постоянно совершенствуется
-
Модель предсказания цены работает в категориях Недвижимость, Авто и Товары
-
item2vec — базовая embedding-модель, используется в нескольких ML-компонентах платформы Нагрузка и масштаб
-
Более 100 DS-инженеров в Авито (в 2024 году)
-
5 горизонтальных ML-команд: автомодерация, антифрод, монетизация, поиск и рекомендации, AI Lab
-
Платформа Авито: десятки миллионов уникальных пользователей ежемесячно Надёжность
-
Результаты не раскрыты публично Импортозамещение и compliance
-
Полностью собственные российские разработки; данные в российской инфраструктуре; 152-ФЗ