Термин · Глоссарий B2B-ПО

ML (ML)

ML (Machine Learning, машинное обучение) – подраздел искусственного интеллекта, в котором алгоритмы автоматически учатся на данных и улучшают свои предсказания без явного программирования правил: обучение с учителем, без учителя и с подкреплением.

Буква «M» В категориях: 5 Платформ: 6+

Введение

ML (Machine Learning, машинное обучение) – раздел искусственного интеллекта, изучающий алгоритмы и статистические модели, способные автоматически обучаться на данных и делать предсказания или принимать решения без явного программирования правил. Вместо того чтобы кодировать правила «если X, то Y», ML-алгоритм получает примеры входных данных и желаемых ответов, самостоятельно находя закономерности.

ML является технологической основой современных систем рекомендаций, распознавания речи и изображений, обнаружения мошенничества, прогнозирования спроса и сотен других прикладных задач. Взрывной рост ML связан с доступностью больших данных, вычислительных мощностей (GPU) и открытых фреймворков (TensorFlow, PyTorch, scikit-learn).

История и контекст

Термин «machine learning» ввёл Артур Самюэль в 1959 году, описывая программу, которая научилась играть в шашки. В 1980-х развивались нейронные сети (алгоритм обратного распространения ошибки). В 1990-х – статистические методы (SVM, деревья решений). В 2000-х – ансамблевые методы (Random Forest, Gradient Boosting).

Революция глубокого обучения (Deep Learning) началась в 2012 году, когда нейросеть AlexNet победила на ImageNet, снизив ошибку классификации изображений вдвое. После 2016 года ML стал массовым явлением: облачные платформы ML (AWS SageMaker, Google Vertex AI, Yandex DataSphere), открытые фреймворки и обширные датасеты сделали ML доступным для бизнеса.

Как это работает

ML-алгоритмы делятся на три основные парадигмы:

  • Обучение с учителем (Supervised Learning) – модель обучается на размеченных данных (X → Y). Задачи: классификация (спам/не спам), регрессия (прогноз цены), детекция объектов.
  • Обучение без учителя (Unsupervised Learning) – данные без меток, модель находит скрытые структуры. Задачи: кластеризация клиентов, снижение размерности, обнаружение аномалий.
  • Обучение с подкреплением (Reinforcement Learning) – агент учится на наградах/штрафах за действия в среде. Применяется в игровых ИИ, роботике, управлении рекомендациями.

Типичный ML-пайплайн: сбор и очистка данных → инжиниринг признаков → выбор и обучение модели → валидация и тестирование → развёртывание (MLOps) → мониторинг. Популярные алгоритмы: линейная и логистическая регрессия, SVM, Random Forest, Gradient Boosting (XGBoost, LightGBM), нейронные сети.

Где применяется

  • Финансы – кредитный скоринг, антифрод, алгоритмическая торговля.
  • Ритейл – рекомендательные системы, прогнозирование спроса, динамическое ценообразование.
  • Здравоохранение – диагностика по медицинским изображениям, прогноз исходов.
  • Промышленность – предиктивное обслуживание оборудования, контроль качества.
  • Телеком – прогноз оттока, оптимизация сетевых ресурсов.

Преимущества и ограничения

Преимущества: автоматическое обнаружение сложных нелинейных зависимостей; масштабируемость на большие объёмы данных; улучшение с ростом данных; применимость к задачам, где ручное программирование правил невозможно.

Ограничения: требует большого количества качественных данных; сложность интерпретации («чёрный ящик»); риск переобучения; дрейф данных требует регулярного переобучения; необходимость в специализированных кадрах (ML-инженерах, Data Scientists).

Связь с другими понятиями

ML является подмножеством ИИ (искусственного интеллекта). Глубокое обучение (Deep Learning) – подраздел ML, использующий многослойные нейронные сети, который лежит в основе LLM и компьютерного зрения. NLP – применение ML к обработке естественного языка. MLOps обеспечивает операционную поддержку ML-моделей в production. AutoML автоматизирует выбор алгоритмов и гиперпараметров для заданной задачи.

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «ML».

Платформы класса «ML»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

Tarantool Data Grid

Tarantool Data Grid

Данные и аналитика
Tarantool — высокопроизводительная СУБД с поддержкой in-memory и дискового хранения данных, обеспечивающая ACI...
Цена по запросу
★ 4.8
Подробнее →
БАРС.Мониторинг-ЖКХ

БАРС.Мониторинг-ЖКХ

Данные и аналитика
Информационно-аналитическая система для мониторинга и управления жилищно-коммунальным хозяйством на региональн...
Цена по запросу
★ 5.0
Подробнее →
МА

Маршрутизатор

Данные и аналитика
Яндекс.Маршрутизация (Router API) — программный интерфейс для построения оптимальных маршрутов, расчёта времен...
Цена по запросу
Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «ML».

Где применяется

Отрасли, в которых «ML» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Частые вопросы про ML

Что такое машинное обучение?

Алгоритмы, автоматически обучающиеся на данных и делающие предсказания без явного программирования правил – в отличие от традиционного программирования.

Чем ML отличается от ИИ?

ИИ – широкая область имитации когнитивных функций человека. ML – конкретный подход внутри ИИ, основанный на обучении алгоритмов на данных.

Что такое глубокое обучение?

Подраздел ML, использующий многослойные нейронные сети (глубокие сети). Основа компьютерного зрения, NLP, LLM – задач, где традиционные алгоритмы ML уступали.

Сколько данных нужно для ML?

Зависит от задачи. Для классических алгоритмов (Random Forest) – тысячи примеров. Для глубоких нейросетей – миллионы. Transfer learning позволяет использовать претренированные модели с меньшими данными.

Что такое переобучение (overfitting)?

Ситуация, когда модель слишком точно подстраивается под обучающую выборку и плохо обобщается на новые данные. Решается регуляризацией, dropout, ранней остановкой.

Чем AutoML отличается от классического ML?

AutoML автоматически подбирает алгоритм, признаки и гиперпараметры модели без участия человека. Упрощает разработку для не-специалистов, но ограничивает контроль.