Термин · Глоссарий B2B-ПО

ML (ML)

ML (Machine Learning, машинное обучение) – подраздел искусственного интеллекта, в котором алгоритмы автоматически учатся на данных и улучшают свои предсказания без явного программирования правил: обучение с учителем, без учителя и с подкреплением.

Буква «M» В категориях: 5 Платформ: 6+

Введение

ML (Machine Learning, машинное обучение) – раздел искусственного интеллекта, изучающий алгоритмы и статистические модели, способные автоматически обучаться на данных и делать предсказания или принимать решения без явного программирования правил. Вместо того чтобы кодировать правила «если X, то Y», ML-алгоритм получает примеры входных данных и желаемых ответов, самостоятельно находя закономерности.

ML является технологической основой современных систем рекомендаций, распознавания речи и изображений, обнаружения мошенничества, прогнозирования спроса и сотен других прикладных задач. Взрывной рост ML связан с доступностью больших данных, вычислительных мощностей (GPU) и открытых фреймворков (TensorFlow, PyTorch, scikit-learn).

История и контекст

Термин «machine learning» ввёл Артур Самюэль в 1959 году, описывая программу, которая научилась играть в шашки. В 1980-х развивались нейронные сети (алгоритм обратного распространения ошибки). В 1990-х – статистические методы (SVM, деревья решений). В 2000-х – ансамблевые методы (Random Forest, Gradient Boosting).

Революция глубокого обучения (Deep Learning) началась в 2012 году, когда нейросеть AlexNet победила на ImageNet, снизив ошибку классификации изображений вдвое. После 2016 года ML стал массовым явлением: облачные платформы ML (AWS SageMaker, Google Vertex AI, Yandex DataSphere), открытые фреймворки и обширные датасеты сделали ML доступным для бизнеса.

Как это работает

ML-алгоритмы делятся на три основные парадигмы:

Обучение с учителем (Supervised Learning) – модель обучается на размеченных данных (X → Y). Задачи: классификация (спам/не спам), регрессия (прогноз цены), детекция объектов.
Обучение без учителя (Unsupervised Learning) – данные без меток, модель находит скрытые структуры. Задачи: кластеризация клиентов, снижение размерности, обнаружение аномалий.
Обучение с подкреплением (Reinforcement Learning) – агент учится на наградах/штрафах за действия в среде. Применяется в игровых ИИ, роботике, управлении рекомендациями.

Типичный ML-пайплайн: сбор и очистка данных → инжиниринг признаков → выбор и обучение модели → валидация и тестирование → развёртывание (MLOps) → мониторинг. Популярные алгоритмы: линейная и логистическая регрессия, SVM, Random Forest, Gradient Boosting (XGBoost, LightGBM), нейронные сети.

Где применяется

Финансы – кредитный скоринг, антифрод, алгоритмическая торговля.
Ритейл – рекомендательные системы, прогнозирование спроса, динамическое ценообразование.
Здравоохранение – диагностика по медицинским изображениям, прогноз исходов.
Промышленность – предиктивное обслуживание оборудования, контроль качества.
Телеком – прогноз оттока, оптимизация сетевых ресурсов.

Преимущества и ограничения

Преимущества: автоматическое обнаружение сложных нелинейных зависимостей; масштабируемость на большие объёмы данных; улучшение с ростом данных; применимость к задачам, где ручное программирование правил невозможно.

Ограничения: требует большого количества качественных данных; сложность интерпретации («чёрный ящик»); риск переобучения; дрейф данных требует регулярного переобучения; необходимость в специализированных кадрах (ML-инженерах, Data Scientists).

Связь с другими понятиями

ML является подмножеством ИИ (искусственного интеллекта). Глубокое обучение (Deep Learning) – подраздел ML, использующий многослойные нейронные сети, который лежит в основе LLM и компьютерного зрения. NLP – применение ML к обработке естественного языка. MLOps обеспечивает операционную поддержку ML-моделей в production. AutoML автоматизирует выбор алгоритмов и гиперпараметров для заданной задачи.

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «ML».

Платформы класса «ML»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

Tarantool Data Grid

Данные и аналитика

Tarantool — высокопроизводительная СУБД с поддержкой in-memory и дискового хранения данных, обеспечивающая ACI...

Цена по запросу

★ 4.8

Подробнее →

Система обработки неформализованных естественных текстов ИВК СОНЕТ

"ИВК СОНЕТ™" позволяет автоматизировать один из самых трудоемких процессов - обработку текстовой информации, е...

Цена по запросу

★ 4.7

Подробнее →

Anyport

Cервис для управления грузоперевозками

Цена по запросу

Подробнее →

БАРС.Мониторинг-ЖКХ

Данные и аналитика

Информационно-аналитическая система для мониторинга и управления жилищно-коммунальным хозяйством на региональн...

Цена по запросу

★ 5.0

Подробнее →

МА

Маршрутизатор

Данные и аналитика

Яндекс.Маршрутизация (Router API) — программный интерфейс для построения оптимальных маршрутов, расчёта времен...

Цена по запросу

Подробнее →

"Voice2Med". Программа для голосового заполнения медицинской документации.

Данные и аналитика

Voice2Med - программа для голосового заполнения медицинской документации в режиме реального времени. Система а...

Цена по запросу

★ 4.7

Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «ML».

Данные и аналитика Машинное обучение ML-платформы AutoML решения Платформы ИИ/GenAI

Где применяется

Отрасли, в которых «ML» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Промышленность и производство

Здравоохранение и медицина

Финансы и финтех

Торговля (оптовая и розничная)

Связь и телеком

Частые вопросы про ML

Что такое машинное обучение?

Алгоритмы, автоматически обучающиеся на данных и делающие предсказания без явного программирования правил – в отличие от традиционного программирования.

Чем ML отличается от ИИ?

ИИ – широкая область имитации когнитивных функций человека. ML – конкретный подход внутри ИИ, основанный на обучении алгоритмов на данных.

Что такое глубокое обучение?

Подраздел ML, использующий многослойные нейронные сети (глубокие сети). Основа компьютерного зрения, NLP, LLM – задач, где традиционные алгоритмы ML уступали.

Сколько данных нужно для ML?

Зависит от задачи. Для классических алгоритмов (Random Forest) – тысячи примеров. Для глубоких нейросетей – миллионы. Transfer learning позволяет использовать претренированные модели с меньшими данными.

Что такое переобучение (overfitting)?

Ситуация, когда модель слишком точно подстраивается под обучающую выборку и плохо обобщается на новые данные. Решается регуляризацией, dropout, ранней остановкой.

Чем AutoML отличается от классического ML?

AutoML автоматически подбирает алгоритм, признаки и гиперпараметры модели без участия человека. Упрощает разработку для не-специалистов, но ограничивает контроль.

Введение

История и контекст

Как это работает

Где применяется

Преимущества и ограничения

Связь с другими понятиями

Связанные термины

Платформы класса «ML»

Tarantool Data Grid

Система обработки неформализованных естественных текстов ИВК СОНЕТ

Anyport

БАРС.Мониторинг-ЖКХ

Маршрутизатор

"Voice2Med". Программа для голосового заполнения медицинской документации.

Категории каталога

Где применяется

Частые вопросы про ML

Что такое машинное обучение?

Чем ML отличается от ИИ?

Что такое глубокое обучение?

Сколько данных нужно для ML?

Что такое переобучение (overfitting)?

Чем AutoML отличается от классического ML?

Контур Диадок: Логистика

Искусственный интеллект в медицине

Контур Маркет + ОФД — интегрированная платформа для розничной торговли