Термин · Глоссарий B2B-ПО

Матрица путаницы (Confusion Matrix)

Матрица ошибок (Confusion Matrix) – таблица для оценки качества классификационной модели машинного обучения, показывающая соотношение правильных и ошибочных предсказаний по каждому классу. На её основе вычисляются precision, recall, F1-score и accuracy.

Буква «М» В категориях: 5 Платформ: 6+

Введение

Матрица ошибок (Confusion Matrix, также матрица путаницы или матрица несоответствий) – это таблица, сводно отображающая результаты работы классификационной модели машинного обучения путём сопоставления предсказанных и фактических меток классов на тестовой выборке. Для задач бинарной классификации матрица имеет размер 2×2; для многоклассовых задач – N×N, где N – число классов.

Матрица ошибок является отправной точкой для вычисления всех ключевых метрик классификатора: точности (accuracy), прецизионности (precision), полноты (recall), F1-меры и специфичности. Понимание матрицы ошибок критично для правильной интерпретации модели, особенно при несбалансированных классах.

История и контекст

Матрица ошибок как инструмент оценки восходит к работам в области распознавания образов и статистики 1950–1960-х годов. В медицинской диагностике аналогичные понятия (чувствительность/sensitivity и специфичность/specificity) применяются с тех же времён. С расцветом машинного обучения в 1990-х и 2000-х годах confusion matrix стала стандартным инструментом в scikit-learn, TensorFlow, MATLAB и других платформах. Сегодня её визуализация является обязательным элементом отчёта о качестве любой классификационной модели.

Как это работает

Для бинарной классификации матрица содержит четыре ячейки:

  • True Positive (TP): модель предсказала положительный класс, и он действительно положительный.
  • True Negative (TN): модель предсказала отрицательный класс, и он действительно отрицательный.
  • False Positive (FP, ошибка I рода): модель предсказала положительный, но фактически отрицательный («ложная тревога»).
  • False Negative (FN, ошибка II рода): модель предсказала отрицательный, но фактически положительный («пропущенный случай»).

На основе этих четырёх значений вычисляются метрики:

  • Accuracy = (TP + TN) / (TP + TN + FP + FN) – доля правильных предсказаний.
  • Precision = TP / (TP + FP) – доля истинно положительных среди всех предсказанных положительных.
  • Recall (Sensitivity) = TP / (TP + FN) – доля обнаруженных положительных среди всех реальных положительных.
  • F1-score = 2 × (Precision × Recall) / (Precision + Recall) – гармоническое среднее precision и recall.

Где применяется

  • Медицинская диагностика: оценка классификатора болезней. FN критичны: пропущенный рак опаснее ложной тревоги → оптимизируют recall.
  • Антифрод: обнаружение мошеннических транзакций. FP означает блокировку легального платежа → баланс между recall и precision.
  • Спам-фильтрация: FP (легальное письмо в спам) критично для пользователя → высокая precision.
  • Компьютерное зрение: распознавание объектов, дефектов на производстве, лиц на изображениях.
  • NLP-классификация: тональность текста, категоризация обращений в службу поддержки, спам-детекция.
  • Кредитный скоринг: оценка вероятности дефолта, балансировка между отказом хорошим заёмщикам и одобрением плохих.

Преимущества и ограничения

Преимущества: детальная картина ошибок по классам, основа для выбора порога классификации (threshold), незаменима при несбалансированных классах (где accuracy вводит в заблуждение).

Ограничения: при большом числе классов (N>10) матрица становится трудночитаемой, не учитывает вероятности предсказаний (для этого нужны ROC AUC, PR AUC), требует разметки тестовых данных.

Связь с другими понятиями

Confusion matrix является базой для построения ROC-кривой и Precision-Recall кривой. Тесно связана с порогом классификации (threshold) – изменение порога напрямую влияет на соотношение TP/FP/FN/TN. Используется совместно с метриками AUC-ROC для оценки классификаторов. В задачах многоклассовой классификации применяются macro/micro/weighted усреднения метрик. Является стандартным выводом функции sklearn.metrics.confusion_matrix в Python scikit-learn.

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «Матрица путаницы».

Платформы класса «Матрица путаницы»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

Уникальные возможности ABBYY InfoExtractor SDK по выявлению в текстах объектов, фактов и связей между ними поз...
Цена по запросу
★ 4.5
Подробнее →
ФО

Форпост

Управление городской инфраструктурой
Форпост — программная платформа для построения масштабируемых систем видеонаблюдения и видеоаналитики на нейро...
Цена по запросу
★ 4.8
Подробнее →
Сервис идентификации потенциальных клиентов на сайте
Цена по запросу
Подробнее →
ТРАНСФЛОУ — модульная интеграционная платформа для построения интеллектуальных транспортных систем (ИТС). Разр...
Цена по запросу
★ 4.5
Подробнее →
ИВ

ИКАР видео волл контрол

Управление городской инфраструктурой
ИКАР видео волл контрол — программное обеспечение компании (ИНН 7838404170) для управления видеостенами (video...
Цена по запросу
Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «Матрица путаницы».

Где применяется

Отрасли, в которых «Матрица путаницы» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Частые вопросы про Матрица путаницы

Что такое False Positive и почему он важен?

FP (ложно-положительный) – модель предсказала положительный класс, но на самом деле он отрицательный. В спам-фильтре это важное письмо в папке «спам». Высокое FP снижает precision. Критичность FP зависит от задачи.

Когда accuracy не подходит как метрика?

При несбалансированных классах. Если 99% образцов – один класс, модель, всегда предсказывающая его, даст accuracy 99%, но будет бесполезной. Тогда смотрят на F1-score, precision, recall по каждому классу.

Что лучше: высокий precision или высокий recall?

Зависит от задачи. Высокий recall важен, когда цена пропуска велика (онкология – лучше ложная тревога, чем пропущенный рак). Высокий precision важен, когда цена ложной тревоги высока (блокировка транзакций).

Что такое F1-score?

F1-score – гармоническое среднее precision и recall. Равно 1 только при максимальных precision и recall одновременно. Применяется, когда важен баланс между двумя метриками и классы несбалансированы.

Как читать многоклассовую матрицу ошибок?

По строкам – реальные классы, по столбцам – предсказанные. Диагональные элементы – правильные предсказания (TP для каждого класса). Внедиагональные – ошибки. Анализируйте, какие классы путаются чаще всего.

Как confusion matrix используется в Python?

В scikit-learn: from sklearn.metrics import confusion_matrix; cm = confusion_matrix(y_true, y_pred). Для визуализации: ConfusionMatrixDisplay или seaborn heatmap. Метрики: classification_report для precision, recall, F1 по всем классам.