Термин · Глоссарий B2B-ПО

CNN (CNN)

Convolutional Neural Network (свёрточная нейронная сеть) – архитектура глубокого обучения, применяющая операцию свёртки для автоматического извлечения иерархических пространственных признаков. Специализирована для изображений; AlexNet в 2012 году заложила основу современного компьютерного зрения.

Буква «C» В категориях: 3 Платформ: 6+

Введение

CNN (Convolutional Neural Network, свёрточная нейронная сеть) – архитектура нейронной сети, специализированная для обработки данных с сеточной структурой (изображения, видео, 1D-сигналы). Ключевая операция – свёртка: небольшое окно (ядро) последовательно сдвигается по входу и вычисляет скалярное произведение весов ядра и соответствующего фрагмента входа. Это позволяет автоматически извлекать пространственные признаки: края, текстуры, паттерны – не требуя ручного feature engineering.

История и контекст

Первая современная CNN – LeNet-5 (Лекун, 1989) для распознавания рукописных цифр. Переломный момент – AlexNet (Krizhevsky, Sutskever, Hinton, 2012): победа на ImageNet с отрывом 10,8% от второго места. AlexNet доказала превосходство глубоких CNN на GPU и запустила эпоху глубокого обучения. Последующие архитектуры последовательно улучшали качество: VGGNet (2014), Inception (2014), ResNet (2015, остаточные соединения), DenseNet (2017), EfficientNet (2019). Сегодня Vision Transformer (ViT, 2020) составляет конкуренцию CNN на крупных датасетах.

Как это работает

Стандартная CNN состоит из чередующихся слоёв:

Convolutional layer – применяет набор ядер (фильтров) к входу, создавая feature maps. Ядро разделяет веса по всему пространству – это parameter sharing, радикально снижающий число параметров.
Activation (ReLU) – нелинейность после каждой свёртки.
Pooling layer – пространственное субдискретизирование (Max Pooling, Average Pooling): снижает разрешение feature maps, повышает инвариантность к малым сдвигам.
Fully connected (Dense) layer – в конце сети: агрегирует признаки для финальной классификации.

Ключевые свойства CNN: локальная связность (нейрон смотрит на небольшой рецептивный фрагмент), параметрическое разделение (одни веса применяются по всему пространству), иерархичность (ранние слои – края, глубокие слои – сложные объекты).

Где применяется

Классификация изображений – ImageNet, медицинские снимки, спутниковые данные.
Детектирование объектов – YOLO, Faster R-CNN, SSD для задач безопасности, автопилота.
Семантическая сегментация – разделение пикселей на классы (медицинские изображения, картография).
NLP – 1D-свёртки для классификации текста и NER (применяются реже Transformer).
Промышленный контроль качества – детектирование дефектов на конвейере в реальном времени.

Преимущества и ограничения

Преимущества: автоматическое извлечение признаков; parameter sharing снижает число параметров; инвариантность к сдвигам через pooling; высокая производительность на задачах с сеточными данными.

Ограничения: не моделирует дальние зависимости (ограниченный рецептивный фрагмент – решается через dilated convolutions или Transformer); требует больших обучающих датасетов; менее гибка чем Transformer для мультимодальных задач.

Связь с другими понятиями

Нейронная сеть – базовый строительный блок CNN. RNN – аналог для последовательных данных (текст, временные ряды). Transformer заменяет CNN в задачах с большими датасетами благодаря глобальному attention. Аугментация данных – стандартная практика при обучении CNN (flip, crop, color jitter). Компьютерное зрение – главная область применения CNN. Переобучение в CNN снижается через Dropout, Batch Normalization, аугментацию.

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «CNN».

Платформы класса «CNN»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

ABBYY InfoExtractor SDK

Уникальные возможности ABBYY InfoExtractor SDK по выявлению в текстах объектов, фактов и связей между ними поз...

Цена по запросу

★ 4.5

Подробнее →

ФО

Форпост

Управление городской инфраструктурой

Форпост — программная платформа для построения масштабируемых систем видеонаблюдения и видеоаналитики на нейро...

Цена по запросу

★ 4.8

Подробнее →

Facemetric

Платформа видеоаналитики

Цена по запросу

★ 4.7

Подробнее →

Andata

Сервис идентификации потенциальных клиентов на сайте

Цена по запросу

Подробнее →

СП

Сервисная платформа транспортных приложений для модульного построения единой платформы управления транспортной системой - ЕПУТС «ТРАНСФЛОУ»

Управление городской инфраструктурой

ТРАНСФЛОУ — модульная интеграционная платформа для построения интеллектуальных транспортных систем (ИТС). Разр...

Цена по запросу

★ 4.5

Подробнее →

ИВ

ИКАР видео волл контрол

Управление городской инфраструктурой

ИКАР видео волл контрол — программное обеспечение компании (ИНН 7838404170) для управления видеостенами (video...

Цена по запросу

Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «CNN».

Машинное обучение Платформы ИИ/GenAI Обработка естественного языка (NLP/NLU)

Где применяется

Отрасли, в которых «CNN» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Промышленность и производство

Цифровые услуги (B2C, e-commerce, онлайн-сервисы)

Здравоохранение и медицина

Частые вопросы про CNN

Чем CNN отличается от обычной нейросети?

CNN использует операцию свёртки с параметрическим разделением весов, что значительно снижает число параметров для обработки изображений. Обычная fully connected сеть применила бы отдельные веса к каждому пикселю.

Что такое ResNet?

ResNet (He et al., 2015) – CNN с остаточными соединениями (skip connections): выход блока = F(x) + x. Это решило проблему vanishing gradient в очень глубоких сетях (ResNet-152 – 152 слоя).

Применяется ли CNN в NLP?

Да, но реже Transformer. 1D-свёртки применяются для классификации текста и извлечения локальных паттернов. TextCNN (Kim, 2014) показал хорошие результаты при простоте архитектуры.

Что такое transfer learning для CNN?

Использование предобученной на ImageNet CNN (ResNet, EfficientNet) как feature extractor для новой задачи. Fine-tuning последних слоёв. Значительно снижает потребность в данных.

Заменит ли Transformer CNN в компьютерном зрении?

Частично. Vision Transformer (ViT) превосходит CNN на крупных датасетах, но ConvNet'ы остаются эффективнее на малых выборках. Гибридные архитектуры (ConvNeXt) сочетают лучшее из обоих подходов.

Введение

История и контекст

Как это работает

Где применяется

Преимущества и ограничения

Связь с другими понятиями

Связанные термины

Платформы класса «CNN»

ABBYY InfoExtractor SDK

Форпост

Facemetric

Andata

Сервисная платформа транспортных приложений для модульного построения единой платформы управления транспортной системой - ЕПУТС «ТРАНСФЛОУ»

ИКАР видео волл контрол

Категории каталога

Где применяется

Частые вопросы про CNN

Чем CNN отличается от обычной нейросети?

Что такое ResNet?

Применяется ли CNN в NLP?

Что такое transfer learning для CNN?

Заменит ли Transformer CNN в компьютерном зрении?

Контур Безопасность

Регистрация посещения объекта общественного питания для подписки на уведомления о возможном контакте с заболевшим новой коронавирусной инфекцией

Контур Маркет + ОФД — интегрированная платформа для розничной торговли