Термин · Глоссарий B2B-ПО

RNN (RNN)

Recurrent Neural Network (рекуррентная нейронная сеть) – архитектура с обратными связями для обработки последовательных данных. Обрабатывает данные поэтапно, сохраняя скрытое состояние между шагами. LSTM и GRU решают проблему vanishing gradient классического RNN.

Буква «R» В категориях: 3 Платформ: 6+

Введение

RNN (Recurrent Neural Network, рекуррентная нейронная сеть) – класс нейронных сетей с обратными связями, предназначенных для обработки последовательных данных: текста, временных рядов, аудио, видео. В отличие от feedforward сетей, RNN обрабатывает последовательность поэтапно (токен за токеном), сохраняя скрытое состояние (hidden state) – сжатое «воспоминание» о предыдущих элементах.

На каждом шаге t: h_t = f(W_h · h_{t-1} + W_x · x_t + b), где h_t – новое скрытое состояние, x_t – текущий вход, W_h и W_x – матрицы весов.

История и контекст

Рекуррентные архитектуры предложены в конце 1980-х. Хорошент, Бенжио и Фраскони (1994) описали проблему vanishing gradient: при длинных последовательностях градиент затухает или взрывается при backpropagation through time. LSTM (Long Short-Term Memory, Хохрайтер и Шмидхубер, 1997) решила эту проблему через механизм ворот (gates). GRU (Cho et al., 2014) – упрощённая версия LSTM. Seq2seq с attention (Bahdanau et al., 2015) стал прорывом в NMT. С появлением Transformer (2017) RNN утратила доминирующую позицию в NLP, но остаётся актуальной для временных рядов и сигналов.

Как это работает

Основные архитектурные варианты:

Vanilla RNN – базовая версия; страдает от vanishing gradient при длинных последовательностях (> 20–30 шагов).
LSTM – добавляет cell state (долгосрочную память) и три gate: input gate (что записать), forget gate (что забыть), output gate (что выдать). Устойчива к последовательностям длиной 100–500 шагов.
GRU (Gated Recurrent Unit) – упрощённый LSTM с двумя gate (reset, update). Обучается быстрее при сопоставимом качестве.
Bidirectional RNN – два RNN, обрабатывающих последовательность в обоих направлениях; удваивает ёмкость представлений.

Где применяется

Временные ряды – прогнозирование спроса, финансовых показателей, IoT-телеметрии.
Распознавание речи – ASR с CTC-декодированием (наряду с Transformer).
NLP legacy-системы – классификация текста, NER в системах, созданных до эпохи Transformer.
Генерация текста – language modeling; заменено Transformer, но используется в resource-constrained устройствах.
Промышленный мониторинг – детектирование аномалий в сигналах датчиков в реальном времени.

Преимущества и ограничения

Преимущества: нативная обработка последовательностей переменной длины; разделение параметров по времени; LSTM/GRU устойчивы к умеренно длинным зависимостям; инференс требует мало памяти (по одному шагу).

Ограничения: последовательная обработка не параллелизируется на GPU (в отличие от Transformer); ограниченная способность к моделированию дальних зависимостей; постепенно вытесняется Transformer в большинстве NLP-задач.

Связь с другими понятиями

RNN и CNN – две фундаментальные архитектуры нейросетей до эпохи Transformer. Transformer заменил RNN в NLP через механизм Attention: вместо последовательной обработки – параллельный расчёт весов между всеми позициями. Временной ряд – одна из ключевых областей применения RNN. Нейронная сеть – базовый строительный блок. Переобучение в RNN снижается через Dropout (между слоями, не между временными шагами).

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «RNN».

Платформы класса «RNN»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

ABBYY InfoExtractor SDK

Уникальные возможности ABBYY InfoExtractor SDK по выявлению в текстах объектов, фактов и связей между ними поз...

Цена по запросу

★ 4.5

Подробнее →

ФО

Форпост

Управление городской инфраструктурой

Форпост — программная платформа для построения масштабируемых систем видеонаблюдения и видеоаналитики на нейро...

Цена по запросу

★ 4.8

Подробнее →

Facemetric

Платформа видеоаналитики

Цена по запросу

★ 4.7

Подробнее →

Andata

Сервис идентификации потенциальных клиентов на сайте

Цена по запросу

Подробнее →

СП

Сервисная платформа транспортных приложений для модульного построения единой платформы управления транспортной системой - ЕПУТС «ТРАНСФЛОУ»

Управление городской инфраструктурой

ТРАНСФЛОУ — модульная интеграционная платформа для построения интеллектуальных транспортных систем (ИТС). Разр...

Цена по запросу

★ 4.5

Подробнее →

ИВ

ИКАР видео волл контрол

Управление городской инфраструктурой

ИКАР видео волл контрол — программное обеспечение компании (ИНН 7838404170) для управления видеостенами (video...

Цена по запросу

Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «RNN».

Машинное обучение Платформы ИИ/GenAI Обработка естественного языка (NLP/NLU)

Где применяется

Отрасли, в которых «RNN» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Промышленность и производство

Цифровые услуги (B2C, e-commerce, онлайн-сервисы)

Финансы и финтех

Частые вопросы про RNN

Чем LSTM отличается от Vanilla RNN?

LSTM добавляет cell state (долгосрочную память) и три learnable gate для управления потоком информации. Это устраняет vanishing gradient и позволяет запоминать зависимости на сотни шагов назад.

Заменил ли Transformer RNN полностью?

В NLP – почти. Но RNN (особенно LSTM) остаётся актуальной для временных рядов, edge-устройств с ограниченной памятью и задач, требующих online-обработки потока данных.

Что такое Bidirectional RNN?

Два RNN, обрабатывающих последовательность в прямом и обратном направлениях. Объединённые скрытые состояния содержат контекст из обоих направлений. BiLSTM – стандарт для NER перед эпохой BERT.

Почему RNN плохо параллелизируется?

Шаг t зависит от шага t-1 через hidden state – последовательная зависимость. GPU не может обрабатывать параллельно: нужно ждать предыдущего шага. Transformer обрабатывает всю последовательность параллельно.

Применяется ли RNN для LLM?

Нет. Современные LLM основаны на Transformer. Исключение – RWKV (2023): RNN-архитектура с attention-подобными свойствами, конкурентоспособная с Transformer при меньших требованиях к памяти.

Введение

История и контекст

Как это работает

Где применяется

Преимущества и ограничения

Связь с другими понятиями

Связанные термины

Платформы класса «RNN»

ABBYY InfoExtractor SDK

Форпост

Facemetric

Andata

Сервисная платформа транспортных приложений для модульного построения единой платформы управления транспортной системой - ЕПУТС «ТРАНСФЛОУ»

ИКАР видео волл контрол

Категории каталога

Где применяется

Частые вопросы про RNN

Чем LSTM отличается от Vanilla RNN?

Заменил ли Transformer RNN полностью?

Что такое Bidirectional RNN?

Почему RNN плохо параллелизируется?

Применяется ли RNN для LLM?

Контур Толк: Вебинары

Регистрация посещения объекта общественного питания для подписки на уведомления о возможном контакте с заболевшим новой коронавирусной инфекцией

Контур Маркет + ОФД — интегрированная платформа для розничной торговли