Термин · Глоссарий B2B-ПО

GAN (GAN)

GAN (Generative Adversarial Network) – генеративно-состязательная сеть, архитектура глубокого обучения из двух нейронных сетей: генератора, создающего синтетические данные, и дискриминатора, отличающего их от реальных. Совместное обучение методом минимакс позволяет синтезировать фотореалистичные изображения, видео и другие данные.

Буква «G» В категориях: 4 Платформ: 6+

Что такое GAN

GAN (Generative Adversarial Network, генеративно-состязательная сеть) – архитектура глубокого обучения, предложенная Яном Гудфеллоу и соавторами в 2014 году. Принцип GAN заключается в состязательном обучении двух нейронных сетей: генератора (G) и дискриминатора (D). Генератор синтезирует фиктивные примеры данных (например, изображения) из случайного вектора шума. Дискриминатор пытается отличить реальные данные от созданных генератором. В ходе обучения обе сети улучшаются: генератор учится лучше обманывать, дискриминатор – лучше разоблачать.

Равновесие игры по Нэшу достигается, когда генератор воспроизводит реальное распределение данных настолько точно, что дискриминатор не может угадать лучше, чем наугад (вероятность 0,5).

История и ключевые вехи развития GAN

Исходная статья Гудфеллоу et al. «Generative Adversarial Nets» (NeurIPS 2014) произвела революцию в генеративных моделях. За последующее десятилетие появились сотни модификаций:

DCGAN (2015): Deep Convolutional GAN – первая стабильная архитектура на свёрточных сетях для генерации изображений.
Conditional GAN (2014): Мирза и Озайдын добавили условия (метки классов), позволив управлять генерацией.
Pix2Pix (2016): image-to-image трансляция: эскиз → фото, чёрно-белое → цветное.
CycleGAN (2017): Непарная image-to-image трансляция (например, лето → зима) без парных обучающих примеров.
StyleGAN / StyleGAN2 (2018–2020, NVIDIA): Генерация сверхреалистичных портретов людей разрешением 1024×1024 px. Сайт thispersondoesnotexist.com построен на StyleGAN.
BigGAN (2018, Google DeepMind): Масштабирование на 512 классов ImageNet, качество FID ≈ 7.
GauGAN (NVIDIA Canvas): Синтез ландшафтов по сегментационной маске.

Как работает GAN: математика и обучение

Цель обучения задаётся функцией потерь минимакс:

min_G max_D E[log D(x)] + E[log(1 − D(G(z)))]

Здесь x – реальные данные, z – случайный шум. Генератор минимизирует вероятность распознания, дискриминатор максимизирует различение. На практике обучение нестабильно: важны балансировка обновлений, нормализация (Spectral Norm, Batch Norm), правильная архитектура.

Mode collapse – главная проблема GAN: генератор «застревает» в узком подмножестве примеров (генерирует одно и то же лицо). Для борьбы применяют mini-batch discrimination, unrolled GAN, Wasserstein GAN (WGAN), использующий метрику расстояния Вассерштейна.

Виды GAN и их применение

Image synthesis: генерация человеческих лиц (StyleGAN), произведений искусства, архитектурных макетов.
Image-to-image translation: Pix2Pix, CycleGAN – применяются в медицинской визуализации (MRI→CT), картографии, дизайне.
Super-resolution: SRGAN повышает разрешение изображений в 4× с восстановлением деталей.
Video generation: VideoGAN, MoCoGAN – синтез коротких видеоклипов.
Data augmentation: синтез дефектных образцов для обучения систем контроля качества.
Deepfake: переброска лиц на видео – область с этическими рисками, требующая детекторов дипфейков.

Преимущества и ограничения GAN

Преимущества: высокое визуальное качество генерации, гибкость в выборе архитектур, способность к unpaired image translation. Ограничения: нестабильность обучения, mode collapse, сложность оценки качества (нет дифференцируемой метрики), высокие требования к GPU-памяти. В последние годы диффузионные модели в ряде задач превзошли GAN по качеству и стабильности.

Связь с другими понятиями

GAN входят в широкий класс генеративных моделей наряду с VAE и диффузионными моделями. Архитектура G/D опирается на свёрточные нейронные сети (CNN) для работы с изображениями. Для оценки качества генерации применяются FID-score, IS и метрики, пересекающиеся с evaluation-ml. Современные трансформеры постепенно вытесняют GAN в задачах генерации текста и мультимодальных систем.

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «GAN».

Платформы класса «GAN»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

Автоматизированная система обеспечения надежности и качества аппаратуры (АСОНИКА)

Система АСОНИКА предназначена для анализа и обеспечения стойкости радиоэлектронных средств (РЭС) к комплексным...

Цена по запросу

Подробнее →

С-

Синтелли - программный комплекс хемоинформатики на базе искусственного интеллекта для решения задач органической и медицинской химии

ML-платформы

Синтелли — российская SaaS-платформа хемоинформатики на базе ИИ от компании (ИНН 9731018049). Содержит базу да...

Цена по запросу

Подробнее →

СА

Сайбокс

Машинное обучение

ML / MLOps-платформа полного цикла от Т1 для разработки, обучения, развёртывания и мониторинга моделей машинно...

Цена по запросу

★ 4.7

Подробнее →

Контейнер для создания дополнительных приложений "ALIOTH DPFS"

АЛИОТ осуществляет полный цикл производства пластиковых карт от разработки дизайна до непосредственного выпуск...

Цена по запросу

★ 4.3

Подробнее →

ПО

Программное обеспечение Система выявления инцидентов на основе технологий компьютерного зрения (Computer vision traffic incident system)

Машинное обучение

Программное обеспечение системы выявления инцидентов на дорогах с использованием технологий компьютерного зрен...

Цена по запросу

Подробнее →

ПК

Программный комплекс интеллектуального видеомониторинга и уведомлений "VIDEOfor"

Машинное обучение

ПК интеллектуального видеомониторинга на основе AI: детекция людей, транспорта, нарушений, голосовое оповещени...

Цена по запросу

★ 4.7

Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «GAN».

Машинное обучение Сетевая безопасность Платформы ИИ/GenAI Потоковое видео

Где применяется

Отрасли, в которых «GAN» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Промышленность и производство

Здравоохранение и медицина

Медиа, искусство и развлечения

Маркетинг и реклама

Частые вопросы про GAN

Кто изобрёл GAN и когда?

GAN предложил Ян Гудфеллоу с соавторами в 2014 году в статье «Generative Adversarial Nets» (NeurIPS 2014).

Что такое mode collapse в GAN?

Mode collapse – нестабильность обучения, при которой генератор выдаёт ограниченное множество однотипных примеров, игнорируя разнообразие данных.

Чем WGAN лучше обычного GAN?

WGAN использует метрику Вассерштейна вместо KL-дивергенции, что делает обучение стабильнее и снижает вероятность mode collapse.

Какие GPU нужны для обучения GAN?

StyleGAN2 при генерации 1024px потребовал 8 GPU NVIDIA V100. Для экспериментов на CIFAR-10 достаточно одной RTX 3090.

Вытеснят ли диффузионные модели GAN?

В задачах генерации изображений диффузионные модели уже превзошли GAN по качеству. GAN остаются актуальны для real-time приложений из-за скорости генерации.

Можно ли использовать GAN для аугментации данных?

Да – синтетические GAN-примеры применяют для расширения обучающих датасетов, особенно при дефиците реальных размеченных данных.

Что такое GAN

История и ключевые вехи развития GAN

Как работает GAN: математика и обучение

Виды GAN и их применение

Преимущества и ограничения GAN

Связь с другими понятиями

Связанные термины

Платформы класса «GAN»

Автоматизированная система обеспечения надежности и качества аппаратуры (АСОНИКА)

Синтелли - программный комплекс хемоинформатики на базе искусственного интеллекта для решения задач органической и медицинской химии

Сайбокс

Контейнер для создания дополнительных приложений "ALIOTH DPFS"

Программное обеспечение Система выявления инцидентов на основе технологий компьютерного зрения (Computer vision traffic incident system)

Программный комплекс интеллектуального видеомониторинга и уведомлений "VIDEOfor"

Категории каталога

Где применяется

Частые вопросы про GAN

Кто изобрёл GAN и когда?

Что такое mode collapse в GAN?

Чем WGAN лучше обычного GAN?

Какие GPU нужны для обучения GAN?

Вытеснят ли диффузионные модели GAN?

Можно ли использовать GAN для аугментации данных?

Контур Эксперт-проверка

Регистрация посещения объекта общественного питания для подписки на уведомления о возможном контакте с заболевшим новой коронавирусной инфекцией

Контур Маркет + ОФД — интегрированная платформа для розничной торговли