Термин · Глоссарий B2B-ПО

LLM (LLM)

LLM (Large Language Model, большая языковая модель) – нейросетевая языковая модель с миллиардами параметров, обученная на огромных текстовых корпусах и способная генерировать, переводить, классифицировать и анализировать текст на уровне, близком к человеческому.

Буква «L» В категориях: 4 Платформ: 6+

Введение

LLM (Large Language Model, большая языковая модель) – это нейронная сеть, обученная на терабайтах текстовых данных и содержащая от нескольких миллиардов до триллионов параметров. LLM способны генерировать связный текст, отвечать на вопросы, переводить, суммаризировать, писать код, анализировать документы и вести диалог. Они стали технологической основой нового поколения ИИ-продуктов: ChatGPT, Claude, Gemini, а также российских моделей – GigaChat (Сбер), YandexGPT, банковских и корпоративных ассистентов.

LLM изменили подход к разработке ПО и автоматизации: вместо обучения специализированной модели под каждую задачу одна LLM с помощью инструктирования (prompt engineering) может решать десятки различных задач. Это открывает новые возможности для автоматизации интеллектуального труда в корпоративной среде.

История и контекст

Фундамент LLM заложила статья «Attention Is All You Need» (Vaswani et al., Google, 2017), предложившая архитектуру Transformer с механизмом внимания (self-attention). Transformer позволил параллельно обрабатывать длинные последовательности и эффективно обучать модели на огромных датасетах. GPT-1 (OpenAI, 2018) показал, что предобучение на большом корпусе с последующей донастройкой (fine-tuning) даёт высокие результаты. BERT (Google, 2018) ввёл двунаправленный энкодер.

Масштабный сдвиг произошёл с GPT-3 (2020, 175 млрд параметров): модель демонстрировала few-shot и zero-shot возможности без дополнительного обучения. ChatGPT (ноябрь 2022) сделал LLM массово доступными через чат-интерфейс. В России GigaChat (Сбер) запущен в 2023 году, YandexGPT доступен в Алисе и Яндекс 360. Параллельно развиваются открытые LLM: LLaMA (Meta), Mistral, Qwen, которые можно развернуть on-premise.

Как это работает

LLM основаны на архитектуре Transformer, состоящей из стека блоков внимания (attention heads) и полносвязных слоёв. Обучение проходит в два этапа. Предобучение (pre-training): модель учится предсказывать следующий токен (авторегрессионная задача, GPT-подход) или восстанавливать замаскированные токены (BERT-подход) на огромном корпусе текстов – Common Crawl, книги, Википедия, код и прочее.

Выравнивание (alignment): применяется RLHF (Reinforcement Learning from Human Feedback) – обратная связь от людей-оценщиков обучает модель следовать инструкциям и избегать вредных ответов. Инференс: LLM генерирует текст токен за токеном, используя температуру (temperature), top-p и top-k сэмплирование для управления разнообразием ответов. Контекстное окно (context window) определяет максимальный объём текста, который модель учитывает за один раз – от 4K до 1M токенов в современных моделях.

Для адаптации под корпоративные задачи применяются: fine-tuning (дообучение на доменных данных), RAG (Retrieval-Augmented Generation – дополнение промпта извлечёнными из базы знаний фрагментами), LoRA/QLoRA (эффективное дообучение малым числом параметров).

Где применяется

Корпоративные ИИ-ассистенты: помощники для юристов, финансистов, HR-специалистов, автоматически анализирующие документы и отвечающие на вопросы. Разработка ПО: GitHub Copilot, Cursor, JetBrains AI – автодополнение и генерация кода. Контакт-центры: автоматические ответы на обращения, суммаризация переговоров, дообучение на базе знаний компании.

Медицина и фармацевтика: извлечение информации из медицинских записей, поддержка клинических решений. Государственный сектор: анализ нормативных документов, подготовка ответов на обращения граждан. В России использование LLM в КИИ и госсекторе требует размещения on-premise или в отечественном облаке с соблюдением требований ФЗ-149, ФЗ-152, Указа Президента №250.

Связь с другими понятиями

LLM – практическое воплощение NLP и ИИ на современном уровне. MLOps обеспечивает жизненный цикл LLM в продакшене: версионирование, мониторинг дрейфа, переобучение. Облачные инфраструктуры (IaaS, PaaS) предоставляют вычислительные мощности (GPU/TPU) для обучения и инференса. Для корпоративного развёртывания важна интеграция с системами хранения (СУБД, NoSQL, векторные БД) через API и RAG-пайплайны. Отечественные LLM (GigaChat, YandexGPT) могут включаться в реестр Минцифры как российское ПО, обеспечивая соответствие требованиям импортозамещения.

Преимущества и ограничения

Преимущества: универсальность (одна модель для множества задач), высокое качество генерации текста на уровне человека, способность работать без примеров (zero-shot), быстрая адаптация через промптинг и RAG без полного переобучения, снижение стоимости автоматизации интеллектуального труда.

Ограничения: галлюцинации (генерация правдоподобных, но ложных фактов), высокие требования к GPU-ресурсам для обучения и инференса, ограниченное контекстное окно, риски утечки данных при использовании внешних API, необходимость валидации выходных данных для критически важных приложений. Регуляторика (ЕС AI Act, российское законодательство об ИИ) формирует дополнительные требования к применению LLM.

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «LLM».

Платформы класса «LLM»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

CU

CAILA Ultimate 2.0

Данные и аналитика
CAILA Ultimate 2.0 — NLP-платформа компании Just AI для создания и эксплуатации решений в области обработки ес...
Цена по запросу
Подробнее →
G/

GigaCode / JARVIS

Данные и аналитика
GigaCode / JARVIS — AI-ассистент для разработчиков от Сбербанка. Предоставляет автодополнение кода, поддержива...
Цена по запросу
Подробнее →
GI

GigaChat

Чат-боты и виртуальные ассистенты
GigaChat от компании Сбер — российский программный продукт из реестра отечественного ПО, включённый в топ-анал...
Цена по запросу
★ 2.9
Подробнее →
БАРС.Мониторинг-ЖКХ

БАРС.Мониторинг-ЖКХ

Данные и аналитика
Информационно-аналитическая система для мониторинга и управления жилищно-коммунальным хозяйством на региональн...
Цена по запросу
★ 5.0
Подробнее →
Tarantool Data Grid

Tarantool Data Grid

Данные и аналитика
Tarantool — высокопроизводительная СУБД с поддержкой in-memory и дискового хранения данных, обеспечивающая ACI...
Цена по запросу
★ 4.8
Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «LLM».

Где применяется

Отрасли, в которых «LLM» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Частые вопросы про LLM

Чем LLM отличается от обычной нейросети?

LLM – это специализированная нейросеть архитектуры Transformer, предобученная на огромных текстовых корпусах. Обычные нейросети обучаются под конкретную задачу с меньшим объёмом данных и параметров.

Что такое RAG?

RAG (Retrieval-Augmented Generation) – техника дополнения запроса к LLM релевантными фрагментами из базы знаний, что снижает галлюцинации и позволяет работать с актуальными данными компании.

Можно ли развернуть LLM on-premise?

Да. Открытые модели (LLaMA, Mistral) и российские (GigaChat API, YandexGPT) можно развернуть на собственной инфраструктуре, что обязательно для работы с гостайной и персональными данными.

Что такое fine-tuning LLM?

Дообучение предобученной LLM на специализированном корпусе для адаптации под конкретную предметную область (медицина, право, финансы), что улучшает качество ответов в узкой теме.

Какие российские LLM существуют?

GigaChat (Сбер), YandexGPT (Яндекс), Vikhr, ruGPT-3/4. Ряд банков и госструктур разрабатывают собственные модели для работы с конфиденциальными данными.

Почему LLM галлюцинируют?

Модель генерирует статистически вероятный следующий токен, не имея встроенной проверки фактов. Галлюцинации снижают через RAG, верификацию источников и специализированное дообучение.