Термин · Глоссарий B2B-ПО

YandexGPT (YandexGPT)

YandexGPT – семейство языковых моделей Яндекса (5-е поколение: Lite и Pro с контекстом 32 000 токенов), доступных через Yandex Cloud Foundation Models. Поддерживает генерацию текста, embeddings, fine-tuning и интеграцию с поисковой выдачей Яндекса (Нейро).

Буква «Y» В категориях: 4 Платформ: 6+

Введение

YandexGPT – семейство больших языковых моделей, разработанных Яндексом и предоставляемых через сервис Yandex Cloud Foundation Models. Актуальное 5-е поколение включает модели YandexGPT Lite и YandexGPT Pro с контекстным окном 32 000 токенов в синхронном и асинхронном режимах.

Яндекс интегрировал YandexGPT в собственные сервисы: поиск (функция Нейро генерирует ответы-сводки), Алису, Яндекс 360 (почта, документы, телемосты). Для разработчиков доступны REST API и OpenAI-совместимый интерфейс.

История и контекст

Яндекс имеет длинную историю в NLP: нейросетевое ранжирование MatrixNet (2009), нейросеть YATI в поиске (2021), языковая модель YaLM 100B (2022, открытый код на Apache 2.0 с 100 млрд параметров). YandexGPT как продуктовая линейка анонсирована на конференции YaC 2023.

В 2024–2025 годах Яндекс постепенно расширял экосистему: добавил fine-tuning в DataSphere, AI Assistant API для RAG-ассистентов, reasoning mode в YandexGPT Pro 5, а также интегрировал сторонние модели (Llama 3.3, Qwen3 235B, DeepSeek) в единый Foundation Models каталог.

Как это работает

  • Completion API: генерация текста по промпту (синхронный и асинхронный режимы) с управлением температурой и max_tokens. URI модели: gpt://<folder_ID>/yandexgpt.
  • Chat API: многоходовые диалоговые сессии с системным промптом.
  • Embeddings API: векторное представление текста через YandexART Embeddings для семантического поиска.
  • Fine-tuning: дообучение YandexGPT Lite/Pro на корпоративных данных через интерфейс Yandex Cloud DataSphere.
  • AI Assistant API: готовый инструмент для создания RAG-ассистентов с управлением контекстом, памятью и поисковым индексом (до 10 000 документов).
  • Structured Output: генерация ответов в заданном JSON-формате по предоставленной схеме.

Где применяется

  • Яндекс Нейро: генерация ответов-сводок в поисковой выдаче на основе актуальных веб-страниц.
  • Яндекс 360: AI-ассистент в почте и документах для деловой переписки и суммаризации встреч.
  • Корпоративные ассистенты: RAG-системы для ответов на вопросы по внутренней документации компании.
  • Аналитика текста: классификация обращений, суммаризация, извлечение сущностей из документов.
  • Автоматизация HR: анализ резюме по критериям, классификация заявок в поддержку.

Преимущества и ограничения

Преимущества: российская инфраструктура (данные в РФ, 152-ФЗ); глубокая интеграция с Yandex Cloud; fine-tuning без передачи базовой модели; синергия с поисковым индексом; OpenAI-совместимый API; доступ к другим моделям (Llama, Qwen, DeepSeek) через единый каталог.

Ограничения: закрытая базовая модель; стоимость токенов выше open-source альтернатив; зависимость от экосистемы Yandex Cloud.

Связь с другими понятиями

YandexGPT – российский конкурент GigaChat в сегменте корпоративных LLM. Модель размещается в публичном облаке Yandex Cloud. Embeddings API используется в семантическом поиске и RAG-архитектурах с диалоговым ИИ. Fine-tuning опирается на инструменты нейросетевых платформ (PyTorch под капотом DataSphere).

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «YandexGPT».

Платформы класса «YandexGPT»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

Yandex SpeechKit Box

Yandex SpeechKit Box

Документооборот и контент
Сервис распознавания и синтеза речи на базе ИИ
Цена по запросу
★ 4.3
Подробнее →
CU

CAILA Ultimate 2.0

Данные и аналитика
CAILA Ultimate 2.0 — NLP-платформа компании Just AI для создания и эксплуатации решений в области обработки ес...
Цена по запросу
Подробнее →
G/

GigaCode / JARVIS

Данные и аналитика
GigaCode / JARVIS — AI-ассистент для разработчиков от Сбербанка. Предоставляет автодополнение кода, поддержива...
Цена по запросу
Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «YandexGPT».

Где применяется

Отрасли, в которых «YandexGPT» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Частые вопросы про YandexGPT

Что такое YandexGPT?

YandexGPT – семейство LLM 5-го поколения от Яндекса (Lite и Pro, 32K токенов), доступных через Yandex Cloud Foundation Models API для генерации текста, embeddings и fine-tuning.

Как получить доступ к YandexGPT API?

Через консоль Yandex Cloud: создать каталог, получить IAM-токен или API-ключ, вызвать REST API Foundation Models. URI: gpt://<folder_ID>/yandexgpt. Тарификация – по токенам.

Можно ли дообучить YandexGPT на своих данных?

Да: Yandex Cloud DataSphere поддерживает fine-tuning YandexGPT Lite и Pro на корпоративных датасетах. Fine-tuned модели получают суффикс и доступны через тот же Foundation Models API.

Что такое AI Assistant API и чем он отличается от Completion API?

AI Assistant API – высокоуровневый инструмент для RAG-ассистентов: управление контекстом, загрузка до 10 000 документов в поисковый индекс, управление историей разговора. Completion API – базовый, без управления состоянием.

Есть ли в YandexGPT поддержка reasoning (цепочки рассуждений)?

Да: YandexGPT Pro 5 поддерживает reasoning mode – пошаговое рассуждение перед ответом, улучшающее результаты на математических и логических задачах.

Какие ещё модели доступны в Yandex Cloud Foundation Models?

Помимо YandexGPT, каталог включает Llama 3.3 70B, Qwen3 235B, DeepSeek-R1, Gemma3 27B, gpt-oss-120b/20b – все с OpenAI-совместимым API и хранением данных в РФ.