Введение
YandexGPT – семейство больших языковых моделей, разработанных Яндексом и предоставляемых через сервис Yandex Cloud Foundation Models. Актуальное 5-е поколение включает модели YandexGPT Lite и YandexGPT Pro с контекстным окном 32 000 токенов в синхронном и асинхронном режимах.
Яндекс интегрировал YandexGPT в собственные сервисы: поиск (функция Нейро генерирует ответы-сводки), Алису, Яндекс 360 (почта, документы, телемосты). Для разработчиков доступны REST API и OpenAI-совместимый интерфейс.
История и контекст
Яндекс имеет длинную историю в NLP: нейросетевое ранжирование MatrixNet (2009), нейросеть YATI в поиске (2021), языковая модель YaLM 100B (2022, открытый код на Apache 2.0 с 100 млрд параметров). YandexGPT как продуктовая линейка анонсирована на конференции YaC 2023.
В 2024–2025 годах Яндекс постепенно расширял экосистему: добавил fine-tuning в DataSphere, AI Assistant API для RAG-ассистентов, reasoning mode в YandexGPT Pro 5, а также интегрировал сторонние модели (Llama 3.3, Qwen3 235B, DeepSeek) в единый Foundation Models каталог.
Как это работает
- Completion API: генерация текста по промпту (синхронный и асинхронный режимы) с управлением температурой и max_tokens. URI модели:
gpt://<folder_ID>/yandexgpt. - Chat API: многоходовые диалоговые сессии с системным промптом.
- Embeddings API: векторное представление текста через YandexART Embeddings для семантического поиска.
- Fine-tuning: дообучение YandexGPT Lite/Pro на корпоративных данных через интерфейс Yandex Cloud DataSphere.
- AI Assistant API: готовый инструмент для создания RAG-ассистентов с управлением контекстом, памятью и поисковым индексом (до 10 000 документов).
- Structured Output: генерация ответов в заданном JSON-формате по предоставленной схеме.
Где применяется
- Яндекс Нейро: генерация ответов-сводок в поисковой выдаче на основе актуальных веб-страниц.
- Яндекс 360: AI-ассистент в почте и документах для деловой переписки и суммаризации встреч.
- Корпоративные ассистенты: RAG-системы для ответов на вопросы по внутренней документации компании.
- Аналитика текста: классификация обращений, суммаризация, извлечение сущностей из документов.
- Автоматизация HR: анализ резюме по критериям, классификация заявок в поддержку.
Преимущества и ограничения
Преимущества: российская инфраструктура (данные в РФ, 152-ФЗ); глубокая интеграция с Yandex Cloud; fine-tuning без передачи базовой модели; синергия с поисковым индексом; OpenAI-совместимый API; доступ к другим моделям (Llama, Qwen, DeepSeek) через единый каталог.
Ограничения: закрытая базовая модель; стоимость токенов выше open-source альтернатив; зависимость от экосистемы Yandex Cloud.
Связь с другими понятиями
YandexGPT – российский конкурент GigaChat в сегменте корпоративных LLM. Модель размещается в публичном облаке Yandex Cloud. Embeddings API используется в семантическом поиске и RAG-архитектурах с диалоговым ИИ. Fine-tuning опирается на инструменты нейросетевых платформ (PyTorch под капотом DataSphere).