Введение
Zero-shot (нулевой выстрел) – режим работы языковой модели, при котором задача формулируется исключительно текстовым описанием, без единого демонстрационного примера. Модель решает её, опираясь на обобщённые знания, усвоенные в ходе предобучения на огромных корпусах текста, и на способность следовать инструкциям (instruction following), привитую через RLHF-обучение.
В рамках статьи GPT-3 (Brown et al., 2020) авторы систематически разграничили три режима: zero-shot (только инструкция), one-shot (один пример), few-shot (несколько примеров). На большинстве задач GPT-3 175B уже в zero-shot режиме опережал более ранние SOTA fine-tuned модели – это стало одним из наиболее ярких результатов работы.
История и контекст
Термин «zero-shot learning» пришёл из компьютерного зрения (2009–2013): исследователи разрабатывали методы распознавания классов объектов, которые модель не видела при обучении, используя семантические описания атрибутов. В контексте LLM он приобрёл принципиально иное значение. Поворотным моментом стало появление InstructGPT (2022) и ChatGPT – моделей, обученных следовать инструкциям через RLHF, что резко повысило качество zero-shot на широком спектре задач. Zero-shot CoT (Kojima et al., 2022) показал: достаточно добавить «Let's think step by step» – и модель сама строит цепочку рассуждений.
Как это работает
В zero-shot промпте содержится только описание задачи – без пар «вход-выход». Модель интерпретирует запрос, опираясь на статистику языка из предобучения. Для улучшения zero-shot качества применяются следующие приёмы:
- Точная формулировка – конкретный глагол («классифицируй», «переведи», «суммаризируй») лучше расплывчатых описаний.
- Ролевые инструкции – «Ты опытный юрист. Определи тип договора...» повышает специфичность ответа.
- Ограничение формата – «Отвечай только: Положительный / Отрицательный» устраняет лишний текст.
- Zero-shot Chain-of-Thought – добавление «Думай пошагово» активирует цепочку рассуждений без примеров.
Граница zero-shot и few-shot
Граница условна: даже одно предложение контекста формально превращает zero-shot в 0.5-shot. Практически zero-shot – это когда в промпте нет явных пар «вход → выход», демонстрирующих паттерн ответа.
Где применяется
- Классификация текста – тональный анализ, категоризация без предварительной разметки датасета.
- Суммаризация – краткое изложение документов, новостей, протоколов совещаний.
- Вопросно-ответные системы – ответы на пользовательские запросы по корпоративной базе знаний.
- Перевод – между языками без специальной адаптации к паре.
- Извлечение данных – парсинг структурированных данных из свободного текста по описанию схемы.
- Чат-боты и ассистенты – ответы на произвольные запросы пользователей без настройки под каждую тему.
Преимущества и ограничения
Преимущества: мгновенное применение без подготовки примеров; максимально экономный расход токенов; универсальность – подходит для любых задач, описуемых на естественном языке; нет затрат на сбор и разметку демонстрационных данных.
Ограничения: уступает few-shot при нечёткой задаче или нестандартном формате вывода; эффективность критически зависит от качества instruction following модели; малые модели (7B и ниже) плохо справляются со сложными zero-shot задачами; повышенный риск галлюцинаций – без якорных примеров модель больше домысливает.
Связь с другими понятиями
Zero-shot противопоставляется few-shot (с примерами в промпте) и fine-tuning (с обновлением весов). Оба режима – частные случаи в-контекстного обучения. Chain-of-Thought применяется в zero-shot через одну фразу-инструкцию. Перплексия – базовая метрика языковой компетентности модели, которая определяет zero-shot качество: чем ниже перплексия на домене задачи, тем надёжнее zero-shot. Hallucination – основной риск: без примеров модель имеет меньше контекстных ограничителей и чаще домысливает факты.