ЛитРес: автоматическая озвучка аудиокниг через Yandex SpeechKit (TTS)
Описание проекта
С осени 2020 года ГК «ЛитРес» (сервисы «ЛитРес», MyBook и др.) использует Yandex SpeechKit для автоматической озвучки книг, ещё не записанных профессиональными чтецами. Голосовые модели SpeechKit построены на нейронных сетях: перед синтезом модель оценивает весь текст целиком, что позволяет минимизировать искажения интонации и акцента. Активное масштабирование произошло с осени 2022 года. К апрелю 2024 года с помощью TTS озвучено более 22 000 книг. Средняя оценка TTS-аудиокниг за этот период выросла с 4,2 до 4,5 из 5. Создание аудиоверсии при помощи ИИ занимает 30–60 минут вместо нескольких дней при студийной записи, а стоимость производства снижается не менее чем в 10 раз. ИИ-озвучка действует как временная версия: при появлении записи с профессиональным чтецом замещается ею.
Задача
Лишь около 4–5% книг каталога имели аудиоверсии — студийная запись дорога, занимает дни и недели. Между тем сегмент аудиокниг в России рос быстрее всех форматов (+40% в 2024 году), и дефицит озвученного контента сдерживал рост платёжной аудитории.
Цели внедрения
-
Масштабно расширить ассортимент аудиокниг без пропорционального роста затрат на производство
-
Сократить время создания аудиоверсии с дней до часа
-
Предоставить пользователям аудиоверсию сразу при выходе электронной книги (синхрорелиз)
Результаты
-
Финансы
-
Стоимость производства аудиокниги снижена не менее чем в 10 раз по сравнению со студийной записью
-
Выручка ГК «ЛитРес» за 2024 год: 7,75 млрд руб.; сегмент аудиокниг вырос на 40% год к году до 6,6 млрд руб. по рынку Время
-
Создание первоначальной версии аудиокниги: 30–60 минут вместо нескольких дней
-
Озвучка 150 книг потребовала около 10 часов машинного времени Качество и эффективность
-
С 2022 года озвучено более 22 000 книг (данные на апрель 2024)
-
Средняя оценка TTS-аудиокниг выросла с 4,2 до 4,5
-
ЛитРес является площадкой автора программы «Литрес: Чтец» — в первом полугодии 2020 года выпуск аудиокниг в рамках программы вырос на 105% год к году Нагрузка и масштаб
-
ГК «ЛитРес» — лидер российского рынка цифровых книг (50% рынка в 2024 году)
-
Аудиоверсии доступны подписчикам сервисов ЛитРес и MyBook Надёжность
-
TTS-версия заменяется студийной при её появлении, что сохраняет высокий стандарт качества для premium-контента Импортозамещение и compliance
-
Yandex SpeechKit — российская разработка; зарубежные TTS-сервисы (Amazon Polly, Apple TTS) не используются Качественный эффект: Переход от дефицита аудиоконтента к массовой доступности: впервые пользователь может прослушать практически любую книгу каталога в день её появления на платформе.