Российская государственная библиотека: ИИ-каталогизация фондов совместно с MTS AI и Яндексом
Описание проекта
Российская государственная библиотека реализует три стратегических направления применения ИИ.
Первое — автоматическая каталогизация новых поступлений. В партнёрстве с МТС AI внедрён эксперимент: сканированные в РГБ обложки и титульные листы книг, поступающих через Книжную палату (обязательный экземпляр), передаются в специально разработанную нейросеть МТС AI, которая переводит их в стандартное библиографическое описание. В перспективе — полная автоматизация каталогизации; человек выступает лишь в роли выпускающего редактора.
Второе — обработка основного фонда. Совместно с Яндексом произведены оцифровка, распознавание и компоновка «Книжных летописей» за 1959–1979 годы (изданий Всесоюзной книжной палаты); получено 1 623 760 библиографических записей в формате JSON.
Третье — интеллектуальный поиск для читателей. Совместно с МТС AI разрабатывается RAG-технология для семантического поиска по коллекции авторефератов диссертаций; в рамках пилотного проекта создан Telegram-бот «РГБ Бот Поисковик».
Задача
Сокращение числа квалифицированных каталогизаторов при росте объёма цифровых поступлений; объём накопленного фонда, требующего ретроспективной обработки (сотни тысяч записей); необходимость импортозамещения западной АБИС.
Цели внедрения
-
Автоматизировать текущую каталогизацию обязательного экземпляра
-
Ввести в научный оборот крупные массивы ретроспективного фонда
-
Создать инструменты интеллектуального поиска для читателей
Результаты
-
Финансы
-
Ежемесячные затраты на пилотный RAG-проект в режиме пилота — около 350 тыс. рублей; при промышленной эксплуатации — не менее 700 тыс. рублей в месяц Время
-
Обработка «Книжных летописей» 1959–1979 годов завершена: 1 623 760 записей в формате JSON готовы к использованию Качество и эффективность
-
Эксперимент с каталогизацией обложек позволяет сформировать полное стандартное библиографическое описание автоматически; человек проверяет и утверждает
-
RAG-поиск по авторефератам: тексты распознаны и преобразованы в эмбеддинги; пилот доступен через Telegram-бота Нагрузка и масштаб
-
Объём ретроспективного фонда: более 1,6 млн записей «Книжных летописей»
-
РГБ названа лидером внедрения ИИ в библиотечные процессы России по итогам конференции ИНИОН РАН 2025 Надёжность
-
ИИ выступает в роли помощника каталогизатора; решения проходят верификацию специалистов Импортозамещение и compliance
-
МТС AI и Яндекс — российские разработчики
-
Замещение западной АБИС обозначено как стратегический приоритет Качественный эффект: РГБ формирует модель ИИ-каталогизации, применимую для других крупных библиотек России.