DOM.IDP — платформа интеллектуальной обработки документов на базе LLM+RAG (ДОМ.РФ)
Описание проекта
ДОМ.РФ создал платформу DOM.IDP (Intelligent Document Processing) — собственное решение для автоматизации работы с документами, сочетающее классический ML и современные LLM. Платформа включает: автоматическую классификацию документов (ДДУ, паспорта, счета-фактуры, договоры и другие типы); целевое извлечение сущностей (NER) — ФИО, суммы, даты, адреса; ИИ-помощник в RAG-режиме (ответы на вопросы по объёмным документам в естественной форме); интеграция через RESTful API с внутренними системами. Проект начался как пилот в 2023 году — тогда ДОМ.РФ первым среди участников ДУ протестировал GenAI для поиска по внутренним документам.
Задача
Сотрудники тратили часы на изучение многостраничных договоров и других документов для извлечения нужных данных. Ручная классификация и обработка документов в ипотечных процессах была медленной, дорогой и подверженной ошибкам.
Цели внедрения
-
Автоматизировать классификацию и обработку входящих документов (ДДУ, паспорта, первичка)
-
Обеспечить мгновенный ответ на вопросы по объёмным документам через RAG
-
Снизить нагрузку на сотрудников при обработке ипотечной документации
Результаты
-
Финансы
-
Массовая обработка экономически выгодна благодаря гибридной архитектуре (LLM — только там, где нужно) Время
-
Мгновенное получение информации из объёмных документов без их самостоятельного изучения
-
Автоматическая классификация и маршрутизация документов без ручного вмешательства Качество и эффективность
-
Станция верификации (Human-in-the-Loop) обеспечивает 100% точность данных на выходе
-
Покрытие типов документов: 12+ классов (паспорт РФ, ДДУ, счёт-фактура, УПД, акт, договор и другие) Нагрузка и масштаб
-
Не раскрыто (платформа используется в процессах ипотечного кредитования группы ДОМ.РФ) Надёжность
-
Human-in-the-Loop позволяет корректировать работу моделей; исправления используются для дообучения Импортозамещение и compliance
-
Собственная разработка ДОМ.РФ Технологии; данные остаются в корпоративном контуре Качественный эффект (если цифры не раскрыты): Первый в российском жилищно-финансовом секторе комплекс для интеллектуальной обработки документов с собственным RAG-помощником. Пилот 2023 года стал основой для полноценной платформы.