Введение
Shadow/Mirror Databases – термин, охватывающий два различных явления с похожим техническим проявлением: теневые (shadow) базы данных и зеркальные (mirror) базы данных.
Теневые БД – несанкционированные копии производственных баз данных, созданные сотрудниками для собственных нужд: аналитики, резервного доступа, обхода ограничений. Относятся к категории Shadow IT и несут серьёзные риски безопасности.
Зеркальные БД – официальные реплики, создаваемые целенаправленно для обеспечения высокой доступности (HA), disaster recovery, аналитической нагрузки или geographic distribution. Это легитимная и стандартная практика.
История и контекст
Концепция репликации баз данных появилась в 1980-х годах как ответ на необходимость обеспечения отказоустойчивости критически важных систем. Microsoft SQL Server ввёл функцию Database Mirroring в версии SQL Server 2005, Oracle предложила Data Guard ещё в Oracle 7 (1993).
Теневые БД как явление обострились в эпоху BI-инструментов (конец 1990-х – 2000-е): аналитики, не имея прямого доступа к production-базе, копировали данные в локальные Access или Excel-файлы. Это стало массовой проблемой – данные расходились, возникали «множественные источники правды».
Как это работает
Зеркальные БД (официальные реплики)
Технически реализуются несколькими методами:
- Физическая репликация – копирование файлов данных БД на уровне блоков (streaming replication в PostgreSQL).
- Логическая репликация – передача SQL-изменений или бинарного журнала (MySQL bin-log replication, Oracle GoldenGate).
- Database Mirroring (SQL Server) – синхронное или асинхронное зеркало с автоматическим failover.
- Always On Availability Groups – современный аналог в SQL Server 2012+, поддерживает несколько реплик и балансировку читающих запросов.
Теневые БД (несанкционированные)
Создаются неформально: экспорт через Excel/CSV, дамп pg_dump/mysqldump на личный ноутбук, несанкционированное подключение BI-инструмента напрямую к production-серверу. Часто не контролируются политиками обновления и хранения данных.
Где применяются зеркальные БД
- High Availability (HA) – горячий резерв: при отказе основного сервера зеркало автоматически берёт нагрузку.
- Disaster Recovery – географически распределённая реплика в резервном ЦОД.
- Read Replicas – снятие нагрузки чтения с master-сервера: аналитические запросы направляются на реплику.
- Тестирование и разработка – копия production-данных (с обезличиванием) для разработчиков.
- Геораспределённые системы – реплики в разных регионах для снижения задержки.
Риски теневых баз данных
- Утечка персональных данных – нарушение 152-ФЗ при неконтролируемом хранении ПД.
- Множественные источники правды – разные отчёты дают разные цифры, так как основаны на разных снимках данных.
- Отсутствие патчей безопасности – теневые БД не обновляются централизованно.
- Нарушение лицензий СУБД – несанкционированное развёртывание коммерческой СУБД.
Связь с другими понятиями
Теневые БД – частный случай Shadow IT в контексте управления данными. Для борьбы с ними применяются DLP-системы и Database Activity Monitoring (DAM) – мониторинг всех запросов к БД. Официальные зеркала являются основой архитектуры высокой доступности и входят в стратегию Disaster Recovery. Master Data Management (MDM) решает проблему «множественных источников правды», возникающую из-за теневых копий данных.