Термин · Глоссарий B2B-ПО

Витрина данных

Витрина данных (Data Mart) – предметно-ориентированная, денормализованная подборка данных корпоративного DWH, оптимизированная для аналитических запросов конкретного подразделения или бизнес-функции: финансы, продажи, HR, маркетинг. Является конечной точкой потребления для BI-инструментов и OLAP-кубов.

Буква «В» В категориях: 4 Платформ: 6+

Введение

Витрина данных (Data Mart) – предметно-ориентированная реляционная структура, содержащая подмножество корпоративного хранилища данных, оптимизированное для аналитических запросов конкретного подразделения. Финансовая витрина содержит P&L, баланс, движение денежных средств; витрина продаж – транзакции, воронку, выполнение планов; HR-витрина – численность, текучесть, фонд оплаты труда.

В отличие от нормализованного детального слоя DWH, витрины используют денормализованные схемы «звезда» (Star Schema) или «снежинка» (Snowflake Schema) для максимальной скорости аналитических запросов с группировками. Именно из витрин BI-инструменты, дашборды, отчёты и OLAP-кубы получают данные для конечных пользователей.

История и контекст

Концепцию Data Mart популяризировал Ральф Кимбалл в 1990-х как альтернативу монолитному корпоративному DWH Билла Инмона. Кимбалл предлагал строить хранилище «снизу вверх»: сначала создать независимые витрины для отдельных бизнес-процессов (заказы, запасы, финансы), а затем интегрировать их через «шину конформных измерений». Инмон предлагал обратный порядок: сначала нормализованное централизованное хранилище, затем витрины.

Сегодня «война Кимбалла и Инмона» завершилась компромиссом: большинство реальных архитектур используют централизованный Core DWH как источник истины и предметные витрины для конечного потребления в BI. На российском рынке витрины активно строятся на базе ClickHouse, Arenadata DB и облачных СУБД.

Как это работает

Витрина строится на основе схемы «звезда»: в центре – таблица фактов с числовыми показателями (суммы, количества, веса), вокруг – таблицы измерений (время, продукт, регион, клиент, сотрудник).

  • Таблица фактов содержит транзакционные или периодические снапшоты: строки продаж, бухгалтерские проводки, клики на сайте.
  • Таблицы измерений дают контекст: атрибуты товара, иерархию географии (город → регион → страна), характеристики клиента.
  • Агрегаты – предвычисленные суммы по часто запрашиваемым срезам для ускорения запросов.

Данные в витрину поступают из Core DWH через ETL/ELT-процессы. Обновление бывает полным (full reload) или инкрементальным – только новые и изменённые записи через CDC или watermark по дате последнего изменения.

Выделяют три типа витрин:

  • Dependent Data Mart – получает данные только из централизованного DWH. Обеспечивает единую версию правды.
  • Independent Data Mart – загружает данные напрямую из источников, минуя DWH. Антипаттерн для крупных организаций.
  • Hybrid Data Mart – комбинирует оба источника.

Где применяется

  • Финансы: финансовая витрина для подготовки управленческой отчётности, МСФО, плана-факта.
  • Продажи и маркетинг: анализ воронки продаж, эффективности каналов, когортный анализ клиентов.
  • Логистика: мониторинг запасов, отгрузок, SLA поставщиков.
  • HR: витрина персонала для анализа текучести, планирования ФОТ.
  • Банки: витрины для регуляторной отчётности ЦБ (форма 101, 123) и внутреннего управленческого учёта.

Преимущества и ограничения

Преимущества: высокая скорость аналитических запросов благодаря денормализации; независимость подразделений – каждая команда получает свою витрину с нужными метриками; упрощение работы BI-инструментов без сложных JOIN.

Ограничения: риск расхождения показателей между витринами при независимой разработке (проблема «нескольких версий правды»); дублирование данных увеличивает объём хранилища; сложность поддержки при изменении бизнес-логики расчётов.

Связь с другими понятиями

DWH (хранилище данных) – источник, из которого питаются витрины. Слой данных – витрина является верхним слоем многоуровневой архитектуры. OLAP-куб часто строится поверх витрины для многомерного анализа. Семантический слой добавляет бизнес-метрики поверх витрины для BI-инструментов. ETL/ELT – механизм наполнения витрины данными из Core DWH.

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «Витрина данных».

Платформы класса «Витрина данных»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

ClickHouse

ClickHouse

ИТ-инфраструктура
ClickHouse — колоночная аналитическая СУБД (OLAP), созданная Яндексом и открытая в 2016 году. Обеспечивает обр...
Цена по запросу
★ 4.8
Подробнее →
ESOFT BI - platforma biznes-analitiki i vizualizatsii dannykh ot tyumenskoy kompanii E-Soft. Obespechivaet sbo...
Цена по запросу
★ 4.7
Подробнее →
OWOX BI — облачная платформа для маркетинговой и сквозной аналитики, автоматически собирающая данные из реклам...
Цена по запросу
★ 4.3
Подробнее →
Field Connect

Field Connect

ИТ-инфраструктура
Программное обеспечение для удалённого управления и мониторинга сельскохозяйственного оборудования: дождевальн...
Цена по запросу
★ 4.7
Подробнее →
ЛИНТЕР БАСТИОН

ЛИНТЕР БАСТИОН

ИТ-инфраструктура
ЛИНТЕР БАСТИОН — полностью отечественная реляционная СУБД, разработанная АО НПП «РЕЛЭКС» (Воронеж). Не основан...
Цена по запросу
★ 4.6
Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «Витрина данных».

Где применяется

Отрасли, в которых «Витрина данных» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Частые вопросы про Витрина данных

Чем витрина данных отличается от хранилища данных?

DWH – централизованное нормализованное хранилище всех корпоративных данных. Витрина – предметно-ориентированное денормализованное подмножество DWH для BI конкретного подразделения с оптимизацией под аналитические запросы.

Что такое схема «звезда» и зачем она нужна в витрине?

Схема звезда – структура с таблицей фактов в центре и таблицами измерений вокруг. Минимизирует число JOIN в аналитических запросах и ускоряет группировки по измерениям (время, регион, продукт).

Как часто обновляются витрины данных?

Зависит от требований: оперативные витрины обновляются каждые несколько минут через CDC; управленческие – ночью или раз в сутки полным пересчётом (full reload).

Можно ли строить витрину напрямую из операционных систем без DWH?

Технически да (Independent Data Mart), но это антипаттерн: витрины из разных источников дадут расходящиеся показатели, и бизнес получит несколько «версий правды».

Какие СУБД используются для витрин данных в России?

ClickHouse (колоночная СУБД от Яндекса), Arenadata DB (MPP на базе Greenplum), Tarantool Data Grid, а также облачные хранилища. Все поддерживают денормализованные аналитические схемы.