Термин · Глоссарий B2B-ПО

Интеграция данных (Data Integration)

Интеграция данных (Data Integration) – процессы и инструменты, обеспечивающие объединение данных из разнородных источников в единое согласованное представление. Включает ETL, ELT, CDC, API-интеграцию и федеративные запросы. Является ключевым компонентом корпоративной дата-архитектуры.

Буква «И» В категориях: 4 Платформ: 6+

Введение

Интеграция данных (Data Integration) – дисциплина и набор технологий, обеспечивающих объединение данных из разнородных источников (OLTP-баз, ERP, CRM, API, файлов, облачных сервисов) в единое согласованное представление для аналитики, операционных нужд или обмена между системами. Без интеграции данных организация сталкивается с разрозненными «островами данных», каждый из которых содержит лишь часть истины.

Gartner выделяет несколько паттернов интеграции данных: ETL (Extract-Transform-Load), ELT, CDC, виртуализация данных, репликация, потоковая интеграция и API-интеграция. Инструменты интеграции данных – один из крупнейших сегментов корпоративного ПО.

История и контекст

Первые ETL-инструменты появились в 1980-х годах вместе с первыми Data Warehouse. Informatica PowerCenter (1993), IBM DataStage, Microsoft SSIS стали стандартами рынка. В 2010-х годах облако и Big Data изменили парадигму: появились ELT (load first, transform later), cloud-native коннекторы (Fivetran, Stitch, Airbyte) и iPaaS (Integration Platform as a Service).

Как это работает

Основные паттерны интеграции данных:

  • ETL (Extract-Transform-Load) – классический подход: данные извлекаются из источника, трансформируются в промежуточном слое, загружаются в DWH. Инструменты: Informatica, Talend, Microsoft SSIS.
  • ELT (Extract-Load-Transform) – современный подход для облачных DWH: данные загружаются в сыром виде, трансформируются SQL-запросами внутри хранилища. Инструменты: dbt, Fivetran + Snowflake/BigQuery.
  • CDC (Change Data Capture) – захват изменений из источника для near real-time интеграции.
  • Виртуализация данных – федеративные запросы через виртуальный слой без физического перемещения данных.
  • API Integration / iPaaS – обмен данными через REST/SOAP API. Инструменты: MuleSoft, IBM App Connect, Bercut HIP.

Где применяется

  • Построение Data Warehouse и Data Lake.
  • Синхронизация данных между CRM, ERP, биллингом.
  • MDM (Master Data Management) – создание единого справочника клиентов, продуктов.
  • Регуляторная отчётность – сбор данных из множества систем для ЦБ РФ, Росстат.

Преимущества и ограничения

Преимущества: единое представление данных из разных систем; снижение ручного труда по переносу данных; основа для BI, AI и MDM-проектов.

Ограничения: сложность управления при большом числе источников; задержки при batch-интеграции; риск нарушения целостности при schema evolution.

Связь с другими понятиями

Data Integration является ключевым инструментом для наполнения Data Lake и Data Warehouse. Data Ingestion – подмножество интеграции, фокусирующееся на первичной загрузке. Data Lineage отслеживает трансформации в интеграционных пайплайнах. DataOps применяет DevOps-практики к управлению интеграционными процессами. Data Governance определяет правила согласования данных из разных источников.

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «Интеграция данных».

Платформы класса «Интеграция данных»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

ClickHouse

ClickHouse

ИТ-инфраструктура
ClickHouse — колоночная аналитическая СУБД (OLAP), созданная Яндексом и открытая в 2016 году. Обеспечивает обр...
Цена по запросу
★ 4.8
Подробнее →
MasterOPC

MasterOPC

Производство и логистика
MasterOPC — российская коммуникационная платформа для промышленной автоматизации, реализующая протоколы OPC UA...
Цена по запросу
★ 4.8
Подробнее →
Field Connect

Field Connect

ИТ-инфраструктура
Программное обеспечение для удалённого управления и мониторинга сельскохозяйственного оборудования: дождевальн...
Цена по запросу
★ 4.7
Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «Интеграция данных».

Где применяется

Отрасли, в которых «Интеграция данных» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Частые вопросы про Интеграция данных

Что такое Data Integration?

Процессы и инструменты объединения данных из разных источников в единое согласованное представление для аналитики и операционных нужд.

Чем ETL отличается от ELT?

ETL трансформирует данные до загрузки в хранилище. ELT сначала загружает сырые данные, затем трансформирует SQL-запросами внутри облачного DWH.

Что такое iPaaS?

Integration Platform as a Service – облачная платформа для интеграции систем через API и коннекторы. Примеры: MuleSoft, IBM App Connect, Bercut HIP (id: 6183).

Какие российские инструменты Data Integration существуют?

Bercut Hybrid Integration Platform (id: 6183) – отечественная интеграционная платформа. Также используются 1С-интеграторы и отечественные ETL-решения.

Что такое виртуализация данных?

Подход, при котором данные из разных источников запрашиваются через единый виртуальный слой без физического копирования. Снижает дублирование, но может иметь задержки.