Термин · Глоссарий B2B-ПО

Arenadata DB (Arenadata DB)

Arenadata DB – российская MPP (Massively Parallel Processing) СУБД на базе Greenplum/PostgreSQL для построения корпоративных аналитических хранилищ данных (DWH). Входит в Реестр российского ПО, поддерживает импортозамещение Oracle Exadata и IBM Netezza. Обеспечивает параллельную обработку петабайтных объёмов аналитических данных.

Буква «A» В категориях: 3 Платформ: 6+

Введение

Arenadata DB – российская аналитическая СУБД класса MPP (Massively Parallel Processing), разработанная компанией Arenadata (Москва) на базе открытого проекта Greenplum (VMware/Broadcom) с существенными доработками под требования российского рынка. Включена в Реестр отечественного программного обеспечения Минцифры РФ и рекомендована для замены зарубежных аналитических СУБД: Oracle Exadata, Teradata, IBM Netezza.

Arenadata DB предназначена для построения корпоративных хранилищ данных (DWH) и аналитических платформ, способных обрабатывать петабайтные объёмы структурированных данных с помощью параллельных SQL-запросов, распределённых по узлам кластера.

История и контекст

Greenplum, на котором базируется Arenadata DB, был создан компанией Greenplum Inc. (2003) и приобретён EMC (2010), затем вошёл в состав VMware. В 2015 году Greenplum был открыт под лицензией Apache 2.0. Архитектурно Greenplum основан на PostgreSQL: каждый сегментный узел – полноценный экземпляр Postgres с расширениями для MPP.

Arenadata основана в 2015 году. Помимо Arenadata DB, компания предлагает экосистему продуктов: Arenadata Hadoop (ADS), Arenadata Streaming (Apache Kafka), Arenadata QuickMarts (ClickHouse). Все продукты поддерживаются на российской инфраструктуре и обеспечены отечественной технической поддержкой.

Как это работает

Архитектура Arenadata DB построена на принципе Shared-Nothing MPP:

  • Master-нода – принимает SQL-запросы от клиентов, строит план запроса и координирует его выполнение на сегментах.
  • Сегментные ноды – каждый узел хранит свою партицию данных и выполняет часть запроса параллельно. Типовой кластер: 4–50+ сегментных хостов.
  • Interconnect – высокоскоростная сеть (10GbE/25GbE/InfiniBand) для передачи промежуточных результатов между сегментами при операциях redistribution (например, при JOIN по не-distribution-ключу).

Данные распределяются по сегментам с помощью distribution policy: hash (по значению ключа) или round-robin. Выбор ключа распределения критичен для производительности: неправильный ключ приводит к data skew.

Arenadata DB поддерживает колоночное хранение (Append-Optimized Column-Oriented, AOCO) для максимальной компрессии и скорости аналитических запросов с выборкой небольшого числа столбцов. Расширения: PostGIS для геоданных, MADlib для ML прямо в СУБД.

Где применяется

  • Корпоративные DWH: банки (Сбер, ВТБ, Россельхозбанк), телеком (Ростелеком, МТС), ритейл для хранения и анализа петабайтов транзакционных данных.
  • Регуляторная отчётность: формирование форм ЦБ РФ, Росстата из централизованного хранилища.
  • Импортозамещение: миграция с Oracle Exadata, Teradata, IBM Netezza в рамках требований 187-ФЗ и директив правительства.
  • Государственный сектор: централизованные хранилища данных федеральных и региональных ГИС.

Преимущества и ограничения

Преимущества: SQL-совместимость с PostgreSQL; включена в Реестр российского ПО; горизонтальное масштабирование через добавление узлов; поддержка партиционирования таблиц, компрессии данных, ACID-транзакций; российская техподдержка.

Ограничения: сложность администрирования MPP-кластера; data skew при неверном выборе ключа распределения; не подходит для OLTP-нагрузок – только аналитика; при масштабах менее нескольких ТБ ClickHouse или PostgreSQL могут быть более практичны.

Связь с другими понятиями

DWH – Arenadata DB является хранилищем в корпоративной DWH-архитектуре. MPP – класс архитектуры параллельных СУБД для аналитики. Apache Kafka и Apache Spark – компоненты экосистемы Arenadata для потоковой обработки и ETL. BI-платформы подключаются к Arenadata DB через стандартный JDBC/ODBC для построения отчётов и дашбордов.

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «Arenadata DB».

Платформы класса «Arenadata DB»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

ClickHouse

ClickHouse

ИТ-инфраструктура
ClickHouse — колоночная аналитическая СУБД (OLAP), созданная Яндексом и открытая в 2016 году. Обеспечивает обр...
Цена по запросу
★ 4.8
Подробнее →
RD

RT DataBase

Хранилища данных (DWH)
RT DataBase — российская система управления базами данных, разработанная ООО «РТ-ДИАСОФТ» (входит в экосистему...
Цена по запросу
Подробнее →
Modus BI

Modus BI

Данные и аналитика
Modus BI — платформа для бизнес-аналитики для органов государственного управления, предприятий и организаций.
Цена по запросу
★ 5.0
Подробнее →
БАРС.Мониторинг-ЖКХ

БАРС.Мониторинг-ЖКХ

Данные и аналитика
Информационно-аналитическая система для мониторинга и управления жилищно-коммунальным хозяйством на региональн...
Цена по запросу
★ 5.0
Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «Arenadata DB».

Где применяется

Отрасли, в которых «Arenadata DB» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Частые вопросы про Arenadata DB

Чем Arenadata DB отличается от обычного PostgreSQL?

PostgreSQL – однонодовая СУБД. Arenadata DB (Greenplum) – MPP-кластер из десятков узлов с параллельным выполнением запросов и распределённым хранением данных. Производительность аналитических запросов на больших объёмах на порядки выше.

Что такое MPP и зачем оно нужно для DWH?

MPP (Massively Parallel Processing) – архитектура, при которой каждый узел хранит часть данных и выполняет свою часть запроса параллельно. Для DWH это означает линейный рост производительности при добавлении узлов кластера.

Входит ли Arenadata DB в Реестр российского ПО?

Да, Arenadata DB включена в Единый реестр российского программного обеспечения Минцифры РФ, что позволяет использовать её в госзакупках и засчитывать как выполнение требований по импортозамещению.

Какие СУБД заменяет Arenadata DB?

Arenadata DB позиционируется как российская замена зарубежным MPP СУБД: Oracle Exadata, Teradata, IBM Netezza, Vertica. Используется в рамках программ импортозамещения по 187-ФЗ и директивам правительства для объектов КИИ.

Как Arenadata DB обрабатывает аналитические запросы быстрее?

Через параллельное выполнение: запрос разбивается на части, каждая из которых выполняется параллельно на своём сегменте. Колоночное хранение (AOCO) дополнительно ускоряет запросы с выборкой небольшого числа столбцов из широких таблиц.