Проект

Ростелеком (ADB - Arenadata BD)

Заказчики: Ростелеком

Москва; Телекоммуникация и связь

Продукт: ADB - Arenadata DB
На базе: VMware Tanzu Greenplum
Второй продукт: ADH - Arenadata Hadoop
Третий продукт: PostgreSQL СУБД

Дата проекта: 2018/04 — 2019/11
Количество лицензий: 3000
Технология: BI
подрядчики - 451
проекты - 3068
системы - 1153
вендоры - 560
Технология: СУБД
подрядчики - 275
проекты - 783
системы - 310
вендоры - 149

2019: Создание единой технологической платформы

Масштаб проекта

  • 115000 человеко-часов
  • 3000 автоматизированных рабочих мест
  • 500 абонентов

Цели

  • Объединение федеральных ХД организацией информационного-аналитического пространства на базе единой отказоустойчивой масштабируемой платформы (ЦХД), как единого источника достоверной, интерпретируемой, качественной, актуальной информации по оптимальной стоимости
  • Исполнение директивы Правительства по импортозамещению смещением баланса в сторону отечественного ПО, собственных разработок и open source
  • Сокращение ТСО/TCC систем отчетности и аналитики
  • Реализация в рамках ЦХД функции управления данными, методик консолидированной подготовки данных, ККД, бизнес-глоссария, интерпретации в бизнес-термины исходных данных, интеграция с MDM/RDM системами, предоставление data lineage, возможность impact анализа в границах полного жизненного цикла атрибутов
  • Развитие культуры бизнес-аналитики, использования инструментов исследования данных (Predictive Analytics, ML, Text Mining), повышение монетизации данных, демократизации.
  • Уменьшение T2M практиками прототипирования, self-service BI/ETL

Использованное ПО Store and Compute, DBMS:

В ходе проекта внедрены RDM и MDM системы, обеспечена интеграция с ЦХД, создан единый Глоссарий, составлен реестр отчетов, карта данных, разработан DG инструментарий, обеспечена демократизация данных. Определен целевой стек технологий, проведена закупка ПО, модернизация оборудования.Чекап для искусственного интеллекта: зачем и как тестировать ИИ-решения?

Внедренное оборудование позволило кратно увеличить возможности платформы (24 узла GP, 65 HDP, 7.5 ПБ диск пространства). Платформа подготовлена к росту объема данных, числа пользователей BI, витрин, песочниц. Развернуты дополнительно несколько контуров (DEV/TEST), что с внедрением релизного процесса, практик CI/CD позволяет повысить качество конечных продуктов.

Переход на open source, собственную разработку сократили требуемый объем закупки лицензий проприетарных продуктов в несколько раз, что уменьшило бюджет проекта на миллионы долларов, позволило нивелировать корпоративные и санкционные риски.

Командам других подразделений предоставлен сервис self-service BI/ETL в качестве отдельной площадки для самостоятельной разработки и демонстрации прототипов («серый» контур). ЦХД обеспечивает инфраструктурой и поддержкой прикладного ПО, сторонние команды сосредоточены на процессах анализа и разработки. Согласованные заказчиком прототипы, претерпевая рефакторинг, переносятся далее на целевой контур, что существенно снижает T2M.

В 2019 ЦХД официально введено в промышленную эксплуатацию.