ITS Data Processing Platform

Платформа для анализа, хранения и обработки больших данных на базе ПО с открытым исходным кодом.

Fixprice
Tass
S7
Tilda
Askona
Habr
Lenta
Action

ITS DPP

Позволяет осуществлять сбор, обработку и хранение всех данных предприятия в рамках единой платформы, построенной на базе ПО с открытым исходным кодом:

ITS DPP будет полезна, если необходимо:

Построить систему хранения, обработки и анализа данных с нуля

Создать витрины данных, организовать процессы обработки данных, реорганизовать хранение данных

Быстро развернуть инфраструктуру для хранения и анализа данных

Сократить издержки путём оптимизации инфраструктуры и избегая при этом ресурсных потерь

Что с её помощью можно сделать

Создать Data Lake или Data Warehouse для хранения структурированных и неструктурированных данных
Организовать контроль и доставку кода заданий для обработчиков данных
Настроить дашборды с разными уровнями доступа для различных подразделений
Организовать сбор данных из разнородных источников в единое хранилище
Настроить ETL/ELT преобразования
Настроить потоковую и пакетную обработку данных
Организовать проверку качества данных

Преимущества нашего решения

Используем подхода IaC, что обеспечивает оперативное внедрение и установку, включая развёртывание в закрытом контуре.
Платформа полностью сконфигурирована и готова к работе сразу после установки. Связи между компонентами модулей протестированы и отлажены.
В составе платформы CI/CD-пайплайны, обеспечивающие бесшовную доставку кода.
Платформа построена на базе opensource-компонентов, прошедших тщательное тестирование.
В состав уже включены все необходимые коннекторы нашей разработки.
Отечественная разработка
ITS DPP внесена в Единый реестр российских программ для ЭВМ под номером № 19542

Состав платформы обработки данных ITS DPP

Назначение модулей

Apache Airflow
Apache Airflow

ITS DPP.MW — реализация процессов сбора и пакетной обработки данных.

Apaache Kafka
Apaache Kafka
Apache Spark
Apache Spark

ITS DPP.ETL — преобразования, пакетная и потоковая обработка, сбор и хранение необработанных данных.

Greenplum
Greenplum

ITS DPP.MPP DB — хранение структурированных данных в кластере Greenplum.

Apache Hadoop
Apache Hadoop

ITS DPP.DataLake — реализация хранилища для больших объемов неструктурированных данных.

Apache Superset Redash
Apache Superset Redash

ITS DPP.Analytics DB — хранение структурированных данных в кластере ClickHouse, формирование витрин данных.

Prometheus
Prometheus

TS DPP.DSM — мониторинг и управление компонентами платформы. Поставляется бесплатно с любым набором модулей.

Модули платформы ITS DPP

Модули

  • ITS DPP.ETL
  • ITS DPP.MPP DB
  • ITS DPP.Analytics DB
  • ITS DPP.MW
  • ITS DPP.DataLake
  • ITS DPP.DSM

Эта конфигурация* адресована для корпоративных заказчиков, позволит решить задачи обработки и анализа данных «под ключ».

Она предоставляет возможности пакетной и потоковой обработки, хранения структурированных и неструктурированных данных и построения витрин данных и аналитики.

*При необходимости вы можете приобрести только отдельные модули.

Назначение

Реализация полной цепочки ETL — преобразований в рамках потоковой обработки данных, а также предоставление инструментов сбора данных.

Решаемые задачи

  • Потоковая передача данных в режиме реального времени;
  • Организация корпоративной шины интерактивного обмена данными;
  • (Data pipeline) между распределенными приложениями;
  • Мониторинг и управление данными (рабочими процессами);
  • Хранение неструктурированных данных.

Матрица соответствия зарубежным продуктам

Moдули ITS DPPЗадачиЗарубежное заменяемое решение
ITS DPP.MWELT-оркестратор для пакетной обработки данных.Luigi, Rundeck
ITS DPP.ELTШирина данных. Сбор и потоковая обработка данных.Confluent Kafka, IBM Streams, SAS Event Streams, Processing, Azure Stream Analytics, TIBCO, Streaming, Cloudera DataFlow
ITS DPP.MPP DBOLAP / RAC / Exadata (DWH)AWS Redshift, GCE BigQuery
AWS Redshift, GCE BigQueryСУБД для анализа временных рядов. Витрины данных. In-memory RDBSM.Amazon Timestream, HCL Informix, InfluxDB, Enterprise, Kdb+, Taradata SAP HANA, Cassandra, Scylla
ITS DPP.DataLakeХранение документов, JSON. Экосистема Hadoop. Реляционная облачная СУБД.MongoDB, DynamoDB, Продукты Cloudera / Hortonworks, Azure SQL, Google Big Query
ITS DPP.DSMПанель управления платформой обработки данных.Продукты Cloudera / Hortonworks
Лицензирование

Платформа и отдельные модули продаются как лицензия на срок 1 или 3 года. Техническую поддержку можно приобрести на 1 или 3 года.

Лицензия и техническая поддержка приобретаются на каждое физическое ядро сервера или виртуальной машины, на которых развернута платформа или модуль. При первой покупке в состав лицензии включена бесплатная техническая поддержка в течение одного года с момента приобретения лицензии.

Стоимость рассчитывается индивидуально под каждого заказчика, в зависимости от задач и объема данных.

Приобрести лицензию можно через наших партнеров, для получения контактов  - обращаться в отдел продаж ITSumma.

Жизненный цикл версии модуля

Активная разработкаПоддержкаОкончание поддержки
Документация по работе платформы+++
Диагностика и устранение сбоев в работе компонентов платформы++-
Диагностика и устранение неэффективностей в работе компонентов платформы++-
Осуществление консультаций по работе платформы+--
Доступ к минорным обновлениям+--
Помощь в установке обновлений+--
Состав технической поддержки
  • Выявление и устранение сбоев в работе компонентов платформы.
  • Диагностика и внесение изменений для эффективной работы компонентов платформы.
  • Поддержка при внедрении обновлений.
  • Консультирование пользователей по вопросам экспулатации/использования компонентов платформы.
  • Поддержка при разворачивании платформы в различных окружениях, в т.ч. нестандартных.
  • Консультирование по подготовке инфрастуктуры для развёртывания платформы.
  • Разработка новой функциональности по запросу.
  • Выявление и утранение сбоев в работе компонентов платформы.

SLA технической поддержки

Формат гарантийной поддержки8*5
Каналы коммуникацийЭлектронная почта, telegram-чат, тикет-система
SLA на реагирование1 час
Восстановление работы системы в случае полной потери функциональности2 рабочих дня
Восстановление работы системы в случае частичной потери функциональности5 рабочих дней
Другие вопросы по использованию продукта10 рабочих дней

DataOps-сопровождение

В рамках DataOps-сопровождения от ITSumma вы сможете решить следующие задачи:

Подключить источники данных к платформе.
Разработать ETL-обработчики.
Построить хранилища структурированных (Data Warehouse) и неструктурированных данных (Data Lake) с их последующим сопровождением.
Настроить инструменты аналитики и визуализации данных, BI-системы.
Настроить, автоматизировать и масштабировать обработку потоков данных.
Настроить CI/CD-конвейеры и внедрить DevOps-процессы для бесперебойной работы серверов и инфраструктуры.
Анализировать работу платформы и разработать сценарии её оптимизации.
Важно

Услуга DataOps-сопровождения не входит в состав лицензии, но доступна для использования любому покупателю платформы ITS DPP.

Технические требования

Для разворачивания в высокодоступной редакции необходимо не менее 9 серверов суммарно с 80 ядрами CPU, 396 Гб оперативной памяти и достаточным объемом хранилища данных.

Варианты развертывания

  • On-premise
  • Виртуальные сервера
  • Air-gapped environment
  • Облачные провайдеры (Yandex Cloud, Cloud, VK Cloud)

Операционные системы

  • Ubuntu
  • CentOS
  • Astra Linux
  • РЕД ОС

Совместимые платформы

  • Deckhouse
  • OpenShift

Документация

Руководство по эксплуатации
Скачать
Инструкция по установке
Скачать

Реализованные проекты

Где мои дети

Увеличение производительности системы сбора данных с учетом GPS и аналитики.

Задачи:

  • Создание инфраструктуры для приема, хранения, обработки и анализа данных;
  • Наличие в системе поддержки postgis;
  • Возможность адаптации текущих пайплайнов обработки данных;
  • Возможность быстрого масштабирования под потребности проекта;
  • Создание CI/CD пайплайнов для приложений, работающих в инфраструктуре.

Решение:

Использовался следующий набор модулей

  • ITS DPP.ETL
  • ITS DPP.MPP DB
  • ITS DPP.Analytics DB

Дополнительные работы

  • Интеграция платформы в текущую инфраструктуру клиента
  • Адаптация текущих ETL процессов

Технологические партнеры

Готовы обсудить проект?

Ответим на заявку в ближайшие 24 часа. А еще мы можем проконсультировать вас по телефону +7 800 555-91-99, электронной почте info@itsumma.ru или в Telegram-чате.

Свяжитесь со мной здесь
Свяжитесь со мной здесь
❗️Имя не может быть пустым
❗️Телефон не может быть пустым
❗️Email не может быть пустым