DataGrizzly

Проектирование отчетов, которые не придется переделывать

Необходимость контролировать свою работу подталкивает любую компанию к использованию накопленных данных. Так появляется система отчетности, а с ней – новые проблемы для менеджеров. Как сформулировать требования к отчетам (витринам данных)? Найти нужную информацию и написать техническое задание?

Мы помогаем заказчику максимально точно и полно сформулировать свои требования к витринам данных и превратить их в задачи, понятные разработчикам хранилища данных (аналитическая платформа)


Цели проектирования

А зачем вообще проектировать витрины и почему нельзя просто так взять требования заказчика и поставить ТЗ разработчику? Почему этап аналитики это не просто перевод замысла заказчика с языка бизнес-терминов на технический язык инструментов обработки данных?

Ответы на эти вопросы, находятся в плоскости понимания того, что витрина данных это не только результирующий датасет или BI-отчет, на которые смотрит заказчик, но и система путей, по которым движется необходимая информация от систем источников. Недостаточно "утрясти" атрибутный состав целевого набора данных – нужно его наполнить и детально проработать траекторию движения данных от источников. Итак, цели проектирования :

Вид витрины

Уточнение и фиксация вида целевого набора данных и бизнес-алгоритмов его сборки

Поток данных

Выявление облика и характеристик информационных потоков «запитывающих» проектируемую витрину

ТЗ

Постановка технического задания для реализации на аналитической платформе


Типичный подход

Любой сценарий проектирования витрины данных начинается с изучения аналитиком потребностей в информации и совместная с заказчиком работа по их уточнению. Помимо «шлифовки» исходного документа (БТ/BRD) аналитиком формируется набор своих собственных артефактов, отвечающих целям проектирования. Это могут быть скрипты сборки данных (прототипы) и аналитические запросы, схемы потоков и описания трансформаций данных, спецификации на наборы данных и модели данных, листы вопросов/ответов, а также другие. Следующим шагом этого процесса является подготовка технического задания для разработки витрины.

БТ - документ заказчика, аналитик может помочь его наполнить.

Артефакты аналитика могут быть как зависящими (тип 2), так и независящими от аналитической платформы (тип 1).

Техническое задание на разработку - документ установленный владельцами аналитической платформы.

Важно отметить, что в отличие от шаблонизированных БТ и ТЗ промежуточные артефакты аналитика, в подавляющем большинстве случаев, не имеют жесткой структуры и зависят от стиля и опыта исполнителя. Именно эти обстоятельства порождают связанные с проектированием проблемы.

Полнота

Нет гарантии, что проведенных аналитических исследований достаточно и не возникнет потребности в дополнительной аналитике

Преемственность

Нет возможности безболезненно передать результаты работы одного аналитика другому в случае форс-мажора

Прозрачность

Попытки понять алгоритмы готовой витрины связаны с внушительными трудозатратами на поиск информации и даже анализом кода


Что делаем мы

Наш продукт это проект витрины или системы витрин - пакет аналитических документов с помощью которого можно поставить техническое задание разработчику любой аналитической платформы. В отличие от типичного подхода, перечень мероприятий направленных на реализацию целей проектирования статичен, а результирующие документы имеют жесткий формат, не зависят от особенностей аналитической платформы и  создаются до написания технического задания.

Результат работы аналитика - проект витрины, а не ТЗ, являющееся артефактом аналитической платформы.

Проект одновременно можно реализовать на нескольких платформах.

Такой подход позволяет легко сформировать ТЗ сосредотачиваясь на особенностях платформы, а не аналитике. Кроме того, решаются три описанные выше проблемы.

1. Отработанный набор действий и артефактов, позволяет выявить и детально проработать и уточнить требования заказчика, а также гарантировать сборку именно ожидаемой витрины.

2. Работа аналитика разделена на этапы, что позволяет легко его подменить

3. Проект витрины можно использовать в качестве консолидированного документа об алгоритмах сборки витрины, на языке максимально приближенному к бизнесу.

Отдельная задача по проекту в общем трэке создания витрины повышает надежность всего проекта, а также делает возможным реализацию одной витрины на нескольких платформах.


Миграция

Именно проект витрины может стать тем надежным транзитным артефактом, вместо головы аналитика при переезде с legacy- на новую аналитическую платформу.

Процессы

Дельту изменений замысла витрины лучше и надежнее доставить к реализации по более длинной цепочке близких к друг другу артефактов (Замысел -> БТ -> ПВ -> ТЗ -> Реализация).

Data Governance

Управление данными сводится к управлению пулом проектов витрин

Правильно ли, что мы не работаем с "техникой" ? Вовсе нет, для достижения результата нам приходится пропускать через себя километры кода SQL запросов и процедур, писать свои, разбираться в структурах данных, особенностях репликаций, джобах ETL и прочих технических нюансах обработки информации.  Опыт нашей команды позволяет работать с любыми аналитическими платформами, построенными вокруг таких технологий как GreenPlum, Teradata, Vertica, PostgreSQL\Postgres Pro, Oracle DB, MS SQL, Hive\Impala\Spark и использующие такие ETL инструменты как Informatica, Pentaho, Talend, Airflow, Ni-Fi итп


Контакты

  • ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСВЕННОСТЬЮ "ДАТАГРИЗЗЛИ"
  • ОГРН: 1247700657665
  • ИНН: 9728142462
  • КПП: 772801001
  • Россия, г.Москва, ул.Академика Варги, д.8, к.1
  • +7(926)216-35-67
  • main@datagrizzly.ru