пятница, 30 ноября 2012 г.

Использование MS Excel для ETL.

Думаю, все знают программу для работы с электронными таблицами, название которой стоит в заголовке этой записи. А такая программа, даже по названию, очень близка к специфике работы ETL разработчиков, так как тоже работает с таблицами, как и мы.

Итак, как же можно использовать Microsoft Excel для ETL? Я предпочитаю версию 2003, но и с более поздними тоже можно работать.



1. Самое очевидное применение - документирование преобразований (их еще называют маппингами или маппинг документами). В этих документах описывается как из колонок таблиц источников получить значения колонок целевой таблицы (таблиц).


Можно использовать один документ для документирования одного преобразования (или для заполнения одной целевой таблицы), так и собрать все описания преобразований в один большой файл. В последнем случае появляется возможность искать одинаковые маппинги, и, при необходимости, менять их все за один раз.


2. Анализ данных. А, в случае ETL, зачастую метаданных. Ведение всевозможных списков таблиц с колонками для массовых преобразований, визуальное представление цепочек преобразований, когда прослеживается путь значения от таблицы источника через все стадии загрузки данных и т.п.


Прямое использование экселя для построение графиков по, например, метрикам ХД.


3. Помощь в подготовке SQL скриптов. Наиболее используемый мною режим работы с экселем. При помощи функции =CONCATENATE (=СЦЕПИТЬ в локализованной версии) удается сделать массу всего полезного. Например, посчитать количество строк в выбранном наборе таблиц, сформировать сбор статистики только по выбранным таблицам и прочее подобное.

Еще одна полезная функция =IF (=ЕСЛИ), которая помогает сравнить два отсортированных списка колонок или колонок и их типов, или таблиц и т.п.

Ну и дополнительные моменты - автоматическая фильтрация по значениям колонок, выделение цветом и прочие удобные мелочи.


P.S. Кстати, некоторые считают, что MS Excel является самой используемой BI платформой в мире:

Комментариев нет:

Отправить комментарий