Думаю, все знают программу для работы с электронными таблицами, название которой стоит в заголовке этой записи. А такая программа, даже по названию, очень близка к специфике работы ETL разработчиков, так как тоже работает с таблицами, как и мы.
Итак, как же можно использовать Microsoft Excel для ETL? Я предпочитаю версию 2003, но и с более поздними тоже можно работать.
1. Самое очевидное применение - документирование преобразований (их еще называют маппингами или маппинг документами). В этих документах описывается как из колонок таблиц источников получить значения колонок целевой таблицы (таблиц).
Можно использовать один документ для документирования одного преобразования (или для заполнения одной целевой таблицы), так и собрать все описания преобразований в один большой файл. В последнем случае появляется возможность искать одинаковые маппинги, и, при необходимости, менять их все за один раз.
2. Анализ данных. А, в случае ETL, зачастую метаданных. Ведение всевозможных списков таблиц с колонками для массовых преобразований, визуальное представление цепочек преобразований, когда прослеживается путь значения от таблицы источника через все стадии загрузки данных и т.п.
Прямое использование экселя для построение графиков по, например, метрикам ХД.
3. Помощь в подготовке SQL скриптов. Наиболее используемый мною режим работы с экселем. При помощи функции =CONCATENATE (=СЦЕПИТЬ в локализованной версии) удается сделать массу всего полезного. Например, посчитать количество строк в выбранном наборе таблиц, сформировать сбор статистики только по выбранным таблицам и прочее подобное.
Еще одна полезная функция =IF (=ЕСЛИ), которая помогает сравнить два отсортированных списка колонок или колонок и их типов, или таблиц и т.п.
Ну и дополнительные моменты - автоматическая фильтрация по значениям колонок, выделение цветом и прочие удобные мелочи.
P.S. Кстати, некоторые считают, что MS Excel является самой используемой BI платформой в мире:
Комментариев нет:
Отправить комментарий
Примечание. Отправлять комментарии могут только участники этого блога.