суббота, 1 октября 2011 г.

Лучший опен сорс ETL (Pervasive, Talend, Pentaho).

Привет всем.

Перевод небольшого обсуждения, состоявшегося в группе Data Warehousing (Business Intelligence, ETL) Professional's Group на сайте Линкед Ин.

Я буду указывать только имена участников. Дискуссия начата Прашантом.


Какое из ETL средств с открытым кодом (Pervasive, Talend или Pentaho) лучше?

Puneet:
Pervasive

Gururaj:
Если это чисто ETL средство, тогда вы можете начать с kettle или talend. Если же у вас есть специальные требования, вам нужно сравнить какое из них лучше подойдет под эти требования.

John:
Самый лучший ответ на такой тип общих вопросов как "Какое средство лучше?" всегда один - "Это зависит от того, что вам нужно". Нет одного правильного ответа. Если вы не знаете, что вам нужно, вы не сможете выбрать правильный инструмент для вашей ситуации. Я бы рекомендовал вам провести некие исследовательские работы. И, да, это займет время и потребует определенных усилий.

Arkadiusz:
Привет. Я потратил несколько месяцев на тестирование всех трех. В этот период Pentaho показал себя самым подходящим. Он работает! Я бы рекомендовал Pentaho всем, так как он очень гибкий. Я бы не рекомендовал Pervasive так как в нем используется проприетарный скриптовый язык, который необходимо учить только для использования с Pervasive. Это мое мнение сформировалось год-два назад, и, возможно, с тех пор что-то изменилось, но если бы мне пришлось выбирать, я бы сразу выбрал Pentaho. Я думаю, что это замечательный инструмент.

Mohammed:
Привет Arkadiusz.
Уточни пожалуйста следующие моменты. Как тебе Pentaho с точки зрения производительности, легкости в использовании и изучении, отсутствия необходимости в ручном кодировании, возможностях подключения к различным СУБД (Oracle/DB2/SqlServer и т.п.) Может ли он работать на различных ОС (*nix и Windows ...), есть ли техподдержка? Известные тебе баги, сложность сопровождения.
Спасибо.

Fidel:
Многие частные или публичные компании, включая мою, сейчас изучают или внедряют следующие ETL с открытым кодом:
  • Talend
  • CloverETL
  • Pentaho - мой фаворит и сообщество действительно развивает этот инструментарий чтобы он оставался конкуретноспособным по сравнению с закрытыми инструментами...

Эти три лидирующих ETL с открытым кодом удовлетворяют широкому спектру требований к ETL средствам начиная с обычного преобразования данных и до проведения ad-hoc анализа и построения отчетности.

Arkadiusz:
Привет Mohammed.
Я бы сказал, что с точки зрения производительности он [Pentaho] хорош, скорость - он использует Java и скорость ограничивается именно ею. Легкость использования также хороша - инструмент очень интуитивен и может быть изучен достаточно быстро. Относительно написания кода - зависит от того, чего нужно достичь. Там достаточно много встроенных функций, которых вполне может быть достаточно для каких-то ситуаций.
Можно добавлять код на почти любых языках программирования, так как поддерживается запуск скриптов не только из языка Java.
Подключаться можно не только к перечисленным СУБД но и почти ко всему, для чего найдется подходящий JDBC драйвер. Работает на Windows, Linux и Mac OS.
Я использовал редакцию с открытыми кодами и получал поддержку только от сообщества. Я смог найти ответы практически на все свои вопросы. Есть возможность платить за техподдержку. Исправление багов и выход новых версий достаточно частый, я бы сказал. Надеюсь, это поможет.


Комментариев нет:

Отправить комментарий

Примечание. Отправлять комментарии могут только участники этого блога.