La société Talend a développé l’ETL Open Source Talend Open Studio (TOS).
En premier lieu nous allons expliquer de manière générale ce qu’est un ETL puis nous verrons les grandes fonctionnalités de TOS.
ETL (Extract Transform Load)
Un ETL est une solution informatique dite « middleware » permettant de synchroniser des données de façon massive d’un environnement à un autre, et ceci même si ces environnements sont hétérogènes (synchronisation de données d’une base Oracle vers une base MySQL par exemple ….).
Un ETL est composé de connecteurs permettant l’import ou l’export de données, de transformateurs permettant de manipuler les données (conversions de types, calculs, filtres, …) et du mapping (mise en correspondance).
Talend Open Studio (TOS)
Talend Open Studio est une solution ETL d’intégration de données très puissante. Elle permet de réaliser des processus (ou Job) de manipulation, de transformation et d’intégration de données de façon graphique.
Il est tout de même nécessaire d’avoir des bases de programmation, notamment Java.
Une fois les Jobs créés, Talend permet de générer un exécutable (shell ou .bat) qui permettra ensuite de déployer ces programmes sur divers systèmes.
La réalisation de Job Talend se fait de manière graphique par « glisser/déplacer » de composants existant dans le Studio. Talend Open Studio possède déjà une grande palette de composants:
- connecteurs à différents types de bases de données
- traitement de fichiers de type majeur (csv, xls, xml, txt, …)
- envoi de mails
- web service
- …..