QUELQUES ARTICLES ASSOCIES

Talend, l’ETL Open Source

La société Talend a développé l’ETL Open Source Talend Open Studio (TOS).
En premier lieu nous allons expliquer de manière générale ce qu’est un ETL puis nous verrons les grandes fonctionnalités de TOS.

 

ETL (Extract Transform Load)

Un ETL est une solution informatique dite « middleware » permettant de synchroniser des données de façon massive d’un environnement à un autre, et ceci même si ces environnements sont hétérogènes (synchronisation de données d’une base Oracle vers une base MySQL par exemple ….).

Un ETL est composé de connecteurs permettant l’import ou l’export de données, de transformateurs permettant de manipuler les données (conversions de types, calculs, filtres, …) et du mapping (mise en correspondance).

 

Talend Open Studio (TOS)

Talend Open Studio est une solution ETL d’intégration de données très puissante. Elle permet de réaliser des processus (ou Job) de manipulation, de transformation et d’intégration de données de façon graphique.

Il est tout de même nécessaire d’avoir des bases de programmation, notamment Java.

Une fois les Jobs créés, Talend permet de générer un exécutable (shell ou .bat) qui permettra ensuite de déployer ces programmes sur divers systèmes.

La réalisation de Job Talend se fait de manière graphique par « glisser/déplacer » de composants existant dans le Studio. Talend Open Studio possède déjà une grande palette de composants:

  • connecteurs à différents types de bases de données
  • traitement de fichiers de type majeur (csv, xls, xml, txt, …)
  • envoi de mails
  • web service
  • …..
Talend permet également de créer vos mapping de façon assez simple à partir des tables d’une base de données, de fichiers csv, ….
Talend gère également la notion de contexte (développement, recette, production) qui vous permettra de déployer assez facilement vos Jobs.
S’il vous manque des composants au sein de la palette de TOS, il vous est possible de développer vos propres composants afin d’ensuite pouvoir les réutiliser pour d’autres jobs.

 

postgresql

PostgreSQL

PostgreSQL est un Système de Gestion de Base de Données Relationnel sous licence libre BSD.

Il est un des concurrents d’autres SGBDR tels que MySQL(libre), Oracle ou Microsoft SQL Server (propriétaires). [+] Lire la suite

reporting

Qu’est ce que le reporting

La notion de « Reporting » englobe les différents outils de Business Intelligence qui permettent de créer et de publier des rapports (ou comptes rendus). Ces différents rapports vont permettre la diffusion de résultats chiffrés. [+] Lire la suite