Tous deux proposés dans le cadre de notre offre d’intégration d’outils ETL, Microsoft SSIS et Talend font partie des logiciels les plus populaires pour l’intégration de données.
Gilles Nogues, directeur de projets spécialiste de Talend, et Alain Thiery, consultant décisionnel spécialiste de SSIS, ont accepté de se livrer à un match (amical) pour passer en revue les atouts (et les limites) de ces deux solutions.
L’avant-match : comprendre les outils ETL
L’Extract Transform Load (que l’on pourrait traduire par “Extraction Transformation Chargement”), souvent abrégé ETL, est un processus indispensable pour transformer les données brutes en informations exploitables.
Ainsi, les outils ETL se démarquent par leur capacité à rassembler et réorganiser des données provenant de multiples sources, les transformer et les centraliser afin d’alimenter un entrepôt de données.
De manière générale, ces logiciels permettent aux entreprises :
- D’exploiter tout le potentiel de leurs données en facilitant leur accès et en garantissant leur intégrité et leur cohérence.
- De préparer les données pour la mise en place de tableaux de bord avec des logiciels de datavisualisation.
- D’améliorer leur prise de décision stratégique grâce à des informations fiables.
Toutefois, les différentes solutions disponibles n’offrent pas systématiquement les mêmes fonctionnalités et possèdent leurs propres atouts. D’où l’intérêt de comparer deux des acteurs majeurs de l’ETL : Microsoft SSIS et Talend.
Les règles du jeu
Au cours de ce match des experts, nous passerons en revue Microsoft SSIS et Talend en fonction de 6 critères clés :
- Les clients cibles de la solution
- Les cas d’usage
- Les atouts
- Les limites
- L’utilisation en mode SaaS
- L’évolutivité
À présent, il ne nous reste plus qu’à donner le coup d’envoi !
1. Les clients cibles de la solution
Microsoft SSIS et Talend s’adressent, par nature, à la même cible. À savoir, toute entreprise qui souhaiterait exploiter des données provenant de sources diverses, dans différents formats.
Alain Thiery : “Cela peut être, par exemple, une entreprise qui a besoin de data dans un format spécifique pour l’intégrer dans son logiciel de comptabilité. Un outil ETL permet de modifier les données sources et de convertir les fichiers dans le format souhaité.”
Ces solutions ETL s’adressent donc à des entreprises de toutes tailles, dans tous les secteurs d’activité, car elles peuvent gérer n’importe quel type de data et aider les organisations à industrialiser leurs processus de transformation des données.
2. Les cas d’usage
Microsoft SSIS et Talend intègrent les fonctionnalités propres à la plupart des outils ETL, à savoir :
- La mise en place d’un entrepôt de données (data warehouse).
- L’interfaçage entre différents logiciels, permettant de restructurer les données pour passer de l’un à l’autre (plutôt que de faire un copier-coller).
- La migration entre deux versions d’une même application logicielle.
- La constitution d’indicateurs.
- L’émission d’alertes en cas de défaillance au cours du traitement (par exemple : une valeur trop longue ou avec un mauvais format, la présence de doublons en source…).
- L’automatisation du processus de migration de la data.
- Le filtrage, le nettoyage et l’historisation des données, afin de les exploiter dans des tableaux de bord.
En outre, les deux solutions sont capables de gérer divers types de fichiers (CSV, XML, JSON…) et bases de données (on-premise, cloud) grâce à des connecteurs. Les cas d’usage sont donc sensiblement les mêmes, à une différence près :
Gilles Nogues : “Talend possède une brique particulière permettant d’appeler des APIs (interfaces de programmation d’application), et même de créer ses propres APIs, ce qui est vraiment distinctif.”
3. Les atouts de la solution
Si les applications de Microsoft SSIS et Talend sont pratiquement identiques, chaque solution possède ses propres atouts.
Les atouts de Microsoft SSIS
Alain Thiery : “SSIS est inclus avec le moteur de base de données SQL Server. Il est aussi étroitement intégré à Microsoft Visual Studio, ce qui simplifie la vie des clients qui utilisent ces logiciels.”
Autres atouts : la solution de Microsoft inclut nativement une console permettant de planifier les traitements et de suivre leur exécution. En outre, l’outil permet de créer des flux de transformation avec un assistant graphique, même pour des utilisateurs non métier.
Enfin, SSIS peut compter sur une vaste communauté d’utilisateurs.
Alain Thiery : “Quand un utilisateur a une question, il peut trouver très rapidement quelqu’un qui a rencontré le même problème que lui. Les formations A5Sys et le support technique peuvent être aussi d’une grande aide.
Talend
Talend est apprécié pour son interface intuitive, permettant d’intégrer des composants en glisser-déposer.
Gilles Nogues : “L’outil est simple à appréhender, même pour un non-développeur. Tout est déjà embarqué : l’utilisateur peut faire de nombreux paramétrages, sans pour autant aller loin dans le code.”
De plus, la console de management et de planification, indépendante de la partie développement, permet de suivre facilement les exécutions et de s’assurer que tout se déroule bien.”
La plateforme propose également des fonctionnalités différenciantes, comme le traitement sous contrôle de présence d’un fichier, qui permet de lancer un traitement uniquement si un fichier a été déposé dans un dossier.
La gestion de versions intégrée avec GIT, quant à elle, permet de travailler à plusieurs sur un même projet.
Gilles Nogues : “Nous sommes sûrs d’avoir toujours la dernière version de notre projet, ce qui rend la solution très portative, très pratique pour la collaboration.”
Enfin, Talend possède un site internet très complet, avec une documentation détaillée sur chaque composant, contenant tous les paramétrages possibles, des scénarios et des exemples d’utilisations. La plateforme de formation “Talend Academy” permet également d’apprendre des fonctionnalités pas à pas.
4. Les limites de l’outil
Aucun outil ETL n’est parfait : Talend et Microsoft SSIS n’échappent pas à la règle ! Voici les quelques axes d’amélioration relevés par nos experts.
Les limites de Microsoft SSIS
Alain Thiery : “La gestion de l’accès aux données provenant d’API REST – pour la gestion commerciale, par exemple – est l’une des principales limites de SSIS.
De même, l’intégration d’un système de gestion de code source permettant de travailler à plusieurs n’est pas native.”
Talend
Gilles Nogues : “Auparavant, Talend proposait une version gratuite qui était utilisée par de nombreux clients. Mais elle a été retirée du marché il y a quelque temps et il ne reste qu’une version payante.”
5. L’utilisation en mode SaaS
Le mode SaaS est aujourd’hui profondément ancré dans les habitudes des entreprises. D’où l’intérêt d’évaluer les possibilités offertes par les deux solutions, notamment en matière d’hébergement cloud.
Microsoft SSIS
Alain Thiery : “Microsoft propose des produits conçus et développés spécialement pour le mode SaaS. La suite Microsoft Fabric, qui intègre de nombreuses briques logicielles inclut un outil (Azure DataFactory) qui reprend les fonctionnalités de SSIS, mais dans le cloud.”
Talend
Talend peut être utilisé en full cloud, mais aussi en mode hybride, combinant un déploiement dans le cloud et des flux on-premise sur le réseau local.
Gilles Nogues : “Avec Talend, le studio peut être installé dans le cloud ou bien sur une machine virtuelle en local. Cela répond à un besoin de certains clients, qui ne souhaitent pas que toutes leurs données transitent dans le cloud.
Il est donc possible de déployer des jobs, de gérer, planifier et suivre les exécutions, sans pour autant faire passer les données dans le cloud.”
6. L’évolutivité
Alors que le monde de la data et de la Business Intelligence est en constante mutation, quid de l’évolutivité de ces deux outils ETL ?
Microsoft SSIS
Alain Thiery : “Les solutions cloud et On-Premise de Microsoft sont en constante évolution, afin de toujours répondre aux besoins des utilisateurs et aux enjeux des entreprises.”
Talend
Gilles Nogues : “Talend a été rachetée récemment par Qlik, qui est connu pour sa capacité à faire évoluer ses produits, en ajoutant régulièrement des composants et des connecteurs.”
D’un côté comme de l’autre, l’évolutivité est donc assurée !
Le verdict
Inutile de faire durer le suspense plus longtemps : entre Microsoft SSIS et Talend, la partie a été serrée et elle ne pouvait que se conclure par un match nul.
Alain Thiery : “En réalité, il n’y a pas une solution meilleure que l’autre. Le choix d’un outil ETL dépend avant tout des fonctionnalités dont l’entreprise a besoin, de l’infrastructure qu’elle possède, de ses compétences…”
C’est justement là qu’intervient l’expertise d’A5Sys. Notre mission : vous aider à choisir la meilleure solution ETL en fonction de vos spécificités.
Loin de vous orienter “par défaut” vers tel ou tel logiciel, nous identifions avec vous l’option la plus adaptée, car nous pensons que chaque client et chaque projet sont uniques.