vectorfusionart - Fotolia
Data Architect, Data Engineer, Data Scientist, Data Modeler : comment les combiner ?
Ces quatre métiers – complémentaires, mais différents – sont clefs pour une équipe Data performante. L’expert Michael Bowers explique comment constituer une telle équipe et donne ses conseils aux professionnels de la donnée pour augmenter leurs revenus.
Lors d’une récente conférence en ligne sur la façon de construire et de gérer une architecture de données moderne, Michael Bowers (architecte en chef chez FairCom, fournisseur de bases de données NoSQL et qui a plus de 30 ans d’expérience dans le domaine) a comparé plusieurs postes dans la gestion et l’analyse de données. Il y abordait leurs principales fonctions dans l’entreprise et les compétences qu’elles requièrent.
Il y a également donné quelques conseils sur la façon dont les organisations devraient procéder pour mettre sur pied une équipe de Data Management efficace et pour les professionnels de la data, le moyen de gonfler légitimement leurs salaires sur le long terme.
Différences entre Architecte, Modeler et Data Scientist
Les postes qui apportent le plus de valeur ajoutée aux entreprises – comme ceux d’architectes, de Data Modelers et de Data Scientists – sont les plus difficiles à pourvoir, selon Michael Bowers, car ces personnes doivent connaître mieux que toutes les autres les technologies de pointe (qui sont donc au cœur de ces postes).
Mais en quoi ces trois métiers diffèrent-ils ?
Les Data Architects conçoivent et aident à mettre en œuvre des systèmes de bases de données et d’autres référentiels pour les données d’entreprise. Ils sont également chargés de veiller à ce que les organisations se conforment aux réglementations intérieures et extérieures sur les données, d’évaluer les nouvelles technologies et d’en recommander certaines en fonction des besoins de l’entreprise.
Michael Bowers décrit l’architecte des données comme un « savant à tout faire » qui doit s’être familiarisé avec les différentes bases et les différents outils de gestion de données, qui doit connaître les cas d’usages possibles, et qui doit être informé sur les coûts et les limites des technologies ainsi que sur les tendances du secteur.
Ce poste demande beaucoup de connaissances et d’expérience, prévient l’expert. Il n’est donc, logiquement, pas donné financièrement.
Un Data Modeler, lui, identifie les règles métier et les sous-ensembles dans les jeux de données (Data Set). Il conçoit des modèles de données pour les bases (et les autres systèmes) pour réduire les redondances et améliorer l’intégration des données.
« Il est difficile de trouver un bon Data Modeler », constate Michael Bowers. « C’est tout un art. Celui qui pense qu’il suffit de jeter des données dans un ordinateur et qu’il en sortira automatiquement un bon modèle se trompe ».
Les ingénieurs logiciels – qui sont également bons en modélisation de données – sont souvent ceux dont le profil donnera les meilleurs résultats, ajoute-t-il.
Les Data Engineers et Data Scientists très Big Data
Un Data Engineer est essentiellement un ingénieur BI pour le Big Data. Il construit des pipelines reliant les bases et les grands systèmes entre eux. Comme les architectes, il doit comprendre les subtilités des diverses technologies, aussi bien cloud que sur site.
Comme il s’agit de Big Data, les Data Engineers peuvent souvent être happés par la technologie au lieu de se concentrer sur la création de valeur pour les métiers, avertit Michael Bowers. « Ils passent parfois tout leur temps à jouer avec les outils, sans sortir rien de vraiment concret ». Il faut donc veiller à bien les intégrer au reste d’une équipe Data et qu’ils aient en tête les bénéfices métiers qui sont, au bout du compte, l’objectif.
Les Data Scientists, eux, trouvent, préparent et analysent les données à l’aide d’algorithmes d’apprentissage statistique (Machine Learning) ou d’autres applications analytiques de pointe. Mais, avertit encore Michael Bowers, les résultats qu’ils produisent peuvent être problématiques s’ils n’ont pas une connaissance profonde des méthodes statistiques – le fondement de la datascience, pour l’expert – et qu’ils ne les appliquent pas de manière appropriée.
« Il est très facile pour des gens de prétendre qu’ils sont Data Scientists alors qu’en fait, ils ne connaissent rien aux statistiques ». Mais développer, tester et valider des modèles prédictifs « nécessite vraiment un statisticien de niveau Doctorat ».
Chevauchement de compétences
À noter que les compétences des différents postes dans le domaine de la gestion de données peuvent se chevaucher. Certes, dans les grandes entreprises, les administrateurs de bases de données (DBA) sont souvent spécialisés au point qu’ils développent, exploitent et administrent presque uniquement leurs bases favorites. Mais dans de nombreuses petites entreprises, un DBA est davantage un employé « à tout faire » qui s’occupe également de la qualité des données, de leur modélisation, de leur analyse et du reporting.
Au passage, les administrateurs de bases de données qui se cantonnent aux tâches opérationnelles se mettent dans une position extrêmement précaire, alerte Michael Bowers.
Ces métiers de DBA existent depuis longtemps et sont donc plus faciles à pourvoir. Mais, en plus, leur valeur est en forte baisse avec l’avènement annoncé de l’administration automatisée des bases grâce à l’Intelligence Artificielle et à l’analytique.
« [Ce type de DBAs] continue de faire les choses quasiment à la mano. Ils ne se forcent pas à se former à de nouvelles choses », avance Michael Bowers. « Si vous êtes DBA, abandonnez le plus rapidement possible cette conception de votre métier et passez à la modélisation, au développement et/ou à l’ingénierie BI ».
Comment augmenter sa rémunération ?
Dans un deuxième temps, Michael Bowers a également expliqué comment les professionnels des données pouvaient augmenter leurs salaires.
Son premier conseil : avoir une connaissance approfondie d’une grande variété de technologies. Les statistiques, l’apprentissage automatique et les nouvelles compétences techniques sont particulièrement prisés, avance-t-il.
Une collaboration plus étroite avec les responsables informatiques serait également bénéfique.
La clé – selon Michael Bowers – « c’est de vous pousser à maîtriser toutes les technologies qui se présenteront à vous ».
« Explorez-les de fond en comble, mettez-les en application puis passez à d’autres technologies […] Vous serez étonné(e) de ce que vous pouvez maîtriser et accomplir au fil des décennies ».
Mais cette démarche de formation permanente à un coût important. « Vous ne pourrez pas faire cela en travaillant seulement 40 heures par semaine. Vous pouvez travailler 40 heures par semaine pour votre entreprise, mais vous devrez passer 10 à 20 heures de plus à maîtriser des choses qui dépassent le périmètre de votre emploi actuel ».
Quels postes pourvoir en premier dans une équipe data ?
Dernier point, mais non le moindre, lors de son intervention Michael Bowers a donné quelques conseils pour constituer une équipe de gestion des données. D’après son expérience, certains postes devraient être pourvus en priorité : ceux d’analystes des données, d’ingénieurs BI et de responsable de la qualité des données - avec de préférence des collaborateurs qui sortent de l’université. Les DBA sont également indispensables.
Cette stratégie permet de confier une grande partie du travail pratique quotidien sur la donnée à des juniors. Vous pourrez ainsi réduire au maximum le nombre Data Engineers, de Data Scientists et de Data Architects à embaucher. Pour Michael Bowers, c’est le moyen le plus économiquement viable de doter les divers postes dans une équipe dédiée à la gestion des données.
Mais attention…
Pour ces postes experts, il faut trouver « les bonnes personnes » – et donc être prêt à les payer – avertit l’expert. Dans le cas contraire, vous pourriez vous trouver dans la situation où vous confiez ces postes clés à des employés qui « peuvent certes être de beaux parleurs, mais qui, sans même que vous vous en rendiez compte, vous auront endormis dans un nuage de fumée », prévient-il de manière imagée.
« Embauchez des personnes en qui vous avez confiance, et qui savent vraiment de quoi elles parlent », martèle l’expert. Sans quoi, le ROI de l’équipe ne sera pas au rendez-vous.