Un data stewardship distribué au service de la gouvernance des données
Les modèles de data stewardship et d’intendance distribuée apportent différents outils aux stratégies de gouvernance des données. Les organisations doivent comprendre les différences pour choisir la solution la mieux adaptée.
À l’ère « data-driven » et après l’instauration de réglementations comme le RGPD européen et le CCPA californien, les organisations prennent conscience de l’importance de la gouvernance de leurs données. Une mauvaise gestion est synonyme de manque de qualité et de visibilité des données. Aux risques d’amendes et de cyberattaques s’ajoute celui d’une potentielle inefficience économique.
Traditionnellement, les données étaient (sont ?) enfermées dans des silos. Les entreprises ont à cœur d’ouvrir en partie les portes de leur écosystème hétérogène. L’objectif ? Permettre à tous les membres de l’organisation de collaborer en toute confiance autour d’objets et d’informations communs afin de prendre des décisions pertinentes.
Si les outils – de la collecte en passant par l’analyse jusqu’à la visualisation des données – sont importants, il faut prendre en compte plusieurs aspects organisationnels.
La prise de décision « orientée par les données » dépend largement de la possibilité à exploiter des données qui seront transformées en indicateurs pertinents. Cela conduit souvent à des conversations sur la propriété des données, la responsabilité, la visibilité, la qualité, etc.
En cela, le déploiement d’un modèle d’intendance ou d’intendance des données distribuées doit faciliter la gouvernance et, idéalement, favoriser l’obtention de résultats positifs pour l’entreprise.
Or les deux approches sont fréquemment confondues. Cet article vise à dissiper tout malentendu, en clarifiant la différence entre ces deux termes et en expliquant pourquoi les organisations devraient envisager d’utiliser l’un de ces modèles pour gérer leurs données.
Intendance de données vs intendance de données distribuée
Dans l’entreprise, les data stewards doivent être des points de contact importants. Ils sont responsables du cycle de vie des données, ils pilotent tout ou partie de la gouvernance et sont parfois aux commandes des accès.
Dans de nombreux cas, l’intendance de données (data stewardship en VO) est une fonction centrale rattachée à la DSI ou à une entité transverse. Dans ce cas-là, elle est confiée à une équipe d’experts de la gouvernance de données et des accès.
Au contraire, l’intendance distribuée de données est un cadre qui permet aux équipes les plus proches des données de gérer tout ou partie des traitements et des accès. Ici, la gestion des données est décentralisée et réside au sein de l’unité opérationnelle.
Dans les faits, la notion de data stewardship infuse mal dans les entreprises, car de nombreuses organisations ne définissent pas clairement le rôle de data steward. Il est essentiel de formaliser ce rôle pour éviter toute confusion ou désillusion.
En la matière, les programmes efficaces débutent par la mise en place de la gestion et la gouvernance des données d’une organisation. Les éléments clés comprennent le triptyque de l’intendance des données : les personnes, la technologie et les processus.
- Le terme « personne » désigne les compétences du personnel en matière de traitement de données.
- La technologie englobe la connaissance des systèmes de données.
- Les processus couvrent la compréhension de l’emplacement des données pertinentes et de ce qui est disponible pour les différents projets.
Jusque-là, les deux modèles d’intendance cités plus haut ne divergent pas.
Peu importe si cette orchestration est décentralisée ou non, les programmes d’intendance peuvent s’appuyer sur des approches « orienté client », « measurment driven » (à savoir d’identification des risques majeurs et de leur surveillance), ou encore Lean Six Sigma, une méthodologie visant à une amélioration continue de la qualité des données « tout en supprimant les déchets, les temps morts et les gaspillages ».
Comment mettre en place une intendance des données efficace
Ainsi, pour mettre en place une politique de data stewardship efficace, trois éléments fondamentaux sont nécessaires : la culture organisationnelle, la gestion et la supervision des données.
- Culture organisationnelle. Un data steward ne peut réussir sa mission que si les dirigeants de l’entreprise soutiennent et intègrent sa vision. La clarté sur la propriété des données, la suppression des cloisonnements internes, la réutilisation des données et leur partage dans l’ensemble de l’entreprise donnent aux responsables de l’intendance la capacité d’aller au-delà de la gestion des règles et des accès.
- Gestion des données. La définition, la gestion, le suivi et l’amélioration de la qualité des données requièrent une attention particulière à leur origine, à leur architecture, à la manière dont elles sont administrées, à leur sécurité et aux droits d’accès.
- Supervision. Les responsables de la gestion des données doivent aligner leurs projets sur des paramètres de réussite clairs. Ces paramètres peuvent inclure le développement financier, qualitatif et humain, la productivité et l’alignement sur les objectifs de l’entreprise. Les mesures permettant de suivre les progrès d’une organisation comprennent la réduction de la complexité, la diminution des coûts et des délais d’exécution, l’optimisation de la valeur des données, l’amélioration de la vitesse d’exécution et l’élimination de la redondance, le renforcement de la collaboration ainsi que l’amélioration des résultats.
Sans ces éléments fondamentaux, il est difficile de tirer parti des données sans se confronter à des risques légaux, de performances et de sécurité. Le but ? Avoir la pleine connaissance des données pertinentes, utilisées, consommées, réutilisables et évolutives dans l’ensemble de l’organisation.
Divers exemples concrets de modèles de gestion des données montrent comment les organisations concrétisent leur vision de la valeur des données et tirent parti des avantages d’une bonne intendance. Dans certaines organisations, les data stewards sont des experts qui possèdent et gèrent un domaine de données spécifique. Dans d’autres, ils se concentrent sur un secteur d’activité et collaborent aux objectifs commerciaux du département. Ils peuvent également superviser des processus d’entreprise distincts et plusieurs domaines de données ou applications/systèmes.
Le plus souvent, les data stewards ont pour périmètre un système IT dans lequel ils doivent gérer la qualité et les accès aux données. Certains intendants sont les garants d’un projet et cessent de jouer leur rôle une fois celui-ci terminé. Dans tous ces cas, le périmètre technique et organisationnel du data steward doit être clairement définis.
Dans certains cas, un projet peut déboucher sur de mauvaises décisions, même si un responsable des données était impliqué au départ. Si intendant quitte un projet avant que celui-ci ne soit terminé et sans que ce périmètre ait été établi, cela met en péril sa continuité. Sans garant de la qualité de données et des accès, c’est la porte ouverte aux biais et autres problèmes de sécurité.
Mise en œuvre du modèle de data stewardship distribué
Si le modèle d’intendance peut influer sur la réussite d’une telle mission, il semble plus logique pour une grande entreprise dotée de nombreuses filiales d’adopter l’intendance de données distribuée. Cela n’est pas forcément évident : les sociétés ne bouleversent pas forcément leur mode de prise de décision au moment de s’étendre à l’international. Cela demande donc des efforts, du rythme et la réunion de parties prenantes clés pour faire accepter et adopter un tel cadre.
Les principales fonctions informatiques encore centralisées, telles que l’infrastructure, la gestion, la gouvernance de données, l’accès approprié aux données pour les utilisateurs ainsi que la conformité réglementaire sont susceptibles d’être réorganisés au fil du temps.
L’instauration de ce modèle peut se faire en plusieurs étapes, à savoir :
- Le maintien d’une équipe IT et d’une gouvernance centralisées associé à une gestion des accès aux données distribuée par ligne métier.
- La décentralisation de la gouvernance et de la gestion des accès aux domaines de données sans pour autant renoncer à une DSI cœur.
- Pour enfin, décentraliser l’IT en concordance avec les modes de gestion des données et des accès distribués.
La sélection d’un modèle correspondant le mieux à votre organisation est donc la deuxième étape d’un programme d’intendance de données. Il faut ensuite définir les éléments essentiels d’un modèle opérationnel cible et élaborer un plan de transition pour le déployer. Cela facilitera la gouvernance des données, le partage des données et l’utilisation régulière des données pertinentes, tout en améliorant les écosystèmes de données d’une organisation.