Avec l’explosion du volume de données collectées et générées par les organisations, un grand nombre de ces dernières ont pris conscience de l’importance supérieure de certains types de données. Parmi les données essentielles, on compte les données de référence.

Les données de référence, aussi appelées données maîtresses, ou en anglais master data pour les entreprises, ou encore « high value dataset » (HDV) pour le secteur public, sont des données de confiance partagées dans un écosystème.

Centralisées au sein d’un même référentiel, elles soutiennent l’activité courante de l’économie de l’entreprise, d’une communauté ou d’un pays. Leurs principales caractéristiques sont : stabilité dans le temps, fiabilité, unicité, qualité et fraîcheur. Facilement accessibles, elles permettent d’interagir avec d’autres informations et font partie du patrimoine de l’organisation.

Dans cet article, nous passerons en revue les différentes typologies de données de référence liées à l’entreprise et au secteur public.

 

Les données de référence des entreprises

Les données de référence pour les entreprises sont les informations essentielles portées par les clients, les fournisseurs, les partenaires, les salariés, les produits… Leur gestion dans un référentiel central apporte une vue unique et fait autorité dans le bon fonctionnement de l’entreprise.

Dans un environnement de volume, vitesse et variété, elles apportent une cohérence et une rationalisation de l’information dans les systèmes d’information communicants. Elles renforcent également les relations partenaires et fournisseurs où les logiciels métier sont capables d’interagir et de collaborer entre eux.

Elles facilitent la création de valeur dans leur réutilisation incluant le mélange avec d’autres ensembles de données en temps réel. Cette interopérabilité autour des données de référence facilite l’échange volumétrique des flux de données entre les applications via des API — Interface de Programmation d’Application ou des services web, deux protocoles d’échange de données.

 

Le MDM l’outil des données de référence

Ainsi, la gestion des données de référence (GDR) ou Master Data Management (MDM) constitue une priorité pour les entreprises dans l’homogénéité de la diffusion et du partage de l’information.

Le MDM désigne également l’ensemble des processus de gouvernance permettant de construire un référentiel consolidé de données de référence, intègre et de qualité. Dans leur construction, ces données essentielles sont nettoyées, dédoublonnées, enrichies, puis mises à jour régulièrement afin d’avoir un temps d’avance par rapport à la concurrence.

Ces données de référence traversent également les processus métier comme par exemple les données tierces — client ou fournisseur — autour de l’identifiant légal national, le n° TVA, la raison sociale, l’adresse du siège social, le téléphone, le code APE, la forme juridique, le numéro de TVA intracommunautaire…

Ainsi, par définition, les données de référence doivent être cohérentes, exhaustives, actualisées, de qualité et correctes, afin d’atteindre un objectif de performance. Par exemple : livrer au bon client le bon produit, dans la quantité demandée, au prix indiqué, au bon endroit et avec la bonne facture, et ce dans un délai court.

 

Les données de référence enjeu de compétitivité

Centralisées et partagées au sein de l’organisation, elles sont un enjeu clé de la compétitivité des entreprises, et favorisent leur agilité. Sans ces données de confiance, les conséquences pour l’entreprise sont des risques importants dans la gestion au quotidien et la prise de décision. Cet environnement implique pour les entreprises de disposer de données de référence à jour, pertinentes, traçables et historisables afin de pouvoir les recouper et les partager sur différentes applications métier, tant en interne qu’en externe. L’objectif est de pouvoir prédire des comportements ou anticiper la conception de nouvelles offres, avec pour finalité de satisfaire toutes les parties prenantes, clients… Actionnaires.

L’initialisation d’un référentiel de données de référence constitue la première grande étape d’une bonne gouvernance des données.

La question à se poser dans cette identification est la suivante : quelles sont les données essentielles, les plus critiques et les plus pertinentes pour mon entreprise ? Car les données de références ne sont pas les mêmes pour toutes les sociétés. Elles sont spécifiques en fonction de la taille, du marché, du secteur d’activité où évolue l’entreprise.

 

Données de référence publique européennes ou « high value dataset »

La directive 2019/1024  PSI — Public Sector Information — concernant les données ouvertes et leur réutilisation, a été adoptée le 20 juin 2019. Elle encourage les États membres de l’Union européenne à rendre disponibles certains ensembles de « high value data set » du secteur public en tant que données ouvertes.

« Ouverte » signifie gratuite dans la réutilisation avec des restrictions légales minimales dans un format lisible par machine, via des API pour des téléchargements en masse.

Les 6 catégories thématiques d’ensembles de données de forte valeur définies par la directive européenne sont les données :

  • Géospatiales (ex. : réseau routier, configuration des cours d’eau, représentation de l’altitude et du relief terrestre…)
  • D’observation de la terre et de l’environnement (amélioration de la gestion de l’environnement, soutenir la compréhension et l’atténuation des effets du changement climatique…)
  • Météorologiques (température de l’air, pression partielle de vapeur d’eau dans l’air, vitesse du vent, rayonnement solaire global, pluviométrie…)
  • Statistiques (population, commerce et services, agriculture, pêche…)
  • Sur les entreprises et propriétés d’entreprises
  • Sur la mobilité (statiques : arrêts, horaires, tarifs, accessibilité pour les personnes handicapées… Dynamiques : horaires en temps réel, informations sur les perturbations…)

Cette mise à disposition de données de référence, combinées avec d’autres ensembles de données, est vitale pour générer de nouveaux services innovants, créer des opportunités, en tirer tout le potentiel, améliorer la transparence et le dynamisme de l’économie.

 

Les jeux de référence de l’état français

Dans le cadre de la directive, l’État français a identifié et mis à disposition des rediffuseurs, neuf jeux de données fondamentales de référence en vue de faciliter leur réutilisation. Ces jeux de données présentent un fort impact économique et social pour lequel la disponibilité et la qualité sont critiques dans leur utilisation et leur redistribution.

C’est ainsi que la base Sirene et la Base Adresse Nationale (BAN) fait partie des données de référence gérées par le service public de la donnée. Ce service étatique a été créé par l’Article 14 de la loi pour une République numérique et est piloté par la mission Etalab. Il vise à :

  • Mettre à disposition des données, en vue de faciliter leur réutilisation ; chaque producteur de données du service public doit publier ses engagements sur les conditions de mise à disposition par une documentation, soumise à de fréquentes de mises à jour
  • Simplifier les démarches administratives des Français en systématisant le partage de données entre les administrations, permettant ainsi de ne pas réclamer plusieurs fois le même document
  • Améliorer l’efficacité des politiques publiques en renforçant le pilotage par les données
  • Stimuler l’innovation et la création de nouveaux services d’intérêt général et privés

 

Quelle conclusion ?

À l’ère du digital, la gouvernance des données de référence est un enjeu stratégique majeur, tant pour l’entreprise que pour les organisations publiques, dans un contexte d’internationalisation. Ces données privées ou publiques sont utilisées dans le noyau du système d’information, ainsi que pour les applications périphériques des organisations.

Elles constituent une référence unique pour être reliées et interagir avec d’autres données. Par leur unicité, elles sont créatrices de valeur, et enrichissent les données transactionnelles.

Enfin, une bonne gestion des données de référence améliore les actions déployées par chaque service de l’organisation, dans un contexte où de nombreuses réglementations et lois demandent toujours plus de transparence et de justification.