Comment urbaniser son SI et mieux exploiter ses données à l’ère de la Big Data ?

par | 4 février 2021 | Data & process

Urbanisation et exploitation des données

Evoluant avec les applications d’entreprise, les flux de données augmentent et se complexifient. Les informations sont désormais collectées en masse, circulent entre divers types d’applications et sont manipulées par un grand nombre d’intervenants. Les infrastructures n’évoluent quant à elles pas toujours à la même vitesse que leurs flux ! La donnée devient alors difficile à exploiter, voire à maîtriser pour les entreprises qui ne possèdent pas les clés de son utilisation. Entre raisons organisationnelles et gain de performance, l’urbanisation des données est nécessaire à tous les niveaux et s’avère un facteur de confiance pour les entreprises.

Pourquoi s’atteler à l’urbanisation de ses données ?

La maîtrise des flux de données, qu’ils soient internes ou externes, est cruciale à plusieurs titres pour les entreprises.
Parmi les principales raisons de mieux exploiter sa data, on peut citer :

Le besoin de structurer le SI

Au fil des décennies, les applications d’entreprises s’accumulent, devenant de plus en plus hétérogènes. Dans ce cadre peu unifié, l’information circule mal, rencontrant fréquemment des nœuds qui bloquent sa progression. Le résultat : des données qui ne peuvent être exploitées correctement, et donc des processus moins performants.
L’urbanisation du système d’information est donc un prérequis pour une bonne gouvernance des données. Instaurer une communication structurée entre applications permet de mieux maîtriser son architecture et de la rendre fiable et flexible.

La nécessité d’accélérer les flux

Pour s’adapter au rythme exponentiel de collecte des données, les flux entre applications métiers doivent en permanence s’accélérer. Ceci n’est cependant possible qu’en disposant d’une infrastructure adaptée, pensée à la fois pour une bonne distribution de l’information et pour anticiper les points de blocage. Pour de nombreuses entreprises, l’enjeu est de favoriser la collaboration et de raccourcir les délais de mise sur le marché des produits. Il en va de leur compétitivité : les données doivent donc être toujours disponibles et actuelles pour les métiers qui l’utilisent.

Le décloisonnement de l’information

Encore bien souvent gérée en silos, l’information est cloisonnée par des pratiques et des normes métiers très diverses. Le partage des données est pourtant plus que jamais nécessaire. Tout au long de leur cycle de vie, les métiers doivent pouvoir accéder à des données sur les produits ou projets, celles-ci étant consultables et compréhensibles par leur outil de travail. Une bonne urbanisation du SI inclut des solutions capables de traduire et véhiculer l’information à toutes les applications métiers, mais aussi de la partager et la faire évoluer de manière collaborative.

Garantir la souveraineté numérique

Avec l’augmentation des flux, la maîtrise des données devient plus difficile. Dépendance aux fournisseurs de Cloud leaders du marché, accessibilité parfois limitée des supports de stockage, protection de la vie privée variable d’un Etat à l’autre, cybercriminalité : la protection des données dépend grandement de la qualité de l’infrastructure. Celle-ci doit faire l’objet d’une stratégie à part entière pour une circulation des données plus sereine. La protection par des dispositifs de pare-feu, de cryptage ou d’authentification doit être accompagnée de bonnes pratiques des collaborateurs. Face aux questions de mobilité et à l’utilisation croissante de terminaux personnels dans le cadre du travail, la sensibilisation à la cybersécurité est elle aussi essentielle pour protéger les données.

Répondre à des exigences de la part des autorités, mais aussi des utilisateurs

Les réglementations en vigueur en France et en Europe protègent les données des utilisateurs. Celles-ci entraînent un certain nombre d’exigences, auxquelles les entreprises doivent pouvoir se conformer à tout moment. Mettre en place les bons processus et outils de protection des données, c’est à la fois être en règle sur le sujet de la confidentialité, mais aussi renforcer la confiance avec des utilisateurs parfois méfiants quant à l’exploitation de leurs données. Le respect du RGPD implique une traçabilité rigoureuse de l’information, de sa collecte à sa suppression.

Urbanisation des flux : une maîtrise des données tout au long de leur cycle de vie

Il existe un véritable cycle de vie de la donnée : de la conception d’un produit à son exploitation et même à sa fin de vie, les données le concernant circulent et sont exploitées. La maîtrise de la donnée implique donc un suivi et un stockage sans faille, mais aussi une unification des référentiels pour qu’à tout moment, les métiers puissent accéder à l’information dont ils ont besoin.
Dans ce caractère multifacettes de l’urbanisation des données, on distingue quatre axes principaux :

L’unification des données via un cadre commun

L’instauration d’un référentiel de données permet de garantir la qualité de celles-ci. Cartographiées et suivies durant leur cycle de vie, les données adoptent un format plus normalisé et sont mieux compréhensibles par l’ensemble de l’écosystème applicatif. L’utilisation d’un cadre commun permet également de mieux respecter les réglementations en vigueur, avec notamment des indices de confiance et une traçabilité complète des modifications. Grâce au référentiel commun, les données peuvent également être consolidées de manière fiable à destination de tous les métiers.
Cette notion de socle unifié apporte une meilleure compréhension entre les services et facilite la collaboration. Le partage d’éléments clés, mais aussi l’analyse de la performance s’améliorent : pour l’entreprise, cette initiative limite les pertes de temps et d’efficacité et clarifie la stratégie.

Le contrôle des flux et des besoins des applications

Dans des environnements applicatifs hétérogènes, il est nécessaire d’unifier les flux de données. Alors que le SI hérité (ou legacy), qui repose souvent sur d’anciens formats, rend la communication plus complexe, des dispositifs tels que l’Enterprise Service Bus (ou bus applicatif) permettent de distribuer intelligemment la donnée en utilisant un format commun pour le transport et un certain nombre de connecteurs métiers pour la distribution.
L’utilisation de logiciels de type ESB automatise les flux, réduit la dépendance entre applications et introduit de la souplesse dans la circulation de la donnée. Celle-ci est disponible plus rapidement pour les processus métiers.
Ainsi, de la conception à la mise sur le marché, c’est la chaîne de valeur entière qui est fiabilisée et accélérée. Le contrôle des flux structure tout le SI et exploite davantage le potentiel de l’architecture en place.

L’utilisation des données par les métiers au bon moment

Pour être performants, les processus métiers doivent disposer des bonnes données au bon moment. La cartographie de ces processus permet d’enchaîner intelligemment les flux de données, afin que chaque métier dispose d’informations rapidement exploitables lors de son intervention.
Les solutions de Business Process Management permettent de réaliser cette cartographie et d’identifier immédiatement les dysfonctionnements dans les workflows. La circulation de l’information est ainsi mieux anticipée et les nœuds sont évités.

Le partage des données avec les partenaires

Au cours de son cycle de vie, la donnée est également appelée à être échangée. Informations aux fournisseurs, distributeurs et autres partenaires commerciaux doivent circuler de manière maîtrisée et sécurisée. L’API — Interface de Programmation d’Application — constitue une interface entre l’entreprise et ses partenaires. Unifiant les accès et facilitant la gestion des droits, elle permet également de connaître les ressources consommées. Le partage de données est ainsi mieux maîtrisé : la collaboration avec les partenaires se fait plus fluide, tout en restant parfaitement sécurisée.

Les sources de données augmentent, le besoin de les exploiter est crucial

Dark Data et Data Lakes : ces données qui restent à exploiter

Dans un contexte de croissance intense des applications et appareils connectés, la donnée est collectée massivement, à tel point qu’il devient difficile — voire impossible — de l’exploiter immédiatement.

A l’image de la dark data — ensemble de documents, photos et autres fichiers collectés par les entreprises mais non exploités — ou des data lakes ­— données issues de la Big Data et stockées en masse pour être analysées —, une quantité importante de données est mise de côté, et parfois inutilisée. Ces informations peuvent pourtant constituer une aide à la décision et faire émerger un précieux avantage concurrentiel.

Le manque de ressources, et parfois de compréhension de leur utilité, explique le retard pris dans le traitement de ces données. Les entreprises conscientes de l’importance des données s’équipent cependant pour en tirer parti. Face aux situations de crise, les structures dites data driven sont d’ailleurs mieux armées grâce à une plus grande capacité d’anticipation.

De nouveaux profils apparaissent pour bien exploiter la donnée

Des profils spécialisés de gestionnaires et d’analystes de la donnée sont actuellement créés en nombre croissant, démontrant l’utilité d’exploiter la donnée. Du Data Owner — garant de leur stockage et de leur protection— au Data Analyst — capable de les traduire et les exploiter — en passant par le Data Steward — coordinateur de la collecte et responsable des méta-données —, les profils autour de la donnée se diversifient et permettent d’en traiter tous les aspects.
D’autre part, les projets de données et leur gouvernance nécessitent désormais un encadrement adapté. Qu’elles soient en transition digitale ou qu’elles cherchent à valoriser leur données, les entreprises font de plus en plus souvent appel à des spécialistes capables d’orchestrer le traitement de la donnée, à l’image du Chief Data Officer (CDO).

En conclusion

On le voit, les leviers sont nombreux pour valoriser la donnée et la traiter plus rapidement. Pour des projets de données réussis, l’essentiel est avant tout d’envisager toutes les facettes de la donnée et de mettre en place une architecture SI adaptée. Nombre d’entreprises font le choix d’une Architecture Orientée Services (SOA) pour instaurer une communication efficace et durable entre leurs composants logiciels. En améliorant chaque étape, de la communication inter-applicative à l’exploitation par des profils spécialistes, on couvre tous les aspects de l’urbanisation de la donnée. Les entreprises capables de mener cette réflexion jusqu’au bout disposeront d’atouts essentiels pour l’avenir de leur activité.

En lien avec ce contenu