Retour

24

Avr 2024

  • Divers

Comment choisir son outil data management ?

Article écrit par Belkacem BERRAHAL, Senior Consultant, Thierry Sanson, Associé, et Yi-Ying Lu, Senior Consultant.

 

Etat des lieux

Entre la panoplie des outils proposés sur le marché et souvent la surenchère de certains éditeurs, il peut être compliqué de savoir où, comment et ce qu’il faut chercher pour sélectionner une solution de data management. En nous basant sur nos expertises ainsi que les références identifiées par Gartner, nous proposons d’explorer dans cet article les critères essentiels pour choisir son outil de data management. Nous observons aujourd’hui la tendance des entreprises à adopter une seule plateforme pour automatiser et unifier les besoins en gouvernance et analyse des données.

 

Les fonctionnalités à prendre en compte pour choisir son outil de data management

A travers notre expérience, nous pouvons résumer les fonctionnalités les plus demandées pour un outil de data management sous les 4 rubriques suivantes :

 

Notre sélection d’outils de data management

Notre sélection porte sur les 4 solutions suivantes issues du Magic Quadrant de Gartner (2022) : Informatica, IBM et SAP sont considérées comme les leaders du marché, tandis que Collibra est parmi les visionnaires en constante évolution depuis quelques années.

 

 

1) Informatica : L’outil en tête de liste sur le marché

Les fonctionnalités de l’outil Informatica

Informatica inclut quasiment toute la gamme des fonctionnalités de data management (liste non-exhaustive) :

  • La gestion des accès, gestion des tâches, interface utilisateur, gestion du flux de travail, organisation, modèles de rôle, ….
  • Gestion des modèles, classement des données, les métadonnées actives, ….
  • Le glossaire métier, dictionnaire de données, sécurité, lignage des données, analyse d’impact, …
  • Connectivité, catalogue de données, gestion des règles, …

 

Ces fonctionnalités sont regroupées en une variété de modules sur la plateforme « Intelligent Master Data Management Cloud (IDMC) ». On y retrouve : Data Governance and Catalog Cloud, Data Quality Cloud, Data Marketplace Cloud, Data Integration et Data Masking. Par ailleurs, le moteur d’Intelligence Artificielle (IA) « CLAIRE », basé sur les métadonnées, permet l’automatisation de tous ces services disponibles sur la plateforme IDMC.

 

La data gouvernance avec l’outil Informatica

Informatica prend en charge l’intégralité du cycle de vie des données. Les équipes métiers peuvent capturer les définitions des politiques de gouvernance et les hiérarchies directement dans les outils de gouvernance et les associer aux définitions du glossaire, aux processus métier ainsi qu’au paysage des données.

En outre, cette gouvernance des données fournit un aperçu des domaines applicables. En combinaison avec la confidentialité et la qualité des données, elle permet de mettre en évidence les risques et les domaines d’intervention prioritaires. Les utilisateurs établissent des normes de qualité pour les données et les entités clés qui peuvent être automatiquement auditées et appliquées tout au long du cycle de vie de la gestion des données.

 

Nos convictions sur l’outil Informatica

Informatica offre une vaste gamme de fonctionnalités de gouvernance des données, intégrant différentes fonctionnalités telles que la gestion des accès et des tâches, le glossaire métier et l’automatisation des tâches via le moteur d’IA « CLAIRE ». Elle prend en charge le cycle de vie complet des données, permettant une gouvernance détaillée. Cependant, son large éventail de fonctionnalités peut nécessiter un long parcours d’apprentissage pour les utilisateurs et sa complexité peut engendrer des coûts de gestion et de maintenance élevés.

 

2)      IBM : Une gestion optimale des règles de confidentialité des données

Les fonctionnalités de l’outil IBM

IBM propose une gamme variée des produits en data management sur une architecture « data fabric » permettant une intégration automatisée, comprenant les fonctionnalités suivantes :

  • Un catalogue de données enrichi par des règles d’IA permettant aux utilisateurs d’accéder aux données applicables et de les enrichir de manière collaborative
  • Une gouvernance des métadonnées (MDM) active pour toutes catégories de données, d’analyse et de workflows permettant d’augmenter la visibilité et faciliter la collaboration sur n’importe quel cloud
  • Un outil de gouvernance des workflows d’IA permettant de créer et gérer des règles ainsi que leurs cycles de vie de manière responsable et transparente
  • Des règles de Data Quality réutilisables pour optimiser la maintenance nécessaire à la surveillance de ces règles. Ceci est réalisé en définissant une règle basée sur une classe de données ou un terme métier qui peut être appliquée partout où la classe ou le terme métier est associé
  • Anonymisation des données pour se conformer aux réglementations liées à la confidentialité, tout en préservant l’intégrité des données
  • Possibilité de masquer les données de manière dynamique et cohérente à un niveau granulaire définit par l’utilisateur

 

IBM déploie ces fonctionnalités à travers les modules, tels que IBM Cloud Pak for Data, Information Server, Watson Knowledge Catalog SaaS, Optim Data Privacy Solution, et Knowledge Accelerators (KA) – Modèles métiers.

 

La data gouvernance avec l’outil IBM

Les fonctionnalités de gouvernance des données sont tirées du Watson Knowledge Catalog et de son écosystème. Dans ce module, l’utilisateur peut créer des règles de confidentialité pour spécifier quelles données doivent être contrôlées, qui peut accéder aux données et comment elles doivent être contrôlées. Les règles de confidentialité peuvent inclure des conditions permettant d’identifier les objets structurés et les utilisateurs ou groupes d’utilisateurs applicables, ainsi que l’action requise lorsque les conditions sont remplies.

Ces règles de confidentialité sont appliquées automatiquement et dynamiquement lorsqu’un utilisateur tente d’afficher ou de modifier une ressource de données dans un catalogue géré afin d’empêcher les utilisateurs non autorisés d’accéder aux données sensibles.

 

Nos convictions sur l’outil IBM

Les solutions d’IBM permettent une meilleure compréhension et collaboration dans la création et la maintenance du data catalogue, une gouvernance de métadonnée (MDM) active pour une visibilité accrue au sein de l’organisation et une gestion dynamique des risques sur la confidentialité et la conformité des données. Cependant, les règles de confidentialité peuvent nécessiter une configuration initiale complexe et la mise en œuvre automatique peut exiger une surveillance continue pour garantir la sécurité des données.

 

3) SAP : La flexibilité grâce à une organisation par modules 

Les fonctionnalités de l’outil SAP 

SAP propose des solutions modulaires de data management qui s’inscrivent dans le cycle de vie de l’utilisation des données métiers. Il offre notamment une vue unifiée et fiable des données, une gouvernance centralisée des métadonnées avec l’automatisation de l’archivage et la rétention, ainsi qu’une intégration simple avec le progiciel SAP. 

Les modules SAP sont disponibles individuellement ou par lot et peuvent interagir entre eux. On y trouve : SAP Data Intelligence Cloud, SAP Master Data Governance (édition cloud), SAP HANA Cloud, SAP Datasphere, SAP Analytics Cloud, SAP Information Steward, SAP Data Services. 

Le module SAP Information Steward permet de découvrir, évaluer, définir et surveiller la vue globale du concept métier et de tous les objets physiques et règles de Data Quality avec lesquels il est associé. Il permet aussi d’améliorer la qualité des données de l’entreprise. 

Le module SAP PowerDesigner est une solution graphique d’architecture et de conception d’entreprise prenant en charge des méthodologies et des notations standard et fournissant une ingénierie inverse avec une génération automatisée de code via des modèles personnalisables. 

Par ailleurs, SAP PowerDesigner fournit aussi des fonctionnalités de reporting et propose une solution de référentiel évolutive avec des fonctionnalités de sécurité et de gestion des versions pour faciliter le développement multi-utilisateur. Il est aussi utilisé comme intégrateur de métadonnées avec SAP Information Steward. 

Enfin, les modules SAP Data Services et SAP Data Intelligence Cloud peuvent également exposer des règles sous forme de services Web à utiliser dans des applications externes. 

 

La data gouvernance avec l’outil SAP

L’approche de gouvernance des données de SAP est exploitée par une combinaison de fonctionnalités de SAP Data Intelligence Cloud, SAP Information Steward et SAP PowerDesigner. SAP Data Intelligence Cloud offre les fonctionnalités de métadonnées telles que le catalogage, la recherche, le traçage, les contrôles de Data Quality, la détection des informations personnelles et la journalisation des accès aux données pour l’audit. Ces capacités de métadonnées actives permettent la découverte de données et de métadonnées pour piloter des moteurs de recommandation et de règles sémantique, y compris le glossaire métier dans le catalogue de données. 

 

Nos convictions sur l’outil SAP 

SAP propose une gamme variée de modules offrant des fonctionnalités spécifiques et indépendantes et une intégration simple avec le progiciel SAP. Cependant, la gestion des différents modules peut être complexe et nécessiter une expertise approfondie, tandis que la configuration et l’intégration de multiples modules peuvent poser des défis de mise en œuvre et de maintenance. 

 

 

4) Collibra Data Intelligence Cloud : Spécialiste de la conformité réglementaire 

Historiquement, Collibra s’est d’abord spécialisée dans le contrôle de la donnée avec pour objectif premier sa mise en conformité au cadre réglementaire en ciblant tous les acteurs : les entreprises (avec les normes comptables IFRS, RGPD), les banques (avec BCBS 239, Bâle III, CRR) et les sociétés d’assurances (Solvabilité II). 

Depuis quelques années, Collibra s’est positionné sur l’enjeu de la valorisation des données. Pour devenir en quelque sorte un portail d’accès permettant aux data analysts et autres data scientists de disposer d’un catalogue qui donne du sens aux données. 

 

Les fonctionnalités de l’outil Collibra 

La plateforme dispose pour cela d’une panoplie de fonctionnalités : un glossaire professionnel, un dictionnaire de données, un gestionnaire des règles et modèles algorithmiques, des cartes de lignage, des tableaux de bord avec des indicateurs de performance (KPIs) et rapports, des workflows de transformation de la data et des connecteurs pour l’intégration au système d’information. 

Au-delà de la plateforme proprement dite, Collibra propose différents modules. On retrouve tout d’abord Collibra Data Governance Center (DGC), une brique de gouvernance des données. Ensuite, Collibra Connect relie la plateforme à différentes sources de données, aux applications métier, ERP et autres CRM. Quant à Collibra On-the-Go, il permet aux gestionnaires de données et aux utilisateurs d’accéder à la plateforme sur PC ou en situation de mobilité (sur terminaux iOS, Android). Un autre module est dédié à la gestion de la confidentialité. Il gère la conformité avec le RGPD afin de répondre aux droits des personnes (droit d’accès, droit d’opposition, …). 

A noter que Collibra a récemment noué un partenariat avec Tableau. Son intégration à ce dernier permet de lire les métadonnées directement depuis le logiciel de data visualisation. 

 

Nos convictions sur l’outil Collibra 

Collibra est caractérisé par sa spécialisation dans le contrôle des données pour garantir la conformité réglementaire avec des normes telles que IFRS, RGPD et autres. Il évolue vers la valorisation des données en fournissant un portail d’accès et un catalogue de données pour les analystes et les data scientists. Cependant, certaines fonctionnalités en data gouvernance restent encore à enrichir, telles que le profilage des données, la gestion des flux de données, l’automatisation à l’aide de l’IA et Machine-Learning. 

 

 

Conclusion et recommandations 

Nous constatons que pour répondre aux exigences du marché, de plus en plus d’éditeurs intègrent dans leurs offres des capacités technologiques pertinentes prenant en charge plusieurs fonctionnalités présentées par module. Par exemple : la sécurité des données et la confidentialité des données, la conservation des enregistrements et l’historisation des données. Il en résulte que certaines fonctionnalités sont parfois redondantes. Impliquant dans ce cas les organisations clientes à payer plusieurs fois ces fonctionnalités similaires, ou même à l’achat de modules complets alors que seules quelques sous-fonctions sont utilisées. 

Par ailleurs, certaines fonctionnalités peuvent porter des terminologies similaires mais sans signifier la même chose. Par exemple, la classification des données dans une implémentation de sécurité des données serait très différente d’une classification des données dans une implémentation de gestion des données de référence (MDM). 

Face à ces constats, nous recommandons de commencer par élaborer une liste de fonctionnalités explicites, basée sur des exigences spécifiques et avec la participation active des utilisateurs finaux. Cette liste servira de référence pour sélectionner les fournisseurs et évaluer leurs offres via des tests pilotes. Ensuite, il est conseillé de pondérer les besoins en fonction de critères prioritaires tels que la qualité, la sécurité et la confidentialité des données. En adoptant une approche méthodique de cette manière, les organisations pourront évaluer et sélectionner les solutions les mieux adaptées à leurs besoins spécifiques. 

 

 

Envie d’en savoir plus sur Périclès Group ?

Spécialisé dans les domaines de la Banque, de la Finance, de l’Assurance et de la Protection Sociale, notre Cabinet place l’expertise au cœur de son savoir-faire. Nos équipes interviennent à la fois sur les phases stratégiques, organisationnelles, de mise en œuvre et s’adaptent aux spécificités de chaque projet. Nos antennes françaises, luxembourgeoises et anglaises seront ravies d’échanger avec vous autour de vos besoins en assurance, finance et actuariat. Pour nous contacter, cliquez ici.

Partagez cet article : twitter

navigation

Pour partager cette fiche, entrez une adresse mail valide :

Envoyer