CONTEXTE
En 2026, les équipes data ont industrialisé leurs pipelines. Pourtant, la gouvernance reste un projet à part, déconnecté des outils de transformation — résultat : documentation morte, qualité non garantie, traçabilité absente. C’est le constat dressé par Matthieu Augier (KPC) et Hicham Babahmed (dbt Labs) lors de leur webinaire commun du 26 mai 2026.
Qu’il s’agisse d’une PME avec des données éparpillées dans des fichiers Excel, ou d’un grand groupe avec un SI touffu et des définitions contradictoires entre divisions, le constat est identique : la confiance dans la donnée fait défaut. Les projets IA échouent faute de sémantique maîtrisée, les décisions stratégiques s’appuient sur des chiffres non réconciliés, et les exigences réglementaires (RGPD, Solvabilité II, PII) restent difficiles à adresser sans traçabilité.
Sur le terrain, les mêmes chantiers reviennent mission après mission : clarifier les rôles et responsabilités (data owner, data steward, data custodian), mettre en qualité de façon pragmatique, construire un catalogue vivant et adresser l’auditabilité réglementaire.
Chez KPC, la réponse à ces chantiers passe par la construction d’un Data Governance Office — une cellule dédiée qui articule rôles, acteurs, qualité, catalogage, lineage et conformité. Trois modèles d’organisation coexistent :
« L’idée, c’est de capitaliser la documentation une seule fois, de la partager à tous ceux qui produisent ou consomment la donnée, et de les rendre aussi autonomes que possible.«
Matthieu Augier – Directeur Data Gouvernance, KPC
Webinar KPC x dbt Labs
Dans chacun de ces modèles, les acteurs data — data owners, stewards, custodians, ingénieurs — portent des périmètres distincts, mais se heurtent au même point de friction : sans documentation partagée et vivante, chacun finit par reconstruire sa propre vérité. C’est précisément là que l’outillage de transformation change la donne.
DEMO LIVE
Concrètement, chaque pilier de gouvernance s’implémente avec les fonctionnalités natives de dbt Platform — sans outillage externe. La démonstration en direct l’a déroulé pilier par pilier.
Le DAG (Directed Acyclic Graph) dbt offre une cartographie visuelle complète : depuis les sources brutes jusqu’aux usages finaux (dashboards Power BI, Tableau, modèles IA). Dans un contexte multi-projets avec équipes centrale, finance et marketing, chaque équipe ne voit que les modèles publics — les modèles non déclarés publics sont automatiquement protected. Le lineage descend jusqu’à la colonne, permettant de savoir précisément comment chaque champ a évolué à travers les transformations.
« Un matin, votre dashboard n’affiche plus les données attendues. Avec dbt Catalog, vous revenez sur le modèle, vérifiez le statut de la dernière orchestration, le résultat des tests, et le lineage — sans solliciter le data engineer.«
Hicham Babahmed – Partner Solutions Architect, dbt Labs
Webinar KPC x dbt Labs
Définis dans les fichiers YAML du projet dbt, les data contracts s’exécutent avant même la création du modèle — ils bloquent la mise en production de toute donnée qui violerait le contrat (type de colonne incorrect, valeur hors plage, IBAN trop long…). La différence avec les data tests est structurelle : le contrat encadre ce qu’on décide en amont avec le métier ; le test vérifie ce qu’on observe en cours d’exécution.
Les data contracts sont mutualisables et réplicables : un contrat validé sur un objet peut être dupliqué et adapté à un objet similaire, accélérant la mise en qualité à l’échelle. C’est particulièrement puissant dans un modèle fédéré où plusieurs équipes alimentent la même data platform.
Dbt Catalog centralise descriptions, types, tests, statut d’orchestration et recommandations sur chaque modèle. La couche sémantique (semantic layer) permet de définir des KPI métier réutilisables par toutes les équipes — et interrogeables en langage naturel via les LLM connectés. Un rôle-based access control permet de maîtriser qui consomme la couche sémantique, notamment pour les usages coûteux en compute.
« De plus en plus, les profils métier viennent sur dbt Platform — pas pour coder, mais pour vérifier que la donnée qu’ils présenteront en réunion est bien la bonne.«
Hicham Babahmed – Partner Solutions Architect, dbt Labs
Webinar KPC x dbt Labs
POINT DE VUE KPC
Dans les missions KPC, l’apport de dbt se joue sur un point précis : la friction entre équipes data et métiers. Pendant des années, elle tenait à un déficit de communication : les exigences métier n’étaient pas formalisées, les données produites ne correspondaient pas aux attentes, et personne ne disposait d’un point de vérité commun.
Dbt joue alors un rôle de traducteur entre les deux mondes — c’est précisément ce que la plateforme vient débloquer. Les métiers peuvent écrire leurs requirements directement dans la plateforme, visualiser ce que les modèles produisent, et challenger les data engineers sur la qualité — sans intermédiaire. Les sachants ne sont plus sursollicités : ils documentent une fois, la plateforme répond en continu.
Autre bénéfice opérationnel souligné : dbt fonctionne en couche transverse sur plusieurs plateformes (Snowflake, Databricks, BigQuery, Redshift). Dans les entreprises qui ont adopté plusieurs clouds data, il unifie la gouvernance sans imposer une migration.
« Le Data Governance Office, c’est un système dans le système : il articule les rôles et les acteurs — techniques, métier ou hybrides : data owner, data steward, data custodian, data engineer. Et il aborde la qualité d’abord comme une affaire de process, pas seulement d’outils. »
Matthieu Augier – Directeur Data Gouvernance, KPC
Webinar KPC x dbt Labs
La gouvernance efficace ne vit pas dans un outil de catalogue déconnecté — elle vit dans les pipelines dbt eux-mêmes.
Lineage automatique + documentation intégrée + data contracts = les trois piliers pour des données traçables et de confiance, dès la production.
Les data contracts et les data tests sont complémentaires mais distincts : le contrat encadre ce qu'on décide avec le métier en amont ; le test observe ce qui se passe à l'exécution.
dbt s'adapte aux trois modèles d'organisation (centralisé, fédéré, décentralisé) — le plus fréquemment rencontré en contexte client reste le centralisé.
La plateforme dbt agit comme un pont entre métiers et data — les sachants documentent une fois, la plateforme répond en continu.