Collecter ses données de façon utile et responsable
DATA
Lorena Aguiar Franjoux
1/7/2026


Pourquoi la collecte n’est pas une formalité
Cet article s’inscrit dans un dossier Data & Impact qui rassemble plusieurs contenus pour utiliser ses données de façon plus responsable. Dans le dernier article, nous expliquons pourquoi et comment définir sa problématique afin de pouvoir mieux valoriser ses données. Si tu ne l’as pas encore lu, n’hésite pas à le découvrir en cliquant juste ici.
Une fois la problématique définie, il est temps d’identifier, choisir et organiser les données utiles. Mais attention : tout collecter « au cas où » peut vite devenir contre-productif. Cela consomme des ressources, complique les traitements, et peut nuire à la qualité globale de l’analyse.
Cartographier ses sources
La première étape consiste à savoir où se trouvent les données nécessaires et on commence par distinguer trois types de sources :
Type de source :
Interne : Données produites par l’organisation. Ex : Bases Excel, CRM, formulaires d’inscription, comptabilité
Partenaires : Données partagées dans le cadre de collaborations. Ex: Données échangées avec une ou une autre entreprise partenaire, fournisseur ou client
Externe: Données publiques ou commerciales. Ex : Open data, chiffres de l’INSEE, études de fondations
Ce recensement permet d’identifier les manques, doublons, incohérences ou points de vigilance.
Qualifier les données disponibles
Pour chaque source, il faut vérifier :
Le type de donnée (texte, numérique, date, etc.)
Le format (structuré ou libre)
La qualité : fraîcheur, fiabilité, cohérence
Le niveau de sensibilité (ex. : données personnelles)
Exemple : si une structure récupère les dates de naissance de ses adhérents, mais que certaines sont incomplètes (mois ou année manquante), cela peut fausser les statistiques d’âge.
Formaliser avec un Data Catalogue
Un Data Catalogue est un inventaire documenté des données disponibles. Il permet de :
Recenser les jeux de données utiles
Préciser leur structure (champs, unités, définitions)
Identifier le responsable de chaque donnée
Suivre leur statut (brut, nettoyé, validé)
Par exemple, dans une petite structure, ce catalogue peut être une simple feuille de calcul listant tous les fichiers utilisés avec leur fonction et la personne référente.
Penser le cycle de vie de la donnée
Une collecte responsable doit intégrer la durée de vie des données :
Fréquence de mise à jour (hebdomadaire, mensuelle, annuelle…)
Durée de conservation
Règles de suppression ou d’archivage
Flux de modification et historique
Cela facilite la maîtrise technique, l’optimisation du stockage et la conformité aux règles de protection des données.
Une collecte sobre et éthique
Trop de données, mal ciblées, peuvent :
Créer une surcharge pour les équipes
Alourdir les outils de travail
Nuire à la compréhension et la lisibilité des analyses
Remettre en cause la confiance des usagers
Exemple : un formulaire trop long pour s’inscrire à un atelier peut dissuader les participants et gêner le suivi de l’action.
Une collecte responsable, c’est une collecte :
Justifiée : on sait pourquoi on collecte
Limitée à l’essentiel : ce qui est utile, pas plus
Transparente : on informe sur l’usage prévu
Durable : facile à maintenir dans le temps
En résumé
Cartographier les sources
Identifier ce qu’on a, ce qui manque
Qualifier les données
Vérifier leur utilisabilité, fiabilité et cohérence
Créer un Data Catalogue
Documenter et organiser les données pour toute l’équipe
Gérer le cycle de vie
Maîtriser le temps de stockage et la fréquence d’accès
Adopter une collecte responsableAlléger les systèmes, renforcer la confiance et l’efficacité
La collecte est une étape technique, mais aussi politique : elle reflète les choix de l’organisation et sa vision de la donnée utile.

