Améliorer la gestion de sa TPE/PME avec ses données : comment faire ?

Dossier | Publié le 28 octobre 2022 | Mis à jour le 24 mai 2023

Mieux comprendre le fonctionnement de l’entreprise et pouvoir prendre de meilleures décisions, c’est ce que permet l’exploitation des données de votre activité. Comment mettre en place un tableau de bord pour améliorer le pilotage de l’activité de l’entreprise avec ses données ? Ce dossier, enrichi d’un cas d’usage, constitue un mode d’emploi adapté aux débutants.

Photo illustrative
Towfiqu barbhuiya / Unsplash

Toute entreprise produit des données dans le cadre de son fonctionnement. Mais moins d'un tiers des TPE et PME les stockent et les exploitent. Pourtant, ces données sont très utiles à exploiter. Elles contribuent à mieux connaître le client final, à analyser la structure des achats-ventes et à développer de nouveaux services. L’utilisation des données permet d'affiner la stratégie de l'entreprise et de prendre de meilleures décisions (on parle aussi d’informatique décisionnelle). Pour construire ces outils de pilotage, on peut utiliser différents types de solutions : des plus simples, comme les tableurs au plus complexes mobilisant des outils dédiés à des spécialistes  de la donnée (data scientist).

Les TPE et PME peuvent établir des tableaux de bord afin d’améliorer le pilotage de leur activité au quotidien sans disposer de compétences spécifiques en informatique ni recruter un expert de la donnée. Les outils de visualisation aident les professionnels à comprendre comment fonctionne l’entreprise. En facilitant l’identification de signaux faibles ils aident à déterminer les leviers de croissance ou les tendances émergentes.

Ce dossier conçu par Thomas Gerbaud, Activateur France Num, à la tête de l’entreprise AltGR, spécialisée en traitement et valorisation des données, explique concrètement comment piloter son entreprise avec ses données. Ce spécialiste présente les différentes étapes nécessaires à la mise en œuvre d’un tableau de bord : collecter les données, les traiter, les analyser pour enfin les exploiter.

Ce dossier est le second volet d'une série de 3 articles sur le pilotage de l'entreprise par la données.

Le premier dossier vise à vous aider à vous familiariser avec un certain nombre de notions utilisées ici : Comment tirer parti des données pour piloter son entreprise ?

Le troisième dossier entend vous faciliter le choix d'une solution adaptée : Piloter sa TPE / PME avec les données : quel type de solution choisir ?

Collecter, structurer et transformer les données : 3 étapes préalables à leur exploitation

La gestion des données de l’entreprise s’inscrit dans le « cycle de vie des données » qui désigne toutes les étapes par lesquelles une donnée va passer depuis sa collecte, création jusqu’à sa suppression. On parle de gestion des données (data management). Ces étapes sont essentielles afin de disposer de données de qualité en vue de construire un tableau de bord réellement utile.

Collecter et stocker les données

Pour un programme, ce qui n’est pas numérisé n’existe pas. Si on suppose habituellement que les données sont disponibles et accessibles, on constate souvent dans les faits que c’est loin d’être évident. Pourtant, c’est crucial. La première étape consiste donc à s’assurer que l’on dispose des informations nécessaires, qu’elles soient accessibles et à jour.

La collecte d’informations est issue de sources très variées. Pour les TPE/PME, il s’agit souvent de données :

Une fois récupérés, ces jeux de données doivent être sauvegardés dans un outil dédié ou, le plus souvent, sous forme de fichier de tableur dans un dossier partagé.

Structurer les données

Il s’agit d’une étape essentielle qui va permettre de s’assurer que le format des données est compatible avec les traitements que l’on veut effectuer par la suite. Les données doivent être présentées sous la forme de tableaux classiques, pour être facilement manipulées. En analyse de données, ce qui peut être affiché dans un tableur classique peut être facilement analysé.

Les bases de données relationnelles classiques (comme par exemple mySQL et les autres moteurs de base de données proposés par Oracle, IBM, Microsoft etc.) peuvent aussi être utilisées, afin de pouvoir injecter directement les données dans des outils de visualisation ou de traitement.

Transformer les données

Les données brutes sont rarement utilisées telles quelles par les programmes faute d’être suffisamment normalisées. Pour être traitées, les données doivent être “nettoyées” pour se conformer au format très précis attendu : suites de chiffres (numérique), longueur (fixe ou limitées), nombres en pourcentages, etc.

Ce travail de normalisation des données, en vue d’obtenir des formats homogénéisés, relève de l’ingénierie des données. Cette phase constituée d’opérations de transformations regroupées sous le nom de ETL pour extract, transform, load (c’est-à-dire “Extraire, Transformer, Charger”) peut être simple, si les données sont bien structurées en amont ou relativement lourdes pour les données non structurées, comme les textes libres.

Le fait d’homogénéiser et d’uniformiser les formats des données va permettre d’appliquer des traitements informatiques aux données, afin de les transformer :

  • l’extraction : pour ne garder que les données jugées utiles, comme le bon tableau,
  • le formatage : pour modifier le format qui sera accepté par les routines de traitement,  par exemple : transformer les valeurs d’une colonne en nombres, homogénéiser des chaînes de caractères, etc.
  • la normalisation pour adapter les formats à une norme, par colonne, en notant les indices sur 4 chiffres, ou les dates en JJ/MM/YYYY,
  • l’agrégation : pour regrouper ou compiler ensemble des données issues de différentes sources.
Exemples de traitements de transformations de données
Données brutes Données formatées Note sur le format
14 juin 1981 14/06/1981 JJ/MM/YYYY
14 juin 1981, 11h 37min 11s 1981-06-14T11:37:11+00:00 ISO 8601
“_18278 33 ” 1827833 nombre entier
“Jean Dupont” “Jean” et “Dupont” Chaînes de caractères séparées
“achat d’enveloppes” catégorie “03 - achat” catégorisation

Cette étape peut s’avérer fastidieuse. Elle nécessite l’utilisation d’outils de modification de formats. Certaines transformations peuvent être disponibles dans les tableurs sous forme de fonctions et nécessiter d’enchaîner plusieurs fonctions à la suite. D’autres modifications exigent de maîtriser des outils plus complexes, comme Visual Basic (VBA) ou des langages de scripts utilisés par les développeurs comme Python ou R.

Une fois ce travail d’unification et de normalisation réalisé, vous allez pouvoir démarrer l’exploitation des données de l’entreprise.

Exploiter ses données : les visualiser pour les analyser

L’analyse de données suppose de définir au préalable :

  1. Les informations qu’on veut visualiser : chiffre d’affaires, liste de ventes par magasin, top 10 des produits fabriqués sur le dernier trimestre, etc.
  2. Comment va-t-on extraire cette information : les données sont-elles disponibles directement (dans un tableau) ou dois-je faire un calcul pour les obtenir ?
  3. Comment représenter ces informations : elles seront plus lisibles si représentées sous forme de série temporelle (par exemple, pour de revenus perçus par jour), d’histogramme, de camembert… ?

Rien n’est évident. Voici les étapes principales.

Calculer des indicateurs

Calculer des indicateurs permet d’avoir une vision consolidée, dite “macroscopique”. Utile pour prendre du recul et observer les évolutions à long terme.

Les données “nettoyées” peuvent être affichées directement, afin de suivre les informations disponibles : ventes unitaires, actions des utilisateurs sur un site, opérations. Ces visualisations rendent possible un suivi très fin avec une vision détaillée de l’activité. C’est particulièrement utile si l’on veut mettre en place des indicateurs clés de performance (KPI).

La mise en place de ces indicateurs exige de calculer des valeurs agrégées telles que des sommes, des différences ou des divisions :

  • sommes par fenêtre temporelle ou période : par exemple, sélection et somme des chiffres d’affaires (CA) hebdomadaires en valeurs mensuelles ou trimestrielles,
  • sommes par catégorie : sélection et somme du CA par type de produit,
  • sommes multidimensionnelles : sommes mensuelles par catégorie de produit et par vendeur, pour un département donné,
  • sommes glissantes : sommes, pour chaque semaine, sur les trois dernières semaines,
  • évolution en pourcentage de valeurs par rapport à une période précédente : semaine, mois, trimestre…

Le plus souvent, on combinera ces opérations pour obtenir les indicateurs les plus pertinents.

Les données sont le reflet de l’activité de l’entreprise. Leur collecte est parfois perturbée : décalage de ventes, retard des fournisseurs, évènement majeur qui perturbe l’activité etc. On parle alors de bruit dans les données.

Pour avoir une vision globale juste et ne pas se perdre dans les détails, il est généralement recommandé de lisser les données à l’aide de moyennes glissantes ou d’interpolation. Ces transformations gomment les variations brutales et facilitent l’interprétation des visualisations. C’est d’ailleurs un premier pas vers la modélisation.

Visualiser les données

Une fois que les chiffres clés sont définis et calculés, on peut passer à l’étape de la visualisation. Il s’agit alors de déterminer ce que l’on veut afficher et sous quelle forme.

Pour construire la visualisation, on s’appuie sur une bibliothèque de modèles disponibles qui, une fois paramétrés, vont permettre d’afficher les informations de la façon choisie. Voici quelques modèles de graphes ou canevas classiques : série temporelle (indicateur en fonction du temps), histogrammes, camemberts, superposition de courbes, etc.

Les choix de mise en forme (couleurs, séparateurs, marqueurs…) sont essentiels à la lisibilité de la visualisation et donc à son utilité.

Valider les résultats

La validation des résultats consiste à s’assurer que ce qui est calculé et affiché est correct et robuste. En effet, les opérations décrites précédemment impliquent un grand nombre de manipulations des données. Des erreurs d’implémentation s’y sont sûrement glissées. On parle de bugs. La correction des bugs s’appelle « déverminage ».

Une technique efficace et pragmatique de validation consiste à vérifier vos calculs étape par étape, de façon à pouvoir valider chaque étape indépendamment des autres. En agissant ainsi, on identifie plus facilement les éventuelles erreurs.

Observer les résultats

Une fois les résultats affichés de manière satisfaisante, les informations ou indicateurs issus de calculs correctement effectués, il est temps de chausser ses lunettes d’analyste. Observez vos visualisations de données d’abord avec un œil critique (des erreurs peuvent avoir échappé à vos tests), puis avec un œil d’expert : ces données, vous les connaissez ! Alors, à vous d’en tirer vos propres analyses.

Ce travail d’analyse va permettre d’appréhender vos données différemment et de faire apparaître des signaux faibles pour identifier des corrélations fines ou cachées relatives au comportement des utilisateurs, de détecter des tendances.

La mise en œuvre d’opérations de classement et de segmentation multicritères aide à mettre en lumière des faits non identifiés jusqu’alors.

Si la mise en œuvre de ces opérations peut paraître difficile a priori, elles sont généralement à la portée d’une personne qui est un peu à l’aise avec des logiciels de type « tableur ».

Passons au cas pratique !

Cas d’usage : exemples de visualisations issues de données de ventes

L’analyse des données de vente est le cas d’usage le plus fréquent en pilotage par la donnée. Toutes les entreprises disposent de ces informations, généralement déjà accessibles dans un tableur.

Que trouve-t-on dedans ? Une suite de lignes, comportant les informations suivantes : “Mon entreprise a vendu, ce jour, ce(s) produit(s) à ce client, pour ce prix”. On peut raffiner en ajoutant des informations sur la TVA, les marges, les volumes ou des détails sur le client.

Ces données permettent de tirer divers enseignements :

  • chiffre d’affaires mensuel et trimestriel ;
  • cumuls mensuels, trimestriels, annuels ;
  • variations mensuelles, trimestrielles par rapport aux années précédentes ;
  • volumes de ventes : nombre, chiffre d'affaire cumulé ;
  • calcul de marge ;
  • produit ou services les plus vendus ;
  • prévisions de chiffre d’affaires trimestriel et en fin d’année.

La finesse temporelle (granularité) dépend de la méthode de collecte des données. Selon la précision avec laquelle les données de vente brutes sont récupérées, et selon les besoins, on peut obtenir une visualisation plus ou moins détaillée. Les données de vente sont souvent horodatées avec une précision qui varie habituellement de la minute (exemple : commerce en ligne) à la journée (ventes au détail dans un magasin).

Voici quelques exemples de visualisations liées aux données de ventes destinées à faciliter l’analyse des différents aspects des ventes d’une entreprise.

Les données brutes sont en bleu. La courbe orange calcule une moyenne glissante sur 3 mois, et permet de lisser les variations mensuelles.

Évolution temporelle du chiffre d’affaires mensuel
Évolution temporelle du chiffre d’affaires mensuel - retrodata.io

Les données historiques sont en orange, les projections futures en rouge.

Le pic en mai 2021 peut expliquer la compensation de la projection en juillet 2021. Cette visualisation permet de suivre l’évolution temporelle du CA.

Données identiques, avec projection (juillet à décembre 2021)
Données identiques, avec projection (juillet à décembre 2021) - retrodata.io

Les données historiques sont dans les barres pleines orange et rouge. Les projections futures dans les barres creuses et rouges.

Cette visualisation permet de comparer les mois d’une année à l’autre.

Données identiques, avec représentation en histogramme
Données identiques, avec représentation en histogramme - retrodata.io

Répartition du nombre de produits par vente, sur une période donnée.

Cette visualisation permet de quantifier le nombre d’articles par paniers.

Répartition des ventes multiproduits - retrodata.io

Les ventes avec un ou deux produits différents ont généré un chiffre d’affaires autour de 40.000 euros sur la période.

Cette visualisation permet de quantifier le chiffre d’affaires par paniers.

Répartition du chiffre d’affaires en fonction du nombre de produits par vente
Répartition du chiffre d’affaires en fonction du nombre de produits par vente - retrodata.io

Ce dossier permet d'appréhender l'ensemble des étapes nécessaires pour construire un tableau de bord afin de piloter l'activité de son entreprise avec les données.

Pour construire ces outils de pilotage, on peut utiliser différents types de solutions : des applications simples, basées sur l’utilisation d’un tableur jusqu'à des applications très complexes mobilisant des outils dédiés à des spécialistes  de la donnée (data scientist).

Passons à la pratique avec le dossier Piloter sa TPE / PME avec les données : quel type de solution choisir ?

Trouvez un expert du numérique spécialisé en gestion, traitement et analyse des données

Les Activateurs France Num sont des experts du numérique, publics ou privés, qui se sont référencés auprès de France Num et se sont engagés à réaliser un premier entretien gratuit.

Rechercher un expert

Thomas Gerbaud | Tous droits réservés

Dans la même thématique

Cette page vous a-t-elle été utile ?

Suivez-nous sur les réseaux sociaux et Abonnez-vous à notre lettre d’information