[FOCUS DATA 2/4] Bad Data: the Origin !

data_seenaptic focus data

Résumé de notre premier article 

La data fait partie intégrante de votre stratégie. Vous l’exploitez, tout en sachant pertinemment qu’elle n’est pas fiable à 100%. Par data de mauvaise qualité, on entend notamment :

  • De nombreuses duplications
  • Des data erronées et / ou incomplètes
  • Des informations périmées.

Facteurs humains, organisationnels, techniques, technologiques… Dans ce second article de notre série [FOCUS DATA] , identifions les sources d’erreurs de votre data.

L’erreur est humaine … mais elle impacte votre data !

Le manque de précision dans la formulation des demandes et plus largement le manque de communication entre les équipes métier et IT aboutissent bien souvent à des erreurs de data. Les langages diffèrent entre les équipes marketing et IT. Prenons l’exemple de la segmentation. Cela signifie la segmentation RFM pour le pôle marketing mais la segmentation des univers produits pour l’IT.

Autre exemple, l’équipe marketing souhaite récupérer le prix produit dans le datalayer du site. L’équipe IT exécute la demande, et même si a pose du tag ne leur semble pas compliqué, son paramétrage reste cependant plus complexe. Toutefois l’équipe métier avait omis de préciser qu’elle parlait du prix HT hors frais de ports et ne s’en rend compte que plusieurs mois plus tard. C’est le prix TTC avec frais de port qui a été collecté. Conséquences, toutes les statistiques relatives au tunnel de commande sont erronées sur la période concernée et le chiffre d’affaires généré sur le web est surestimé.

Le management a aussi son rôle à jouer dans votre data !

Au sein même des organisations, le manque de sensibilisation des équipes autour de la Data Quality est un facteur aggravant. Et pour cause, comment leur demander de se conformer à tant de rigueur si on ne leur expose pas les enjeux que cela représente sur l’activité.

Ces organisations ont une incidence sur la qualité de votre data :

  • Une même marque dispose de plusieurs Business Units, toutes autonomes (ou au moins en partie) dans la gestion de leur data et des outils utilisés. Entreprendre une démarche de data gouvernance devient alors un véritable challenge tant sur le plan opérationnel qu’organisationnel.
  • Le fonctionnement des services en silos ne va pas dans le sens de la Data Quality car il exige une bonne communication entre les services et l’utilisation du même « jargon ». La Data est un sujet transversal qui implique la mobilisation de tous les pôles métiers et technique ainsi que la sensibilisation de la hiérarchie.

C’est pourquoi, nous voyons de plus en plus des postes de CDO (Chief Data Officer) se créer au sein des sociétés afin de gérer ces problématiques

De la collecte des données jusqu’à leur exploitation en passant par leur complétude … la data doit être l’affaire de tous et faire l’objet d’une stratégie globale au sein de l’entreprise.

Les causes techniques et technologiques.

90% des données collectées le sont au moyen de tags. Il arrive qu’ils soient :

  • Manquants : Ils ne sont plus présents sur les pages du site, après une mise en production par exemple.
  • Défaillants : suite à une mise à jour du tag par le fournisseur, le tag ne remonte plus d’informations une fois implémenté sur les pages du site.
  • Mal configurés : le tag est bien présent, se déclenche correctement mais toutefois ne remonte pas la bonne information.
  • A déclenchement tardif : des ressources ralentissement le chargement d’autres de ressources de la page (dont les tags). Résultat, l’action de l’internaute a été effectuée avant que le tag n’ait été déclenché sur la page et l’événement Analytics ne remontera pas dans Google Analytics.

Exemple, dans le cadre d’un test A/B, il est décidé d’apporter des modifications visuelles au bouton d’ajout au panier.

Cette modification effectuée par l’équipe technique n’a malheureusement pas repris l’événement en place au clic sur le bouton d’ajout au panier. Dans un premier temps, la moitié des fiches produit ne seront pas correctement trackées. Pire, si cette version s’avère plus efficace en termes de conversion et passe en production sur l’intégralité des fiches produits, alors l’event « add to cart » ne sera plus du tout tracké.

Le site internet vit dans un écosystème complexe et difficilement maîtrisable. Par ailleurs contrôler l’intégralité des pages du site avant chaque mise en production n’est humainement pas envisageable. Outre le caractère chronophage de la tâche, les équipes n’ont tout simplement pas assez de temps à consacrer à cette mission. Et quand bien même elles auraient le temps, impossible que ces vérifications soient exhaustives et couvrent tous les aspects nécessaires du site.

Autre incident pouvant survenir : La plateforme du prestataire est temporairement indisponible, dû à un problème réseau, un hack … De ce fait la data collectée et donc perdue. Les conséquences seront plus ou moins importantes selon la durée de l’anomalie.

Garbage in / garbage out :

Evolution du datalayer, mise à jour du plan de marquage, changement des paramètres de tags … Tout événement survenant dans le cadre du management de la data représente un risque potentiel pour sa qualité. Inutile de préciser que ces tâches nécessitent la plus grande des rigueurs et l’utilisation d’outils adaptés.

Retenez bien que, qu’importe le point de collecte de votre data (Tag, CRM …) si des data de mauvaise qualité entrent dans votre système, les décisions prises à partir de cette donnée donneront en sortie des résultats en deçà de vos attentes.

Le contrôle de la qualité de vos data est un indispensable pour une prise de décision pertinente !

CTA_Decouvrezseenaptic

< Retrouvez-nous au Salon DataMarketing les 20 et 21 Novembre
[FOCUS DATA 1/4] Oui votre data est sale ! >

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *