Oui votre data est sale

[FOCUS DATA 1/4] Oui votre data est sale !

Or du digital, carburant de votre marketing … on ne le dit que trop, la data est un des maillons de la transformation numérique des organisations. Sans elle, impossible de cerner parfaitement votre audience, de comprendre ce qui détériore l’expérience sur votre site, d’identifier les freins à l’achat de vos consommateurs … les exemples à citer sont tellement nombreux !

En face de la quantité de données collectées dans une approche de Big Data, se pose légitimement la question de leur qualité et la transition des entreprises vers une logique de Smart Data ! L’importance d’une data de qualité, c’est précisément l’axe de cette série de 4 billets dont les thèmes abordés seront :

  • Oui votre data est sale !
  • Bad data : The Origin
  • 8 critères pour une data de qualité
  • Pourquoi on fait tout ça ? les enjeux d’une data de qualité !

Oui vos données digitales sont sales !

Les équipes marketing exploitent des données erronées et en ont conscience. A l’occasion de notre premier livre blanc sur le thème du Tag Management, les chiffres ont révélé que pour 46% des équipes, l’exactitude des données collectées (et la fiabilité du plan de marquage) représentent une souffrance.

Dans cet article, nous allons parcourir les cas qui, s’ils surviennent fréquemment, doivent vous alerter quant à la qualité de vos données.

Les données absentes ont toujours tort

Imaginons un taux d’ajout au panier en baisse dans votre compte Google Analytics. Après investigation, vous comprenez que cela n’est pas la traduction d’un ralentissement de votre activité.

C’est en réalité le fruit d’une erreur sur votre site entraînant un événement Analytics d’ajout au panier qui ne se déclenche plus que sur une portion de fiches produits. Après avoir identifié l’origine du dysfonctionnement, il vous a fallu mettre en place les actions nécessaires afin que cela ne se reproduise plus. Vous avez non seulement perdu du temps mais aussi de l’argent.

Tout d’abord car votre productivité n’est pas optimum : vous allouez trop de temps aux correctifs plutôt qu’au déploiement de votre stratégie data. Ensuite, il arrive qu’un laps de temps plus ou moins long s’écoule entre le début d’un dysfonctionnement et le moment où il est détecté. Durant cette période, vous avez sans doute pris des décisions qui se sont avérées ne pas être pleinement rentables pour votre activité car basées sur des données erronées.

«Voir double n’est jamais bon »

Autre exemple ayant des répercussions sur la qualité de vos données : les doublons d’informations. A cause d’une erreur d’implémentation et/ou de communication entre les équipes métier et techniques, votre Tag Analytics est posé à deux reprises sur les pages de votre site.

Quelles en sont les conséquences ?

Les pages vues sont remontées en double dans l’outil tout comme les événements Analytics. En revanche le nombre de sessions lui ne remonte qu’une seule fois. Le taux de rebond est par conséquent de 0% et l’ensemble des analyses est donc faussé.

Quand il manque la moitié des infos.

Ne pas avoir toutes les données nécessaires restreint votre champ d’analyse.
Vous remontez vos ventes via votre tag Analytics. En revanche vous ne collectez l’ID des produits vendus. Du coup vous connaissez votre CA mais pas la ventilation des ventes par produits ni catégories.Difficile pour vous connaitre les produits qui se vendent le mieux et ceux qui se vendent moins bien, et impossible d’identifier des opportunités d’up ou cross selling.

Il est primordial en amont d’une collecte, d’en définir l’objectif. Cela vous aidera à lister précisément les informations.

Les données erronées, un caillou dans la chaussure.

Quoi de pire que des données absentes ? Des data erronées !

Le manque de détail sur la data à récupérer ou encore le vocabulaire propre à chaque métier font que des données erronées peuvent être collectées. Prenons le cas d’une équipe marketing qui souhaite récupérer des informations sur les cartes de fidélité. Faute de détail, l’équipe IT va collecter l’information « loyalty_card » avec pour réponse soit « Y » soit « N » alors qu’en réalité l’équipe marketing avait besoin du numéro de carte de fidélité soit « loyalty_card_ID ». Ne correspondant pas à la demande formulée initialement, la data sera donc inexploitable

Ce qu’il faut retenir :

Erronées, manquantes, dupliquées, obsolètes … si cette proportion de bad data représente une part trop importante de votre donnée, les conséquences sur vos stratégies marketing et commerciales seront inévitables ! Votre objectif est de mettre en place des outils de contrôles adaptés pour garantir la fiabilité et l’exactitude de vos données collectées.

Julie Dulot

Responsable Communication chez Netvigie et pour seenaptic
Maman d'une petite chipie
Runneuse, pâtissière à mes heures perdues, et adepte de lecture
Fan de Dirty Dancing et de Céline Dion (plaisir coupable)

Vous aimerez peut-être

L'intuition doit laisser place aux décisions data driven

Il est temps que vos intuitions laissent la place aux décisions Data Driven 

header blog12 BP collecte de données 750-500px

12 best practices pour collecter une donnée de qualité

4 erreurs majeures dans votre collecte de données

Data driven en 8 steps

Devenez Data Quality Driven en 7 steps

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *