web-dev-qa-db-fra.com

Différences dans les données de commerce électronique d'analyse

Bien que je pense que la plupart d’entre nous connaissent/ont rencontré des divergences entre GA et Google Ads ou d’autres plateformes, celle-ci m’a plutôt étonné.

Les rapports d'un nouveau client m'ont toujours semblé un peu inhabituels. Jusqu'à récemment, je ne pouvais pas comprendre pourquoi, mais j'ai toujours eu l'impression que les chiffres rapportés semblaient inexacts. Aujourd'hui, un collègue et moi avons découvert que le rapport identique (dans ce cas, un tableau de bord personnalisé dans lequel les données sont exécutées via un simple filtre logique pour la source et l'URL de la page) produisait des résultats très différents. En fait, nous avons remarqué au moins trois résultats différents sur une période de 10 minutes!

Nous avons confirmé que nos plages de dates, nos vues et nos segments étaient identiques, mais à un moment donné, les rapports ont même changé avec un simple rafraîchissement de la page. Il semble que cela ne se produise pas, mais nous l’avons remarqué dans les données nouvelles (mois précédent) et anciennes (il y a 9 mois). Cela me dit qu'il n'y a pas de problème avec les conversions de dernière minute.

Pensées sur ce qui pourrait être la cause? L'une de mes premières tâches dans mon nouveau rôle consiste à migrer les rapports de l'extraction manuelle vers GDS, mais je suis inquiet pour la validité de mes données si ces résultats peuvent changer autant.

1
Daniel Parscale

En fonction de la nature de votre "diversité", cela ressemble à un échantillonnage de données.

Les rapports standard ne sont pas échantillonnés, mais une fois que vous avez ajouté un segment (ou la plupart des dimensions secondaires), vos données sont extrapolées à partir d'un échantillon aléatoire de 500K sessions (sur le forfait gratuit; 100M si vous êtes sur 360). Cela peut avoir un effet profond sur les données de commerce électronique; Les actions à basse fréquence sont proportionnellement plus affectées par la collection spécifique de sessions qui en font l’échantillon.

Si l'échantillonnage est activé, le badge à côté du titre du rapport sera jaune au lieu de vert et, lorsque vous la survolerez, vous verrez "Ce rapport est basé sur X% des sessions" dans un panneau déroulant. (Vous devrez consulter un rapport à ce sujet; les tableaux de bord n'ont pas le badge.)

L'échantillonnage a lieu au moment de l'affichage du rapport, ce qui explique les écarts de données entre vous et votre collègue, et même entre les chargements de page.

J'ai récemment écrit une autre réponse expliquant échantillonnage et moyens de la réduire qui pourrait être utile si tel était en fait le problème.

1
Reve