web-dev-qa-db-fra.com

Séances de double comptage en GA?

Je vois une chose étrange dans mes données GA, où les conversions de trafic de référence sont en multiples de 3! Et dans certains des sites de référence, les numéros d'utilisateur sont exactement les mêmes que les sessions. Pas sûr si son naturel ou quelque chose ne va pas! Je vois aussi cela à partir de la source de courrier électronique . enter image description hereenter image description here

1
chicgirl

Cela ressemble aux effets de l'échantillonnage des données. Lorsque vous appliquez des segments ou ajoutez des dimensions secondaires (à quelques exceptions près dans ce dernier cas), GA utilise un échantillon aléatoire de 500 000 sessions (au niveau du compte gratuit) pour calculer les mesures. Comme il s'agit de en utilisant une fraction des données réelles et en multipliant les nombres par un facteur d'échelle, vous verrez des valeurs répétées. Je considère les valeurs répétées comme un bon rappel que je ne regarde pas les mesures exactes!

Par exemple, si votre taux d'échantillonnage était de 33% (ce qui signifie que les sessions de 500K représentaient 33% du total des sessions pour votre plage de dates dans cette vue), GA compterait le nombre de sessions sur ces 500K pour chaque référent, puis multipliez chaque valeur par 3 pour estimer l'ensemble. Ainsi, chaque valeur du rapport sera un multiple de 3. Si l'échantillon comprenait un nombre disproportionnellement élevé de sessions avec un certain référent par rapport à l'ensemble de données, le nombre échantillonné sera plus grand que le vrai, et il peut également sous-estimer.

Vous pouvez confirmer si vous voyez les effets de l'échantillonnage en vérifiant le badge à côté du titre du rapport. S'il est vert, il n'y a pas d'échantillonnage. S'il est jaune, l'échantillonnage (ou un autre avertissement) indiquera si vous survolez le badge et vous donnera le pourcentage de sessions utilisées pour estimer les données du rapport.

Voici le document de Google À propos de l'échantillonnage des données pour plus de détails sur le moment où l'échantillonnage est appliqué et ses effets.

La mise à niveau vers Google Analytics 360, si c'est une possibilité, résoudrait très probablement le problème - elle est toujours soumise à l'échantillonnage, mais l'échantillon est de 100 millions de sessions et ne prendra donc pas effet aussi souvent. De plus, les rapports standard sans segments appliqués ne seront pas échantillonnés, donc si vous pouvez accéder à l'une de vos données de cette manière, vous pouvez obtenir les vrais chiffres pour n'importe quelle plage de dates.

Si vous devez avoir des segments ou des dimensions secondaires pour voir les nombres corrects, la seule solution que je connaisse est d'exporter des données de plusieurs plages de dates plus courtes - suffisamment courtes pour qu'elles ne soient pas affectées par l'échantillonnage - et de les recomposer dans une feuille de calcul . Bien sûr, vous pouvez le faire manuellement en exportant au format CSV ou Excel, ou en utilisant Python, PHP ou Java, vous pouvez extraire les données via Core Reporting API .

Entre "totalement manuel" et "principalement automatisé", il y a le GA module complémentaire pour Google Sheets. Il utilise également l'API, mais vous n'avez pas besoin de connaître un langage de programmation à utiliser Si vous voulez essayer cela, vous aurez besoin des documentation complémentaire Google Analytics et Dimensions & Metrics Explorer pour obtenir les noms d'API des dimensions et des métriques .

Bien sûr, si une solution manuelle est pratique, ou si une solution programmatique vaut le temps et l'effort, cela dépendra de votre situation spécifique, mais ce sont les options que je connais!

1
Reve