web-dev-qa-db-fra.com

Pourquoi StatCounter affiche-t-il moins de visiteurs uniques que mon journal d'accès Apache?

StatCounter montre hier avoir vu 10 611 visiteurs uniques sur mon site.

J'ai écrit un script qui comptait le nombre d'adresses IP uniques dans le journal des accès Apache d'hier. Il comptait 14 190 adresses IP uniques.

Pourquoi y a-t-il une différence? Je comprendrais qu'un petit nombre d'adresses IP serait peut-être destiné aux robots d'exploration et aux robots, mais pas au tiers du trafic.

// script to count unique IPs

<?php
$ips = array();

$file = fopen("access_log","r");
while ( ($line = fgets($file)) != false )
{
    $num = strpos($line, " ");
    $ip =  substr($line, 0, $num)."<br>";

    if ( !in_array($ip, $ips) )
        array_Push($ips, $ip);
}
fclose($file);

echo count($ips);

Le code StatCounter est le code standard que StatCounter vous donne à insérer dans votre code HTML/JS, qui comprend votre numéro de compte, etc.

1
Jake Wilson

Explication initiale de la différence entre les statistiques côté serveur et les statistiques en ligne au profit des autres utilisateurs:

Le journal des accès Apache analyse tout le trafic vers votre serveur.

StatCounter suit toutes les visites sur votre site.

Votre serveur génère beaucoup plus du trafic que votre site, car le trafic du serveur inclut toutes les visites de robots, spambots, robots d'exploration, etc.

Lorsqu'un robot visite votre site, cela est enregistré dans les journaux de votre serveur. Ce n'est pas une visite "vraie" car la page n'est pas entièrement chargée, elle ne s'affiche donc pas sur StatCounter.

Ainsi, les statistiques côté serveur (par exemple, les fichiers journaux Apache) apparaîtront toujours gonflées par rapport aux statistiques en ligne (telles que StatCounter). Généralement, ce sont les statistiques en ligne, les visites "vraies" qui intéressent les gens - ce sont ces visites qui pourraient signifier plus de ventes, plus d'inscriptions, etc. Cependant, les fichiers journaux Apache sont évidemment très utiles d'un point de vue plus technique et pour serveur. administration. Si vous excluez les hits de robots et de robots d'exploration de votre journal Apache, alors ce qu'il vous reste devrait refléter approximativement les numéros de StatCounter.


Maintenant, en ce qui concerne votre cas spécifique, selon notre expérience, 30% de trafic supplémentaire généré par des robots et des robots n'est pas inhabituel.

Je devrais également ajouter que les visiteurs uniques dans les statistiques récapitulatives de StatCounter sont basés sur des cookies (plutôt que sur des adresses IP), ce qui explique également une partie de la différence.

Les visiteurs AOL peuvent avoir une adresse IP différente à chaque chargement de page - de sorte que les utilisateurs uniques basés sur IP obtiennent un niveau supérieur avec chaque chargement de page. OR les utilisateurs qui refusent les cookies vont conduire les uniques basés sur les cookies plus haut avec chaque chargement de page.

Dans StatCounter, les chemins des visiteurs sont assemblés à l'aide d'adresses IP, ce qui permet une comparaison plus précise. Laissez-nous un mot si nous pouvons aider davantage.

4

Compter le nombre d'adresses IP uniques n'est probablement pas la meilleure approche, car cela inclut les robots qui frappent votre serveur à partir de plusieurs adresses IP différentes au cours de la journée.

  1. J'utilise awstats sur mon serveur, car il fait clairement la différence entre les robots et les utilisateurs réels. Vous avez donc une bonne idée du trafic.
  2. En fait, utiliser awstats seul peut ne pas donner une image claire, il est toujours préférable d'utiliser Google Analytics ou StatCounter, qui permet de suivre les utilisateurs à l'aide de javascript. awstats s'appuie uniquement sur une adresse IP unique pour identifier des utilisateurs uniques MAIS la plupart des bureaux où travaillent des centaines de personnes n'ont qu'une adresse IP sortante. Par conséquent, les outils de suivi basés sur javascript tels que statcounter ou Google Analytics sont plus fiables car ils identifient un utilisateur unique à l'aide d'un cookie. sur le navigateur de l'utilisateur.
  3. En fait, j'utilise les trois awstats, statcounter et google analytics, chacun fournissant des aspects intéressants sur différentes choses. Le chargement de la page n’est pas un problème pour moi, j’ai quand même inclus du code javascript permettant d’être viré comme un fichier JS distinct et non intégré au code HTML, ce qui garantit sa mise en cache côté client.
1
Deepesh Nandal

plusieurs raisons peuvent causer cette disparité, par exemple:

  1. vous utilisez un compteur côté serveur qui compte chaque accès immédiatement. statcounter utilise javascript qui compte l’accès après le chargement de la page. donc, certains accès peuvent être comptés par votre script mais pas avec statcounter
  2. quel est le type de votre site web? J'ai eu cette expérience dans les forums et les blogs qui ont été créés par des applications populaires comme phpBB et Drupal
  3. où mettez-vous votre script et où statcounter? Êtes-vous sûr que les deux comptent les mêmes pages?
  4. ...
1