web-dev-qa-db-fra.com

Les 200 facteurs de classement de Google

Lorsque vous faites des recherches sur le référencement, vous êtes probablement tombé par hasard sur la déclaration de Google, il y a environ 200 facteurs de classement. Je pense que ce serait bien d’avoir une liste de tous ces 200 facteurs.

Est-ce que quelqu'un sait si Google a déjà publié tous les facteurs de classement? Et si oui, où peuvent-ils être trouvés?

17
Goboozo

Il existe une grande synthèse des facteurs, et à quel point on pense qu'ils sont importants, chez SEOMoz

http://www.seomoz.org/article/search-ranking-factors#ranking-factors

Facteurs de classement sur la page (par mot clé)

  • Utilisation de mots clés n'importe où dans la balise de titre
  • Mot clé utilisé comme premier mot de la balise de titre
  • Utilisation de mots clés dans le nom de domaine racine (par exemple, mot clé.com)
  • Utilisation de mots clés n'importe où dans la balise de titre H1
  • Utilisation de mots clés dans le texte d'ancrage de lien interne sur la page
  • Utilisation de mots clés dans un texte d'ancrage de lien externe sur la page
  • Mot clé utilisé en tant que premier (s) mot (s) dans la balise H1
  • Utilisation de mots clés dans les premiers 50 à 100 mots en HTML sur la page
  • Utilisation de mots-clés dans le nom du sous-domaine (par exemple, mot-clé.seomoz.org)
  • Mot-clé utilisé dans l'URL du nom de la page (par exemple, seomoz.org/folder/keyword.html)
  • Mot-clé utilisé dans l'URL du dossier de page (par exemple, seomoz.org/keyword/page.html)
  • Utilisation de mots clés dans d'autres balises de titre (-)
  • Utilisation de mots clés dans le texte alternatif de l'image
  • Utilisation de mots clés/nombre de répétitions dans le texte HTML de la page
  • Utilisation de mots clés dans les noms d'images inclus sur la page (par exemple, mot clé.jpg)
  • Utilisation de mots clés dans ou balises
  • Formule de densité des mots clés (nombre d'utilisations de mots clés # nombre total de termes sur la page)
  • Utilisation de mots clés dans les éléments de liste
  • sur la page
  • Utilisation de mots clés dans les paramètres de requête de la page (par exemple, seomoz.org/page.html?keyword)
  • Utilisation de mots clés dans ou balises
  • Utilisation de mots clés dans la balise Meta Description
  • Utilisation de mots clés dans l’extension de fichier de la page (par exemple, seomoz.org/page.keyword)
  • Utilisation de mots-clés dans les balises de commentaire dans le code HTML
  • Utilisation de mots clés dans la balise Meta Keywords

Facteurs de classement sur la page (sans mot-clé)

  • Existence d'un contenu unique et substantiel sur la page
  • Récence (fraîcheur) de la création de page
  • Utilisation de liens sur la page qui pointent vers d'autres URL sur ce domaine
  • Modifications du contenu historique (fréquence à laquelle le contenu de la page a été mis à jour)
  • Utilisation de liens de pointage externes sur la page
  • Paramètres de requête au format URL vs Static URL
  • Ratio du code au texte en HTML
  • Existence d'une balise Meta Description
  • Validation HTML selon les normes W3C
  • Utilisation de Flash Elements (ou autre contenu de plug-in)
  • Utilisation de la publicité sur la page
  • Utilisation de Google AdSense (spécifiquement) sur la page

Facteurs de classement de popularité de lien par page

  • Texte d'ancrage axé sur les mots clés provenant de liens externes
  • Popularité des liens externes (quantité/qualité des liens externes)
  • Diversité des sources de liens (liens de nombreux domaines racine uniques)
  • TrustRank spécifique à la page (si la page individuelle contient des liens générés par des sources fiables)
  • Popularité globale des liens basée sur un algorithme itératif (PageRank)
  • Thème Spécificité/Objet des sources de liens externes (que les liens externes vers cette page proviennent de pages ou de sites d'actualité)
  • Texte d'ancrage axé sur les mots clés provenant de liens internes
  • Emplacement dans l'architecture d'information du site (l'emplacement de la page par rapport à la hiérarchie structurelle du site)
  • Popularité des liens internes (en comptant uniquement les liens des autres pages du domaine racine)
  • Quantité et qualité des liens Nofollowed à la page
  • Pourcentage de liens suivis ou non suivis qui pointent vers la page
24
adam

Eric Schmidt, de Google, a déclaré qu'énumérer les facteurs de classement de 200 pages de Google révélerait des secrets commerciaux. Bien que Google ne publie pas officiellement leurs algorithmes de classement, les utilisateurs de WebmasterWorld ont compilé une liste assez complète.

Domaine

  • Âge du domaine
  • Histoire du domaine
  • KWs dans le nom de domaine
  • Sous domaine ou domaine racine?
  • TLD du domaine
  • Adresse IP du domaine
  • Emplacement de l'adresse IP/du serveur

Architecture

  • Structure HTML
  • Utilisation des balises d'en-tête
  • Chemin de l'URL
  • Utilisation de fichiers CSS/JS externes

Contenu

  • Densité de mots clés de la page
  • Mot-clé dans la balise de titre
  • Mot-clé dans Meta Description (mots-clés non Meta)
  • Mot clé en KW dans les balises d'en-tête (H1, H2, etc.)
  • Mot clé dans le corps du texte
  • Fraîcheur du contenu

Par lien entrant

  • Qualité du site Web liant dans
  • Qualité de la page Web reliant dedans
  • Age du site web
  • Âge de la page Web
  • Pertinence du contenu de la page
  • Emplacement du lien (pied de page, navigation, corps du texte)
  • Texte d'ancrage si lien
  • Attribut de titre du lien
  • Balise Alt des images reliant
  • Domaine TLD spécifique à un pays
  • Autorité TLD (.edu, .gov)
  • Emplacement du serveur
  • Lien d'autorité (CNN, BBC, etc.)

Cluster of Links - Unicité d'adresse de classe C.

Liaison croisée interne

  • Nombre de liens internes à la page
  • Emplacement du lien sur la page
  • Texte d'ancrage du lien textuel FIRST (le point de Bruce Clay à PubCon)

Pénalités

  • Over Optimisation
  • Liens d'achat
  • Liens de vente
  • Commentaire spam
  • Cloaking
  • Texte caché
  • Dupliquer le contenu
  • Remplissage de mot-clé
  • Pénalités manuelles
  • Effet Sandbox (probablement identique à l'âge du domaine)

Divers

  • Liens JavaScript
  • Aucun lien de suivi

En attendant

  • Performance/Charge d'un site web
  • Vitesse de JS

Idées fausses

  • Sitemap XML (aide le robot d'exploration mais n'aide pas les classements)
  • PageRank (indicateur général de la performance de la page)
8
Brian McCarthy

Beaucoup de bonnes réponses ci-dessus mais, comme les temps changent, il est donc important de suivre les signaux de classement utilisés par Google. Certains signaux sont dévalorisés, d'autres signaux augmentent et d'autres encore sont ajoutés ou supprimés.

Voici une liste de novembre 2016 qui a été compilée via des sources de référencement, des informations Google, etc. Certaines ont fait leurs preuves, certaines sont controversées, d'autres sont des spéculations ...

  1. Nom de domaine
    confirmé
    Matt Cutts de Google est devenu public, ce qui implique que l'âge du domaine, même s'il ne s'agit pas d'un signal très important, est utilisé dans une certaine mesure par Google.
    http://www.youtube.com/watch?v=-pnpg00FWJY&feature=player_embedded

  2. Apparence du mot clé du domaine de niveau supérieur
    Non vérifié
    Cela ne donne pas autant de dynamisme qu'auparavant, mais le mot-clé principal de votre site dans le nom de domaine peut néanmoins agir dans une certaine mesure comme un signal de pertinence. Ceci est encore renforcé par le fait que Google applique toujours des caractères gras aux mots clés qui apparaissent dans le nom de domaine.

  3. Mot-clé en tant que premier mot du domaine
    Non vérifié
    Un domaine qui commence par son mot clé principal peut avoir un rang supérieur à celui des sites qui ne possèdent pas leur mot clé principal dans le domaine ou qui l’ont au milieu ou à la fin du domaine. Comme avec le point 2 ci-dessus, il n'apporte pas autant de dynamisme qu'auparavant, mais il peut toujours être considéré comme un signal de pertinence, en particulier lorsqu'il est pris avec d'autres signaux de pertinence.

  4. Longueur d'enregistrement du domaine
    Implicite/Controverstial
    Google a déposé un brevet en 2005 pour " recherche d'informations sur la base de données historiques ". Dans le brevet, Google indique que la date d'enregistrement du domaine peut être utile pour le classement car un domaine plus ancien a plus de chance d'être utile et un domaine légitime par opposition à un domaine enregistré plus récemment. Dans le même temps, Google indique dans le brevet que les domaines de valeur (légitimes) sont souvent payés plusieurs années à l’avance, alors que les domaines de porte (illégitimes) sont rarement enregistrés plus de un an et que la date d’expiration d’un domaine peut utilisé comme facteur de prédiction de la légitimité d'un domaine et donc des pages au sein du domaine. Cet argument est vivement contesté par les sites de référencement, y compris le Search Engine Journal, qui a publié un article en juillet 2008 indiquant que l’âge du domaine est à la fois un signal surestimé et mal interprété et que la date d’enregistrement du domaine ne peut parler. la qualité ou la fiabilité d'un site Web étant donné que les domaines peuvent être parqués pendant longtemps, les sociétés établies peuvent modifier les noms de domaine et rediriger les anciennes pages de domaines vers les nouvelles pages de domaines, et plus important encore, un nom de domaine peut être utilisé illégalement pendant des années, être ensuite vendus à une personne légitime ou à une entreprise sans modification de la date d’enregistrement. Nous le constatons de plus en plus avec les entreprises qui élaborent leurs modèles commerciaux en enregistrant des noms de domaine en masse, puis en les vendant à des clients à un prix élevé. La date d'enregistrement reste généralement la même et la propriété du domaine passe simplement au nouveau propriétaire.

  5. Mot-clé dans le nom de domaine secondaire
    Non vérifié
    En 2011, le panel de Moz a convenu que les mots-clés apparaissant dans le sous-domaine pouvaient améliorer les classements. La mesure dans laquelle cette relance est utile, ou même le fait que cette relance existe au départ, est contestée dans de nombreux milieux et n’a pas pu être vérifiée par le passé.

  6. Historique du domaine
    Non vérifié
    Selon certains arguments de la sphère du référencement, il est allégué qu'une propriété instable ou plusieurs baisses sur un enregistrement de domaine whois peuvent indiquer à Google de "réinitialiser" l'historique des sites, ce qui pourrait avoir pour effet de nier les liens déjà existants. pointez sur le domaine. À ce jour, cela n’a pas été vérifié par Google.

  7. Correspondance de domaine exacte
    Vérifié/Supprimé
    Pendant un certain temps, un domaine peut figurer dans le top 3, même sans backlink, en ayant un domaine de correspondance exacte (EMD ou Domain Domain). La façon dont cela a fonctionné a été que si vous vouliez classer avec le terme Aussie Bearings, le nom de domaine exact serait aussiebearings.com. Ce signal a toutefois été supprimé depuis la mise à jour EMD de Google réalisée en 2012, qui a comblé cette faille.

  8. Données Whois publiques et privées
    Vérifié
    On pense que les données Whois privées peuvent être un signe de "quelque chose à cacher". Matt Cutts, de Google, aurait déclaré en 2006 que, lorsqu'il vérifiait un certain nombre de sites signalés, ils disposaient tous de services de protection de la vie privée whois qu'il considérait comme inhabituels, mais que ce n'était pas automatiquement mauvais et qu'une fois réunis plusieurs facteurs, parler d'une situation différente. Cela semble indiquer que si les données Whois protégées sont considérées comme un signal de classement très bas, elles relèvent davantage du processus d’action manuelle que de tout processus de classement automatisé, bien qu’il s’agisse d’une hypothèse éclairée basée sur la citation de Matt. Cutts.
    https://www.searchenginejournal.com/seo-question-do-whois-privacy-services-harm-seo/5874/

  9. Propriétaire Whois pénalisé
    Non vérifié
    Semblable au point 8, il est logique que si Google identifie un propriétaire de domaine qui a enfreint les conditions sur un site, il existe une chance raisonnable que cela se produise sur d'autres sites. Par conséquent, ces autres domaines peuvent nécessiter un examen plus approfondi. Une fois encore, il est peu probable que ce signal soit utilisé dans le classement automatique et plus probablement pour identifier des sites nécessitant un examen plus approfondi.

  10. Extensions de TLD de pays
    Vérifié
    Avoir un domaine de premier niveau de code de pays (tel que .cn, .au, .uk, .ca, etc.) est un signal qui peut aider un site à se classer pour un pays donné, mais il limite ensuite la capacité de ce site. classer globalement pour une recherche Google globale ou sur des recherches Google codées par pays.

  11. Mot-clé dans la balise de titre
    Vérifié
    La balise de titre est le deuxième élément de contenu le plus important pour une page donnée à côté du contenu de la page elle-même et envoie donc un signal très fort.

  12. L'étiquette de titre commence par le mot clé
    Vérifié
    Selon Moz Data, les balises de titre commençant par un mot clé ont tendance à donner de meilleurs résultats que les balises de titre portant le mot-clé vers la fin de la balise. Il convient de noter cependant que cela ne prend pas en compte les autres signaux susceptibles d'avoir affecté le classement et constitue au mieux une évaluation éclairée basée sur une étude à l'aveugle sans accès à l'algorithme de Google.

  13. Mot-clé dans la balise de description
    Vérifié
    L'ajout de mots-clés à la balise de description fournit un signal de pertinence peu élevé. Google ne considère pas les balises de description comme un signal de valeur élevée en raison du risque d'utilisation abusive, mais il peut néanmoins être utilisé pour transmettre un signal de pertinence limité.

  14. Le mot clé apparaît dans la balise H1
    Vérifié
    Si un mot clé apparaît dans une balise H1 (généralement considérée comme une deuxième balise de titre), il peut envoyer un autre signal de pertinence à Google. L'importance du signal est inconnue, mais le fait qu'il s'agisse d'un signal pris en compte par Google est connu.

  15. Fréquence des mots-clés dans le document
    Importance vérifiée/réduite
    À un moment donné, une page pourrait occuper un rang très élevé en répétant les mêmes mots clés dans l’ensemble de la page afin que la fréquence de ce mot clé augmente et en fasse un signal important. En raison de l'abus potentiel (et historique) de ce signal, celui-ci a été réduit et l'accent a été mis davantage sur l'aspect naturel des mots-clés dans la page que sur la nécessité de forcer les mots-clés à apparaître.

  16. Longueur du contenu
    Vérifié
    Bien qu'il soit connu que la longueur du contenu joue un rôle dans le classement des études récentes, il a été constaté que les pages les plus courtes et de qualité supérieure se classaient souvent mieux que les pages plus longues mais de qualité inférieure. On peut en déduire que la qualité plutôt que la quantité est plus importante à présent et que le signal a considérablement diminué et pourrait même être supprimé à l'avenir, compte tenu des améliorations apportées par Google en matière d'indexation et d'analyse du langage naturel du contenu de la page.

  17. Densité de mots clés
    Vérifié
    Bien que le signal ne soit pas aussi important qu’il était dû autrefois à cause d’un abus, la densité des mots clés est encore utilisée dans une certaine mesure par Google pour déterminer le sujet d’une page, mais une densité excessive des mots clés (également appelée bourrage de mots clés). peut avoir l’effet opposé et réellement réduire votre classement.

  18. Vitesses de chargement de la page
    Vérifié
    Les vitesses de chargement des pages sont utilisées par tous les principaux moteurs de recherche sur le Web comme signal de classement. Certains le font en se basant sur HTML et en estimant la vitesse de chargement en fonction de la taille du contenu HTML livré, d’autres (comme Google) surveillent la mesure réelle du chargement de la page en le testant à l’aide de robots conçus pour émuler le téléchargement par le navigateur et le rendu de la page. obtenir une vitesse de chargement de page plus précise.

  19. Contenu en double
    Vérifié
    Ce signal est un signal de classement très élevé utilisé pour réduire le classement de vos sites au lieu de l’augmenter. Si du contenu en double est détecté (même s'il a été légèrement modifié), le classement de la page et potentiellement de l'ensemble du site sera considérablement réduit.

  20. Rel = Balises canoniques
    Vérifié
    Ce signal est moins utilisé pour améliorer le classement que pour réduire le risque d’être pénalisé par le signal de contenu en double. Cette balise indique que la page est en fait un doublon et indique à Google où se trouve la page. Dans de nombreux cas, tout classement attribué à la page dupliquée sera appliqué à la page canonique.

  21. Récence des mises à jour du contenu
    Vérifié
    Depuis la mise à jour de Google Caffeine, Google a classé le contenu récemment mis à jour (et le contenu plus fréquemment mis à jour) plus haut que le contenu plus ancien. À maintes reprises, Google ajoutera une date à la liste des résultats pour indiquer qu'il s'agit d'une page récemment mise à jour et de la date à laquelle elle a été mise à jour, en particulier pour les recherches urgentes.

  22. Mots-clés dans l'URL
    Vérifié
    Avoir des mots-clés dans votre URL est un signal de pertinence important et doit être fait dans la mesure du possible.

Il y en a beaucoup plus et je pourrais passer les 6 prochaines heures à les parcourir toutes, mais les bases sont la qualité plutôt que la quantité, et concevez votre site et votre contenu pour vos utilisateurs et non pour le moteur de recherche. Tant que vous suivez ces règles, vous devriez être capable de frapper tous les signaux importants.

0
Chris Rutherfurd