web-dev-qa-db-fra.com

Est-il considéré comme un blackhat de montrer des données structurées aux robots des moteurs de recherche mais pas aux humains?

Est-il considéré blackhat si les données structurées JSON-LD ne sont montrées qu'aux moteurs de recherche? Le contenu est toujours présent sur le site Web pour les utilisateurs, mais il est uniquement marqué comme des données structurées lorsque nous détectons que le visiteur est un bot. Pouvons-nous être pénalisés à cause de cela?

Ceci est d'ajouter une couche de protection contre les personnes essayant de gratter le site.

(J'ai changé le titre de la question pour répéter mon propos. Il est parfois possible d'afficher un type de contenu aux moteurs de recherche et un autre type de contenu aux humains est autorisé, par exemple les sites qui utilisent Flash. Je me demande si un contenu Une exception existe pour les données structurées.)

Exemple de la donnée

Voici un exemple de données structurées contenues dans le code source que les robots sont censés lire. Ce même contenu doit être présent sur la page dans un format visible afin que les humains puissent le lire.

{
 "@context": "http://schema.org",
"@type": "Person",
"address": {
"@type": "PostalAddress",
"addressLocality": "Good city",
"addressRegion": "Great State",
"postalCode": "47918",
"streetAddress": "701 N Nice St"
},
"name": "Firstname LastName",
"telephone": "765-764-1111" 
}
1
Robert Sinclair

Cloaking est lorsque vous montrez un contenu à un moteur de recherche qui est différent de ce que vous montrez à un utilisateur.

Google teste les pages Web en dehors de son propre réseau et vous ne le saurez jamais. S'il y a une différence entre ce que vous affichez dans Googlebot et les utilisateurs, Google vérifie par tâtonnement plus de pages pour détecter les différences. Si suffisamment de pages semblent comporter suffisamment de différences, la pénalité est appliquée.

C'est aussi simple que ça.

Pour répondre à votre question, il peut être occultant si le changement de contenu est suffisamment important. Ne jamais afficher un contenu différent pour les moteurs de recherche que pour les utilisateurs. Reste simple.

[Mettre à jour]

Merci pour l'exemple de ce que vous demandez spécifiquement.

Cloaking est ce que j'ai défini plus tôt, cependant, il y a un peu de tolérance surtout à la lumière de l'ordinateur de bureau versus mobile. Dans les premiers temps, la dissimulation pouvait simplement être déterminée en capturant la page deux fois, une fois via le robot et une fois à l'extérieur du robot, souvent à partir d'un autre réseau, et en comparant la somme de contrôle de chaque page. Cependant, ces jours-ci, ce n'est pas si simple avec un ordinateur de bureau ou un appareil mobile.

Nous savons que Google peut extraire une série de pages et déterminer assez facilement le contenu basé sur un modèle ou le contenu d'une page. À la lumière de l'état du Web ces derniers jours, je devrais supposer qu'un certain niveau d'analyse a lieu pour comparer le contenu de la page et éventuellement le modèle de la page séparément. Comment les pages sont analysées pour le cloaking ces jours-ci restera probablement un mystère. Cependant, il est raisonnable de supposer que des différences mineures dans la partie non contenue de la page sont à prévoir dans certains cas.

La question suivante est la suivante: est-il sage de présenter les données JSON uniquement aux robots d'exploration?

Personne ne peut dire précisément si un moteur de recherche, Google en particulier, puisque Bing semble plutôt tolérant, verra que l'omission de JSON est trompeuse. Il doit être reconnu comme un risque, même s'il semble être petit et raisonnable. En tant que recommandation, je dirais d'inclure les données JSON aux utilisateurs et aux robots d'exploration afin d'éviter tout problème. Pourquoi? Parce que le cloaking n'est pas une petite violation du moins aux yeux de Google. Si une dissimulation est détectée, Google vérifiera le site, puis appliquera la pénalité. Ceci est un processus automatisé. Une fois la pénalité appliquée, il peut s'écouler un certain temps avant que la pénalité soit supprimée. Vous devez donc frapper à la métrique de confiance des sites qui effectuent une recherche même après la levée de la pénalité.

1
closetnoc