web-dev-qa-db-fra.com

Les robots d'exploration / spiders Web indexent-ils les sites Web Azure?

Pour ceux qui souhaitent que leur site Web soit le plus découvrable possible (et qui ne le fait pas?), Les sites Web Azure de Microsoft (azurewebsites.net) constituent-ils un domaine réalisable pour les sites hôtes?

J'ai un site qui est à la fois sur un azurewebsites.net et hébergé sous un nom complètement différent par discountasp.net

Ces deux sites sont exactement les mêmes, à l'exception de l'URL. chaque fois que je mets à jour le code, je republie le site dans/aux deux endroits. Donc évidemment, ils ont tous les deux les mêmes éléments H1 et H2.

En recherchant la valeur/le contenu de mon tag H1, je trouve mon site .com classé n ° 3 sur Google et n ° 2 sur Bing et Yahoo; OTOH, mon site azurewebsites.net n'apparaît pas du tout sur la première page, ni sur aucun d'entre eux.

Cela me fait me demander si azurewebsites.net ne devrait être utilisé que pour l'hébergement d'API Web et similaires, et non pour les sites "publics" génériques/commerciaux. Mes conclusions sont-elles valables?

1
B. Clay Shannon

Alors, vos sites Web sont-ils exactement les mêmes? même contenu, même html? et la seule différence est le domaine et l'hébergement?

Les araignées exploreront tous les sites Web tant qu'ils sont publics, et aucune règle dans le fichier robots.txt ou les métabalises ne leur indique explicitement de rester en dehors du site.

Votre problème est dû au contenu en double. Aux yeux de Googlebot, l'un de vos sites copie le contenu d'un autre site et il n'aime pas cela. Il attribue un crédit au site pour lequel il pense avoir publié ce contenu, mais en tenant compte de l'autorité, classement, la longévité et il sera ignorer ou même pénaliser le site qui duplique le contenu.

De Google Outils pour les webmasters aide :

Google s'efforce d'indexer et d'afficher des pages contenant des informations distinctes. Ce filtrage signifie, par exemple, que si votre site possède une version "normale" et une "imprimante" de chaque article, et qu'aucune de celles-ci n'est bloquée par une balise méta noindex, nous choisirons l'une d'entre elles pour la liste. Dans les rares cas où Google perçoit que du contenu en double peut être affiché avec l'intention de manipuler notre classement et de tromper nos utilisateurs, nous procéderons également aux ajustements appropriés dans l'indexation et le classement des sites concernés. En conséquence, le classement du site peut en souffrir ou le site peut être entièrement supprimé de l'index Google. Dans ce cas, il n'apparaîtra plus dans les résultats de recherche.

1
Binarysurf