web-dev-qa-db-fra.com

Comment Google pourrait-il identifier si une vidéo est dupliquée? Thème de contenu en double SEO

Il y a quelques jours, John Mueller de Google a déclaré ceci:

Nous essayons de comprendre quand quelque chose est un doublon et de le traiter de manière appropriée. Nous faisons donc cela avec du contenu textuel, des pages Web par exemple, nous essayons de reconnaître si quelque chose est un doublon et de le filtrer lorsque nous le montrons dans la recherche. Nous le faisons avec des images où nous pouvons et nous essayons de le faire aussi avec la vidéo.

Donc si vous hébergez votre vidéo sur un certain nombre de services différents, cela ne signifie pas qu'elle apparaîtra 5 fois au lieu d'une fois dans les résultats de la recherche .

Lien vers la source

Question : Comment Google pourrait-il identifier si une vidéo est vraiment une copie?

Si je télécharge la même vidéo sur Youtube, Vimeo et Dailymotion, elle sera transcodée différemment par chacun de ces sites, de sorte que les vidéos auront des hachages différents ...

5
CamSpy

Il y a beaucoup plus à la vidéo correspondante que la simple comparaison de hachages de fichiers. Google a mis au point un système complet de correspondance vidéo pour YouTube appelé ContentID , qui vérifie chaque vidéo téléchargée par rapport à une bibliothèque de vidéos protégées par le droit d'auteur.

Pour une explication simple, commençons par les images. (Google fait plus que faire correspondre les hachages là aussi.) Redimensionner/rogner une image, même de 1 pixel, fournirait un hachage de fichier différent. Donc, de nombreuses techniques sont utilisées pour déterminer la similarité.

Si les images ne sont pas de la même taille, nous redimensionnerons l'une pour correspondre à l'autre. Ensuite, nous comparerions pixel par pixel. Bien sûr, la plupart des pixels seront légèrement différents, mais ils seront assez proches. Donc, si sur toute l'image, la "différence" moyenne entre les pixels est inférieure à un seuil, les images sont les mêmes.

En développant cela pour les vidéos, nous pouvons répéter ce processus pour plusieurs images d'une vidéo, ainsi que des extraits audio.

Bien sûr, le ContentID de Google est bien plus avancé que mon explication, mais j'espère que cela vous donnera une idée de base.

Lectures complémentaires:

3
DisgruntledGoat

Essayez de créer différentes versions de votre vidéo avec son différentiel, fréquence d'images et encodage pour différents sites Web sur lesquels vous effectuez un téléchargement.

Google mappe les lignes de scénario sur les images vidéo, de la même manière que Shazam mappe la forme d'onde sur la ligne de scénario (ensemble ou clips) pour l'audio.

0
masmrdrr