web-dev-qa-db-fra.com

Puis-je empêcher Google de suivre les liens que je suis dans les fichiers PDF téléchargés?

Je souhaite créer un document PDF à l'aide de Google Documents/Lecteur, qui inclut des liens, mais sans que Google ne clique sur ces liens.

Le téléchargement d’un document Google Drive (File> Download as) dans n’importe quel autre format (docx, odt, rtf, txt, html) se comporte comme prévu: si j’insère un lien vers http://cnn.com , le lien dans le document téléchargé est http://cnn.com .

Le téléchargement en tant que PDF modifie le lien pour ajouter le suivi Google: http://cnn.com devient http://www.google.com/url?q= http% 3A% 2F% 2Fcnn.com & sa = D & sntz = 1 & usg = <tracking_token > qui affiche "Vous rediriger vers http://cnn.com " et vous envoie ensuite. Je suppose que Google le fait pour suivre le comportement des utilisateurs. Ce n'est pas comme si un lien direct ne fonctionnait pas pour une raison technique.

Google fait la même chose pour les liens contenus dans des documents publiquement visibles (mais non modifiables) sur Google Drive, comme celui-ci .1 Bien que cela reste désagréable, cela semble moins odieux, car ils hébergent toujours le document et leur présence est évidente pour tous les téléspectateurs. Si je suis sur la page d'un domaine google.com, il n'est pas surprenant qu'ils suivent les liens de cette page. Si je regarde un PDF de ma tante Louise2 avec un lien vers une vidéo sur vimeo.com de chats amusants,3 Je ne m'attends pas à ce que cliquer sur ce lien implique Google de quelque manière que ce soit.4

Essayez de télécharger ce document dans un format autre que PDF et notez comment les liens sont maintenant directs au lieu de passer par Google. Est-ce une coïncidence si cela n'est fait que pour le format le plus difficile à modifier après le téléchargement?

Ainsi, après avoir eu chaud et pris la peine, ai-je manqué une option quelque part dans les préférences de Docs qui désactive cette fonctionnalité?

Existe-t-il un moyen simple de désactiver ce suivi?

Voici quelques solutions que je cherche à améliorer:

  • Télécharger dans un autre format et convertir cela en PDF.
    → Rejeté pour avoir détruit le formatage.
  • Éditez manuellement le fichier PDF pour corriger les liens.
    → Rejeté parce que… beurk. (Bien que l'automatisation serait une bonne solution.)
  • Accepter que Google sache littéralement tout ce que je fais en ligne et que c’est une chose tellement ésotérique qu’il n’a aucun sens de s’en inquiéter.
    → :-(

1. Pas mon document, juste le premier document public que j'ai trouvé.
2. Pas son vrai nom.
3. Tante Louise n'a que partiellement accepté le monde moderne. Elle utilise le courrier électronique, mais uniquement pour envoyer PDF copies des lettres qu'elle a écrites.
4. Sauf que dans la pratique, la vidéo sera diffusée sur YouTube et Google saura ce que je regarde.

14
blahdiblah

Oui, vous pouvez!

Fichier -> Email en pièce jointe -> Joindre au format PDF

Ajoutez ensuite votre propre adresse électronique pour envoyer le fichier par e-mail. Le PDF joint au courrier électronique comportera des liens directs vers les hyperliens intégrés et les URL simples, sans suivi Google non souhaité.

4
James

Cela se produit réellement dans tous les formats que j'ai essayés (pas seulement PDF). Je ne peux pas proposer de solution prête à l'emploi pour générer le format PDF. Mais j'ai résolu ce problème pour HTML.

Par programme, vous devez analyser le document (HTML) et réécrire l’attribut href lors du décodage URL du lien vrai situé après la partie? Q =.

Le code ici est PHP de extension Html2Wiki qui traite de ce problème

            if (strpos(${$attribute}, 'google.com/url?q=')) {
                $matches = array();
                if (preg_match('#url\?q=([^&]*)#', ${$attribute}, $matches)) {
                    ${$attribute} = urldecode($matches[1]);
                }
            } else {
0
Greg Rundlett