web-dev-qa-db-fra.com

Comment trouver les fautes d'orthographe courantes pour mon nom de domaine?

J'aimerais enregistrer des fautes d'orthographe pour mon nom de domaine, mais je ne souhaite pas enregistrer de façon spéculative un zillion de formulaires "à deviner". Par exemple, cet outil offre les options suivantes dans un Générateur de mot-clé Typo

  • sauter des lettres
  • doubles lettres
  • lettres inversées
  • sauter des espaces
  • clé manquée
  • clé insérée

Ce qui est génial et génère des dizaines sinon des centaines de noms de domaine possibles ... mais cela ne me dit pas le plus crucial: Laquelle de ces erreurs d’orthographe est celle qui se produit le plus souvent avec de vrais utilisateurs en direct sur Internet?

Comment puis-je trouver des données erronées sur des utilisateurs réels?

38
Jeff Atwood

Il existe quelques ressources sur Wikipedia, mais vous devez être assez chanceux pour avoir un domaine qui est un mot anglais vanille simple, assez commun pour apparaître ici.

Vous pouvez utiliser le Générateur de mots clés , ou quelque chose du genre, puis saisir péniblement chacun d'eux dans Google - qui, ironiquement, tentera de corriger votre orthographe - puis utilisez la recherche à la place de {version mal orthographiée. } "et voyez le nombre de résultats de recherche que vous obtenez pour cette faute d’orthographe spécifique:

Affichage des résultats pour Treatise

Recherchez plutôt tretise

Cela donne environ 117 000 résultats pour "tretise" contre 17 800 000 résultats pour "traité". Vous avez donc maintenant une idée de la fréquence des erreurs d’orthographe sur Internet! Vous pouvez donc favoriser les erreurs d’orthographe qui se produisent plus souvent dans le monde réel.

Peut-être plus important encore, j'ai aussi trouvé ces pages:

http://how-to-spell.net/treatise

Comment épeler traité?

Correct: traité .

Fautes d'orthographe courantes: trétise - 100%

Qui apparemment utilise les données réelles!

Nous avons collecté des pourcentages de fautes d'orthographe provenant de près de 15 423 252 sessions de vérification orthographique sur le site Web spellchecker.net (janv. 2010 - juin 2012).

Dans l'idéal, j'aimerais que Google partage des données sur les fautes d'orthographe, car je soupçonne qu'ils en ont beaucoup plus. Mais je ne sais pas s'ils sont disposés à les partager. avantage compétitif.

Ce serait génial s'ils le faisaient!

25
Jeff Atwood

Problème intéressant. Vous pouvez utiliser l'outil de recherche par mots clés de Google à l'adresse https://adwords.google.com/o/KeywordTool pour connaître le nombre de recherches effectuées chaque mois pour chacune de vos erreurs de nom de domaine (vous auriez générer une liste de fautes de frappe avec l’outil mentionné ci-dessus). Pas parfait, mais représenterait les fautes de frappe des utilisateurs et vous donnerait des données correctes. (Je viens de le tester et j'ai obtenu des résultats qui semblaient raisonnables.)

8
Mark Seifert

Question intéressante, l’analyse des résultats de recherche décrits ici devrait constituer un bon point de départ, mais elle est sensible aux faux positifs causés par d’autres sites Web portant des noms semblables au vôtre. Il peut également manquer des erreurs courantes auxquelles vous n'avez pas pensé. En regardant la liste, je dirais qu'analyser le changement de mots peut aussi être intéressant.

Une méthode particulièrement efficace pour découvrir les erreurs commises le plus souvent par les visiteurs courants consiste à leur demander de taper le nom. Bien sûr, tous les sites Web ne sont pas adaptés à cette situation, en supposant que la page soit interactive, elle devrait donc convenir parfaitement.

Plutôt que d'utiliser des captcha ordinaires, montrez simplement quelques-uns des logos de votre site avec (une partie de) le nom qui y est écrit et demandez aux personnes de le taper avant de pouvoir faire leur travail.

Les données ne seront pas basées sur une énorme population, comme Google, mais ce sera exactement le groupe cible et les résultats devraient donc être assez puissants.

3
Dennis Jaheruddin

Vous pouvez essayer ce domaine typo Finder. Les options de recherche suivantes, individuellement ou en combinaison:

  • Claviers QWERTY
  • Échange de lettres
  • Touches collantes, pour les lettres supplémentaires ou manquantes
  • Des ressemblances telles que la lettre l par rapport au nombre 1

Il existe trois "points de vue" pour la recherche. Registrant est la valeur par défaut. DNS est une vue pouvant être triée indiquant le serveur de noms et l'adresse IP de chaque faute de frappe. TLD trouve des fautes de frappe dans les noms de l'un des six TLD suivants: .com .net .org .biz .us .info et s'il est enregistré.

Est-ce différent de l'outil de mots clés d'OP? Peut être. Il prétend "trouver les fautes de frappe communes associées aux noms de domaine". Cela signifie que les données ont été collectées auprès des utilisateurs qui ont saisi manuellement les noms de domaine dans la barre de navigation de leur navigateur .

  • La recherche par "touches collantes" inclut les variantes courantes, avec ou sans trait d'union. Ces sortes de fautes de frappe ne sont pas dues à des touches collantes, mais plutôt à des erreurs de perception humaine. Cela indique une utilisation de quelque chose de mieux qu'une approche basée sur des règles et utilisant un système expert.
1
Ellie Kesselman