web-dev-qa-db-fra.com

Où puis-je trouver une liste de codes langue + région?

J'ai googlé (enfin, DuckDuckGo'ed, en fait) jusqu'à ce que je sois bleu au visage, mais je ne trouve pas de liste de codes de langue du type en-GB ou fr-CA n'importe où.

Il existe d'excellentes ressources sur les composants, en particulier le page W3C I18n , mais j'espérais une liste alphabétique simple, assez canonique si possible (quelque chose comme celui-ci ). Impossible de trouver.

Est-ce que quelqu'un peut-il me montrer la bonne direction? Merci beaucoup!

47
Dɑvïd

Il existe plusieurs systèmes de codes de langues et plusieurs systèmes de codes de régions, ainsi que leurs combinaisons. Comme vous vous référez à une page du W3C, je suppose que vous faites référence au système défini dans BCP 47 . Ce système est orthogonal dans le sens où des codes comme en-GB et fr-CA combinent simplement un code de langue et un code de région. Cela signifie un très grand nombre de combinaisons possibles, dont la plupart n'ont pas de sens, comme ab-AX, qui signifie abkhaze comme parlé à Åland (je ne pense pas que quiconque, encore moins aucune communauté, parle abkhaze là-bas, bien que ce soit théoriquement possible bien sûr).

Ainsi, toute liste de combinaisons langue-région ne serait qu'une liste pragmatique de combinaisons importantes dans un certain sens, ou prises en charge par certains logiciels dans un sens particulier.

Les spécifications que vous avez trouvées définissent les principes généraux ainsi que les sources faisant autorité sur différentes "sous-étiquettes" (comme le code de langue principale et le code de région). Pour les parties les plus importantes, l'autorité d'enregistrement officielle maintient les codes ISO 639 à trois et deux lettres pour les langues, et le site ISO contient les codes ISO 3166 à deux lettres pour les régions. Les listes sont assez lisibles, et je ne vois aucune raison d'envisager d'utiliser d'autres ressources que ces ressources principales, en particulier en ce qui concerne les modifications possibles.

46
Jukka K. Korpela

Il y a 2 composants en jeu ici:

  1. La balise de langue qui est généralement définie par ISO 639-1 alpha-2
  2. L'étiquette de région qui est généralement définie par ISO 3166-1 alpha-2

Vous pouvez mélanger et faire correspondre les langues et les régions dans la combinaison qui vous convient, il n'y a donc pas de liste de toutes les possibilités.

BTW, vous utilisez effectivement un balise BCP47 , qui définit les normes pour chaque segment de paramètres régionaux.

8
tigrish

Unicode maintient une telle liste: http://unicode.org/repos/cldr-tmp/trunk/diff/supplemental/index.html Encore mieux, vous pouvez l'avoir au format XML (idéal pour analyser la liste) et avec aussi les systèmes d'écriture habituels utilisés par chaque langue: http://unicode.org/repos/cldr/trunk/common/supplemental/supplementalData.xml (regarder dans/LanguageData)

7
Thomas CORDONNIER
2
s-f

Une solution serait d'analyser cette liste, elle vous donnerait toutes les clés nécessaires pour créer la liste que vous recherchez.

http://www.iana.org/assignments/language-subtag-registry/language-subtag-registry

2
Adam

Nous avons une liste de travail sur laquelle nous travaillons pour le référencement du code de langue/nom de langue pour Localizejs. J'espère que ça t'as aidé

Liste des codes de langue en YAML ou JSON?

2
johnnywu