web-dev-qa-db-fra.com

Quel est le codage de caractères par défaut?

Je ne sais pas moi-même à quel point cette question est profonde (par exemple, je sais qu'il pourrait y en avoir plusieurs, en fonction de ma tâche).

En particulier, je m'intéresse aux types de chaînes utilisées pour nommer les fichiers et les dossiers du système.

Je suis également intéressé par la façon dont les chaînes sont représentées par défaut pour un script bash ou python.

8
gabkdlly
  • Le codage des noms de fichiers sur le système de fichiers est utf-8.
  • Bash pense en octets, pas avec strings-with-encoding-knowledge. Donc pas d'encodage par défaut. Le codage par défaut de gnome-terminal est utf-8
  • Le codage par défaut de Python est ascii
3
Dennis Kaarsemaker

Le codage de caractères par défaut est UTF-8 (Unicode), bien que presque tous les fichiers (probablement tous sur une installation par défaut) des noms sont des caractères ASCII normaux, communs à la plupart des encodages.

Je ne sais pas ce que vous entendez par "combien de chaînes sont représentées par un script bash ou python" ". Vous pouvez utiliser des caractères Unicode dans des scripts bash sur Ubuntu, mais généralement, avec un script bash, vous appelez d'autres programmes, et savoir si ceux-ci les gèrent ou non est un autre problème. Il est certainement possible de le faire avec Python aussi, bien que vous souhaitiez vous familiariser avec les packages et les paramètres associés.

7
frabjous