Quel package dois-je installer pour pouvoir lire les fichiers avec iso-8859-1 latin1
encodage?
Actuellement, je ne vois que des caractères étranges au lieu de texte.
% locale
LANG=en_US.UTF-8
LANGUAGE=
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=
L'encodage latin1 est "principalement" compatible avec UTF-8, car les deux encodages sont des sur-ensembles d'ASCII. Cela signifie que vous devriez voir des lettres normales (a-z) mais pas des signes diacritiques (é, è, etc.). Essayons de comprendre quel est l'encodage réel de votre fichier.
Tout d'abord, la commande file
peut parfois détecter l'encodage. Utilisez simplement:
$ file weird_file
Vous pourriez obtenir weird_file: ISO-8859 text
pour latin1, weird_file: UTF-8 Unicode text
pour UTF-8, ou autre chose. Maintenant, si vous avez déterminé qu'il s'agit de latin1, la meilleure façon de l'afficher est en fait d'ouvrir un éditeur, comme gedit, et de choisir l'encodage correct lors de l'ouverture du fichier. Si vous souhaitez convertir le fichier en UTF-8, vous pouvez alors 'Enregistrer sous' et demander UTF-8.
Si vous ne connaissez toujours pas l'encodage, essayez d'ouvrir le document avec Libre Office, il est généralement bon pour la détection. Il est également possible que votre fichier soit corrompu (par exemple, du texte UTF-8 interprété comme latin1 et enregistré comme UTF-8), ou, plus probablement, qu'il ne contienne jamais de texte. N'hésitez pas à le télécharger afin que nous puissions l'inspecter.