web-dev-qa-db-fra.com

Comment lire un fichier avec l'encodage ISO1-8859-1 latin1?

Quel package dois-je installer pour pouvoir lire les fichiers avec iso-8859-1 latin1 encodage?

Actuellement, je ne vois que des caractères étranges au lieu de texte.

% locale

LANG=en_US.UTF-8
LANGUAGE=
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=
1
evfwcqcg

L'encodage latin1 est "principalement" compatible avec UTF-8, car les deux encodages sont des sur-ensembles d'ASCII. Cela signifie que vous devriez voir des lettres normales (a-z) mais pas des signes diacritiques (é, è, etc.). Essayons de comprendre quel est l'encodage réel de votre fichier.

Tout d'abord, la commande file peut parfois détecter l'encodage. Utilisez simplement:

$ file weird_file

Vous pourriez obtenir weird_file: ISO-8859 text pour latin1, weird_file: UTF-8 Unicode text pour UTF-8, ou autre chose. Maintenant, si vous avez déterminé qu'il s'agit de latin1, la meilleure façon de l'afficher est en fait d'ouvrir un éditeur, comme gedit, et de choisir l'encodage correct lors de l'ouverture du fichier. Si vous souhaitez convertir le fichier en UTF-8, vous pouvez alors 'Enregistrer sous' et demander UTF-8.

Si vous ne connaissez toujours pas l'encodage, essayez d'ouvrir le document avec Libre Office, il est généralement bon pour la détection. Il est également possible que votre fichier soit corrompu (par exemple, du texte UTF-8 interprété comme latin1 et enregistré comme UTF-8), ou, plus probablement, qu'il ne contienne jamais de texte. N'hésitez pas à le télécharger afin que nous puissions l'inspecter.

2
Jennifer Wilson