web-dev-qa-db-fra.com

Fichier Unicode dans le bloc-notes

Qu'est-ce que cela signifie lorsque j'enregistre un fichier texte au format "Unicode" dans le bloc-notes? est-ce Utf-8, Utf-16 ou Utf-32? Merci d'avance.

21
FSm

Dans le Bloc-notes, comme dans les logiciels Windows en général, "Unicode" comme nom de codage signifie UTF-16 Little Endian (UTF-16LE). (J'ai d'abord pensé que ce n'était pas du vrai UTF-16, car Notepad ++ le reconnaît comme UCS-2 et affiche le contenu comme une ordure, mais en revérifiant avec BabelPad, j'ai conclu que le Bloc-notes peut encoder correctement même les caractères non-BMP.)

De même, "Big Endian Unicode" signifie Big Endian UTF-16. Et "ANSI" signifie le codage hérité natif du système, par exemple l'encodage windows-1252 8 bits dans les versions occidentales de Windows.

31
Jukka K. Korpela