web-dev-qa-db-fra.com

Quelle est la représentation UTF-8 de "fin de ligne" dans un fichier texte

quelle est la représentation binaire de "fin de ligne" en UTF-8.

21
Husky

En UTF-8 (hex), son -> 0x0A (0a)
UTF-8 (binaire) -> 00001010

enter image description here

19
Sumit Singh

Il y a n tas :

  • LF: saut de ligne, + 000A (UTF-8 en hex: 0A)
  • VT: Onglet vertical, + 000B (UTF-8 en hex: 0B)
  • FF: Form Feed, + 000C (UTF-8 en hex: 0C)
  • CR: Retour chariot, + 000D (UTF-8 en hex: 0D)
  • CR+LF: CR ( + 000D ) suivi de LF ( + 000A ) (UTF-8 en hex: 0D0A)
  • NEL: Ligne suivante, + 0085 (UTF-8 en hex: C285)
  • LS: Séparateur de ligne, + 2028 (UTF-8 en hex: E280A8)
  • PS: Séparateur de paragraphes, + 2029 (UTF-8 en hex: E280A9)

... et probablement beaucoup plus.

Les plus couramment utilisés sont LF (* nix), CR+LF (Windows et DOS) et CR (anciens systèmes Mac pré-OSX, principalement).

35
T.J. Crowder

UTF-8 est compatible avec ASCII, donc les codes ASCII 10 (0x0A) pour le saut de ligne et 13 (0x0D) pour le retour chariot sont également utilisés dans UTF-8.

6
Jesper