web-dev-qa-db-fra.com

Un éditeur de texte pour ouvrir de gros fichiers texte (géants, énormes, grands)

Je veux dire plus de 100 MB. tels fichiers texte peuvent pousser l'enveloppe des éditeurs.

Je dois parcourir un fichier XML volumineux, mais je ne peux pas si l'éditeur est bogué.

Aucune suggestion?

1023
Yuvi

Code VS (Windows, macOS, Linux) - Libre et Open Source avec une interface graphique de Nice. Édité un fichier JSON de 3,6 Go chargé en une minute. Vous devez disposer de suffisamment de RAM pour charger les fichiers.

Visionneuses gratuites en lecture seule:

  • glogg (Windows, macOS, Linux) - Confirmation de la gestion des fichiers multi-Go. Sa principale caractéristique est la recherche par expression régulière. Possède des onglets, lit les fichiers directement à partir du disque, peut regarder/suivre les fichiers et permet à l’utilisateur de marquer des lignes.
  • LogExpert (Windows) - "Un remplacement de l'interface graphique pour tail." Prise en charge du suivi de fichiers, de la recherche, du filtrage, de la surbrillance configurable, des plug-ins et des outils externes.
  • Visionneuse de fichiers texte volumineux (Windows) - Minimaliste et possède une très petite taille d’exécutable. Prise en charge de la vue fractionnée, de la personnalisation du thème de texte, de la recherche regex et du suivi de fichier.
  • Lister (Windows) - Encore plus petit et minimaliste. C'est un exécutable, à peine 500 Ko, mais il prend toujours en charge la recherche (avec les expressions rationnelles), l'impression, un mode éditeur hexadécimal et les paramètres.

Editeurs gratuits:

  • Vim et Emacs (Windows, macOS, Linux) - Editeurs Unix classiques . Courbe d'apprentissage abrupte, mais brutalement efficace. Ils ont des paramètres qui peuvent être réglés pour les rendre encore plus rapides.
  • Editeur de fichiers volumineux (Windows) - Ouvre et modifie des fichiers TB +, prend en charge Unicode, utilise peu de mémoire et possède des fonctionnalités spécifiques à XML , et inclut un mode binaire.
  • HxD (Windows) - Un éditeur hexadécimal, pas un éditeur de texte; mais c'est incroyablement rapide et utile.
  • GigaEdit (Windows) - Prend en charge la recherche, les statistiques sur les caractères et la personnalisation de la police. Mais c'est bogué - avec les gros fichiers, cela ne permet que de remplacer des caractères, pas de les insérer; il ne respecte pas LF en tant que terminateur de ligne, uniquement CRLF; et c'est lent.

Programmes intégrés (aucune installation requise):

  • less (macOS, Linux) - Outil de pagination Unix en ligne de commande traditionnel. Vous permet de visualiser des fichiers texte de pratiquement n'importe quelle taille. Peut être installé sur Windows aussi.
  • Bloc-notes (Windows) - Décent avec des fichiers volumineux, en particulier si Word Wrap est désactivé.
  • PLUS (Windows) - Ceci fait référence à Windows MORE, pas à Unix more. Un programme de console qui vous permet de visualiser un fichier, un écran à la fois.

Lecteurs Web:

  • htmlpen.com - Peut ouvrir et mettre en évidence les fichiers TB + de la syntaxe. Permet l'édition, sauf pour les très gros fichiers. Prend en charge la recherche, les expressions rationnelles et l'exportation.
  • readfileonline.com - Un autre visualiseur de fichiers volumineux HTML5. Prise en charge de la recherche.

Editeurs payants:

  • 010 Editor (Windows, macOS, Linux) - Ouvre des fichiers géants (jusqu'à 50 Go).
  • SlickEdit (Windows, macOS, Linux) - Ouvre les fichiers volumineux.
  • UltraEdit (Windows, macOS, Linux) - Ouvre les fichiers de plus de 6 Go, mais la configuration doit être modifiée pour cela. être pratique: Menu "Avancé" Configuration "Traitement de fichier" Fichiers temporaires "Ouvrir un fichier sans fichier temporaire ...
  • EmEditor (Windows) - Gère très bien les fichiers texte très volumineux (officiellement jusqu'à 248 Go, mais jusqu'à 900 Go selon à un rapport).

Et enfin, avez-vous essayé d'ouvrir le gros fichier avec votre éditeur habituel? Certains éditeurs peuvent en réalité gérer des fichiers relativement volumineux. En particulier, Notepad ++ (Windows) et Texte sublime (Windows, macOS, Linux): fichiers de support compris dans la plage de 2 Go.

1296
Nick Ryberg

Trucs et astuces

moins

Pourquoi utilisez-vous les éditeurs pour simplement regarder dans un fichier (volumineux)?

Sous * nix ou Cygwin , utilisez simplement moins . (Il y a un dicton célèbre - "Moins, c'est plus, plus ou moins" - parce que "moins" a remplacé la commande Unix antérieure "plus", avec l'ajout que vous pourriez faire défiler vers le haut.) Rechercher et naviguer sous less est très similaire à Vim, mais il n'y a pas de fichier d'échange et peu de RAM utilisés.

Il existe un port Win32 de GNU less. Voir la section "moins" de la réponse ci-dessus.

Perl

Perl est bon pour les scripts rapides, et son opérateur .. (bascule de plage) constitue un mécanisme de sélection agréable permettant de limiter les difficultés à parcourir.

Par exemple:

$ Perl -n -e 'print if ( 1000000 .. 2000000)' humongo.txt | less

Cela extraira tout, de la ligne 1 million à la ligne 2 millions, et vous permettra de filtrer la sortie manuellement en moins.

Un autre exemple:

$ Perl -n -e 'print if ( /regex one/ .. /regex two/)' humongo.txt | less

L'impression commence lorsque "l'expression régulière" trouve quelque chose et s'arrête lorsque "l'expression régulière deux" trouve la fin d'un bloc intéressant. Il peut trouver plusieurs blocs. Tamiser la sortie ...

logparser

Ceci est un autre outil utile que vous pouvez utiliser. Pour citer l'article Wikipedia :

logparser est un utilitaire de ligne de commande flexible, initialement conçu par Gabriele Giuseppini, employé de Microsoft, pour automatiser les tests de journalisation IIS. Il était destiné à être utilisé avec le système d'exploitation Windows et était inclus dans les IIS 6.0 Outils du kit de ressources. Le comportement par défaut de logparser fonctionne comme un "pipeline de traitement de données", en prenant une expression SQL sur la ligne de commande et en générant les lignes contenant les correspondances pour l'expression SQL.

Microsoft décrit Logparser comme un outil puissant et polyvalent offrant un accès de requête universel à des données textuelles telles que des fichiers journaux, des fichiers XML et des fichiers CSV, ainsi que des sources de données clés sur le système d'exploitation Windows, telles que le journal des événements, le registre, etc. le système de fichiers et Active Directory. Les résultats de la requête d'entrée peuvent être mis en forme de manière personnalisée dans une sortie texte ou peuvent être conservés dans des cibles plus spécialisées, telles que SQL, SYSLOG ou un graphique.

Exemple d'utilisation:

C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line > 1000 and line < 2000"
C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line like '%pattern%'"

La relativité des tailles

100 Mo n'est pas trop gros. 3 Go devient un peu gros. Auparavant, je travaillais dans un centre d’impression et de courrier qui créait environ 2% du courrier de première classe américain. L'un des systèmes pour lesquels j'étais le responsable technique représentait environ 15% des envois. Nous avions de gros fichiers à déboguer ici et là.

Et plus...

N'hésitez pas à ajouter plus d'outils et d'informations ici. Cette réponse est wiki de la communauté pour une raison! Nous avons tous besoin de plus de conseils pour gérer de grandes quantités de données ...

183
Roboprog