fractionner une chaîne en fonction de l'onglet dans le fichier

Question

J'ai un fichier qui contient des valeurs séparées par une tabulation ("\ t"). J'essaie de créer une liste et de stocker toutes les valeurs de fichier dans la liste. Mais j'ai un problème. Voici mon code.

line = "abc def ghi" values = line.split("	")

Cela fonctionne bien tant qu'il n'y a qu'un seul onglet entre chaque valeur. Mais s'il y a un seul onglet, il le copie également dans les valeurs. Dans mon cas, la plupart du temps l'onglet supplémentaire sera après la dernière valeur du fichier.

Ashwini Chaudhary · Accepted Answer

Vous pouvez utiliser regex ici:

>>> import re >>> strs = "foo	bar		spam" >>> re.split(r'	+', strs) ['foo', 'bar', 'spam']

mise à jour:

Vous pouvez utiliser str.rstrip pour se débarrasser de la fuite ' ' puis appliquez regex.

>>> yas = "yas		bs	cda		" >>> re.split(r'	+', yas.rstrip('	')) ['yas', 'bs', 'cda']

DimmuR · Answer

Vous pouvez utiliser regexp pour faire ceci:

import re patt = re.compile("[^	]+") s = "a		bcde		ef" patt.findall(s) ['a', 'bcde', 'ef']

CornSmith · Answer

Diviser sur l'onglet, mais ensuite supprimer toutes les correspondances vides.

text = "hi	there			my main man" print [splits for splits in text.split("	") if splits is not ""]

Les sorties:

['hi', 'there', 'my main man']

Sylvain Leroux · Answer

Une autre solution basée sur regex:

>>> strs = "foo	bar		spam" >>> r = re.compile(r'([^	]*)	*') >>> r.findall(strs)[:-1] ['foo', 'bar', 'spam']

Sylvain Leroux · Answer

Python prend en charge les fichiers CSV dans le module éponyme csv . Il est relativement mal nommé car il supporte bien plus que juste des valeurs séparées par des virgules .

Si vous avez besoin d'aller au-delà du fractionnement de base de Word, vous devriez jeter un coup d'œil. Dites, par exemple, parce que vous avez besoin de traiter avec les valeurs citées ...