Analyser un fichier délimité par des tabulations dans des listes ou des chaînes séparées

Question

J'essaie de prendre un fichier délimité par des tabulations avec deux colonnes, Name et Age, qui se lit comme suit:

'Nom Age Marque 32 Mat 29 John 67 Jason 45 Mat 12 Frank 11 Frank 34 Frank 65 Frank 78 '

Et créez simplement deux listes, une avec des noms (appelés noms, sans en-tête) et une avec les âges (appelée âges, mais sans âges dans la liste).

unutbu · Answer

En utilisant le module csv , vous pouvez faire quelque chose comme ceci:

import csv names=[] ages=[] with open('data.csv','r') as f: next(f) # skip headings reader=csv.reader(f,delimiter='	') for name,age in reader: names.append(name) ages.append(age) print(names) # ('Mark', 'Matt', 'John', 'Jason', 'Matt', 'Frank', 'Frank', 'Frank', 'Frank') print(ages) # ('32', '29', '67', '45', '12', '11', '34', '65', '78')

SingleNegationElimination · Answer

les données délimitées par des tabulations sont dans le domaine du module csv:

>>> corpus = 'Name	Age
Mark	32
Matt	29
John	67
Jason	45
Matt	12
Frank	11
Frank	34
Frank	65
Frank	78
' >>> import StringIO >>> infile = StringIO.StringIO(corpus)

prétendre que infile était juste un file... régulier.

>>> import csv >>> r = csv.DictReader(infile, ... dialect=csv.Sniffer().sniff(infile.read(1000))) >>> infile.seek(0)

vous n'avez même pas besoin de dire au module csv les en-têtes et le format du délimiteur, ça va s'en sortir

>>> names, ages = [],[] >>> for row in r: ... names.append(row['Name']) ... ages.append(row['Age']) ... >>> names ['Mark', 'Matt', 'John', 'Jason', 'Matt', 'Frank', 'Frank', 'Frank', 'Frank'] >>> ages ['32', '29', '67', '45', '12', '11', '34', '65', '78'] >>>

David Wolever · Answer

J'utiliserais les méthodes split et splitlines de chaînes:

names = [] ages = [] for name_age in input.splitlines(): name, age = name_age.strip().split("	") names.append(name) ages.append(age)

Si vous analysiez un format plus complexe, je suggérerais d'utiliser le module csv , qui peut également gérer tsv… Mais il semble que ce serait un peu excessif ici.

marvin · Answer

La réponse de Unutbu compressée à l'aide d'une liste de compréhension:

names = [x[0] for x in csv.reader(open(filename,'r'),delimiter='	')] ages = [x[1] for x in csv.reader(open(filename,'r'),delimiter='	')]

StevenWernerCS · Answer

la réponse de Marvin mais sans lire le fichier en entier deux fois

data = [ (x[0],x[1]) for x in csv.reader(open(filename,'r'),delimiter='	')]

Si vous êtes d'accord avec le fait qu'il s'agisse de tuples, au lieu de deux listes

vous pouvez toujours lire les données dans deux listes en un seul passage et ce serait la réponse de UnuBu