web-dev-qa-db-fra.com

Les pandas Python ajoutent une colonne pour la valeur maximale par rangée des colonnes sélectionnées

data = {'name' : ['bill', 'joe', 'steve'],
    'test1' : [85, 75, 85],
    'test2' : [35, 45, 83],
     'test3' : [51, 61, 45]}
frame = pd.DataFrame(data)

Je voudrais ajouter une nouvelle colonne qui indique la valeur maximale pour chaque ligne.

sortie désirée:

 name test1 test2 test3 HighScore
 bill  75    75    85    85
 joe   35    45    83    83 
 steve  51   61    45    61 

Parfois  

frame['HighScore'] = max(data['test1'], data['test2'], data['test3'])

fonctionne mais donne la plupart du temps cette erreur:

ValueError: La valeur de vérité d'un tableau comportant plusieurs éléments est ambiguë. Utilisez a.any () ou a.all ()

Pourquoi ça marche seulement parfois? Y a-t-il une autre façon de le faire?

60
user2333196
>>> frame['HighScore'] = frame[['test1','test2','test3']].max(axis=1)
>>> frame
    name  test1  test2  test3  HighScore
0   bill     85     35     51         85
1    joe     75     45     61         75
2  steve     85     83     45         85
98
Roman Pekar
>>> frame['HighScore'] = frame[['test1','test2','test3']].apply(max, axis=1)
>>> frame
    name  test1  test2  test3  HighScore
0   bill     85     35     51        85
1    joe     75     45     61        75
2  steve     85     83     45        85
12
alko

si une valeur max ou min entre plusieurs colonnes d'une df doit être déterminée, utilisez:

df['Z']=df[['A','B','C']].apply(np.max,axis=1)
0
Vikas goel