web-dev-qa-db-fra.com

convertir un tableau numpy en 0 ou 1

A = np.array([[0.94366988, 0.86095311, 0.88896715, 0.93630641, 0.74075403, 0.52849619
                  , 0.03094677, 0.85707681, 0.88457925, 0.67279696, 0.26601085, 0.4823794
                  , 0.74741157, 0.78575729, 0.00978911, 0.9203284, 0.02453695, 0.84884703
                  , 0.2050248, 0.03703224, 0.92931392, 0.11930532, 0.01411064, 0.7832698
                  , 0.58188015, 0.66897565, 0.75119007, 0.01323558, 0.03402649, 0.99735115
                  , 0.21031727, 0.78123225, 0.6815842, 0.46647604, 0.66323375, 0.03424828
                  , 0.08031627, 0.76570656, 0.34760863, 0.06177743, 0.6987531, 0.4106426
                  , 0.6648871, 0.02776868, 0.93053125, 0.46395717, 0.23971605, 0.9771735
                  , 0.66202407, 0.10482388]])

Convertir les entrées de a en 0 (si activation <= 0,5) ou 1 (si activation> 0,5)

for i in range(A.shape[1]):
if A[i]>0.5:
    Y_prediction[i] = 1
else:
    Y_prediction[i] = 0

ValueError: la valeur de vérité d'un tableau avec plusieurs éléments est ambiguë. Utilisez a.any () ou a.all ()

Et comment utiliser vectoriser ce thx

14
Ryan Wang

Je pense que vous avez besoin d'une fonction vectorisée np.where :

B = np.where(A > 0.5, 1, 0)
print (B)
[[1 1 1 1 1 1 0 1 1 1 0 0 1 1 0 1 0 1 0 0 1 0 0 1 1 1 1 0 0 1 0 1 1 0 1 0 0
  1 0 0 1 0 1 0 1 0 0 1 1 0]]

B = np.where(A <= 0.5, 0, 1)
print (B)
[[1 1 1 1 1 1 0 1 1 1 0 0 1 1 0 1 0 1 0 0 1 0 0 1 1 1 1 0 0 1 0 1 1 0 1 0 0
  1 0 0 1 0 1 0 1 0 0 1 1 0]]

Mais mieux vaut solution holdenweb si besoin convertir en 0 et 1 seulement.

np.where est meilleur si besoin de convertir en un autre scalaire comme 5 et 10 ou a et b:

C = np.where(A > 0.5, 5, 10)
print (C)
[[ 5  5  5  5  5  5 10  5  5  5 10 10  5  5 10  5 10  5 10 10  5 10 10  5
   5  5  5 10 10  5 10  5  5 10  5 10 10  5 10 10  5 10  5 10  5 10 10  5
   5 10]]

D = np.where(A > 0.5, 'a', 'b')
print (D)
[['a' 'a' 'a' 'a' 'a' 'a' 'b' 'a' 'a' 'a' 'b' 'b' 'a' 'a' 'b' 'a' 'b' 'a'
  'b' 'b' 'a' 'b' 'b' 'a' 'a' 'a' 'a' 'b' 'b' 'a' 'b' 'a' 'a' 'b' 'a' 'b'
  'b' 'a' 'b' 'b' 'a' 'b' 'a' 'b' 'a' 'b' 'b' 'a' 'a' 'b']]

Timings :

np.random.seed(223)
A = np.random.Rand(1,1000000)

#jez
In [64]: %timeit np.where(A > 0.5, 1, 0)
100 loops, best of 3: 7.58 ms per loop

#holdenweb
In [65]: %timeit (A > 0.5).astype(int)
100 loops, best of 3: 3.47 ms per loop

#stamaimer
In [66]: %timeit element_wise_round(A)
1 loop, best of 3: 318 ms per loop
31
jezrael

La diffusion standard numpy peut être utilisée pour comparer chaque élément avec une valeur scalaire, produisant un booléen pour chaque élément. Le ndarray.astype convertit ensuite les valeurs True en 1 et les valeurs False en zéro.

In [16]: (A > 0.5).astype(int)
Out[16]:
array([[1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 1, 0, 0, 1, 0,
        0, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0,
        1, 0, 0, 1, 1, 0]])
11
holdenweb
np.random.seed(223)
A = np.random.Rand(1000000)
A = [0 if i <=0.5 else 1 for i in A]
1
Tkanno

Le problème avec votre code est la dimension de A [i] dans votre code. A est initialisé comme matrice [1, n] (1 ligne et n colonnes - vous avez des crochets [[]] doubles dans np.array ([[]])), donc votre référence de type A [i] signifie en fait "la toute la ième ligne, ou un tableau (n) dans ce cas). Je suis assez nouveau pour python et numpy, mais pour accéder aux cellules individuelles et les régler sur 1 ou 0, cela peut être codé de cette façon (bien sûr, seulement si vous êtes obligé d'utiliser des boucles FOR ici):

 for i in range(A.shape[1]):
 if A[0,i]>0.5:
    Y_prediction[0,i] = 1
 else:
    Y_prediction[0,i] = 0

Mais, certainement, la meilleure solution, comme d'autres décrites ci-dessus, est d'éviter la boucle.

1

Vous pouvez faire en sorte que la fonction intégrée round soit utilisée de manière rationnelle np.vectorize.

import numpy as np

element_wise_round = np.vectorize(round, otypes=[np.int])

print element_wise_round(A)
0
stamaimer