web-dev-qa-db-fra.com

Problèmes liés à l'utilisation de Keras np_utils.to_categorical

J'essaie de créer un tableau de vecteurs entiers à chaud dans un tableau de vecteurs à une main que keras pourra utiliser pour s'adapter à mon modèle. Voici la partie pertinente du code:

Y_train = np.hstack(np.asarray(dataframe.output_vector)).reshape(len(dataframe),len(output_cols))
dummy_y = np_utils.to_categorical(Y_train)

Ci-dessous, une image montrant ce que Y_train et dummy_y sont réellement.

Je n'ai trouvé aucune documentation pour to_categorical qui pourrait m'aider.

Merci d'avance.

5
Eduardo

np.utils.to_categorical est utilisé pour convertir un tableau de données étiquetées (de 0 à nb_classes-1) en un seul vecteur. 

Le doc officiel avec un exemple.

In [1]: from keras.utils import np_utils
Using Theano backend.

In [2]: np_utils.to_categorical?
Signature: np_utils.to_categorical(y, num_classes=None)
Docstring:
Convert class vector (integers from 0 to nb_classes) to binary class matrix, for use with categorical_crossentropy.

# Arguments
    y: class vector to be converted into a matrix
    nb_classes: total number of classes

# Returns
    A binary matrix representation of the input.
File:      /usr/local/lib/python3.5/dist-packages/keras/utils/np_utils.py
Type:      function

In [3]: y_train = [1, 0, 3, 4, 5, 0, 2, 1]

In [4]: """ Assuming the labeled dataset has total six classes (0 to 5), y_train is the true label array """

In [5]: np_utils.to_categorical(y_train, num_classes=6)
Out[5]:
array([[ 0.,  1.,  0.,  0.,  0.,  0.],
       [ 1.,  0.,  0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  1.,  0.,  0.],
       [ 0.,  0.,  0.,  0.,  1.,  0.],
       [ 0.,  0.,  0.,  0.,  0.,  1.],
       [ 1.,  0.,  0.,  0.,  0.,  0.],
       [ 0.,  0.,  1.,  0.,  0.,  0.],
       [ 0.,  1.,  0.,  0.,  0.,  0.]])
19
Amit Kushwaha
from keras.utils.np_utils import to_categorical

to_categorical(0, max_value_of_array)

Cela suppose que les valeurs de classe étaient dans une chaîne et que vous coderez leur libellé, en commençant à chaque fois de 0 à n-classes.

for the same example:- consider an array of {1,2,3,4,2}

The output will be [zero value, one value, two value, three value, four value]

array([[ 0.,  1.,  0., 0., 0.],
       [ 0.,  0.,  1., 0., 0.],
       [ 0.,  0.,  0., 1., 0.],
       [ 0.,  0.,  0., 0., 1.],
       [ 0.,  0.,  1., 0., 0.]],

Regardons un autre exemple: -

Again, for an array having 3 classes, Y = {4, 8, 9, 4, 9}

to_categorical(Y) will output

array([[0.,  0.,  0.,  0.,  1.,  0.,  0.,  0.,  0.,  0. ],
       [0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  1.,  0. ],
       [0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  1. ],
       [0.,  0.,  0.,  0.,  1.,  0.,  0.,  0.,  0.,  0. ],
       [0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  1. ]]
1
Pranzell