web-dev-qa-db-fra.com

Convertir une série de panda en tableau numpy

Je suis nouveau aux pandas et au python. Mes données d'entrée sont comme

category   text
1   hello iam fine. how are you
1   iam good. how are you doing.

inputData= pd.read_csv(Input', sep='\t', names=['category','text'])
X = inputData["text"]
Y = inputData["category"]

ici, Y est l’objet de la série panda, que je veux convertir en tableau numpy. donc j'ai essayé .as_matrix

YArray= Y.as_matrix(columns=None)
print YArray

Mais j’ai obtenu le résultat sous la forme [1,1] (ce qui est faux car je n’ai qu’une catégorie de colonne et deux lignes). Je veux le résultat sous forme de matrice 2x1.

12
vishnu

Essaye ça:
après avoir appliqué le .as_matrix sur votre objet de série 

Y.reshape((2,1))

Comme .as_matrix () ne retourne qu’un tableau numpy, PAS une matrice numpy . Lien ici

5
chetan reddy

Pour obtenir numpy tableau, vous avez besoin

Y.values
22
gzc

Si df est votre cadre de données, une colonne de celui-ci est une série et doit être convertie en tableau,

df = pd.DataFrame()
x = df.values
print(x.type)

Les tirages suivants,

<class 'numpy.ndarray'>

convertir avec succès en un tableau.

0
Akshaya Natarajan