web-dev-qa-db-fra.com

Comment ajouter une nouvelle ligne à un tableau numpy vide

À l'aide de tableaux Python standard, je peux effectuer les opérations suivantes:

arr = []
arr.append([1,2,3])
arr.append([4,5,6])
# arr is now [[1,2,3],[4,5,6]]

Cependant, je ne peux pas faire la même chose numpy. Par exemple:

arr = np.array([])
arr = np.append(arr, np.array([1,2,3]))
arr = np.append(arr, np.array([4,5,6]))
# arr is now [1,2,3,4,5,6]

J'ai aussi regardé dans vstack, mais quand j'utilise vstack sur un tableau vide, j'ai:

ValueError: all the input array dimensions except for the concatenation axis must match exactly

Alors, comment puis-je ajouter une nouvelle ligne à un tableau vide numpy?

98
Tony Stark

Le moyen de "démarrer" le tableau que vous voulez est:

arr = np.empty((0,3), int)

Ce qui est un tableau vide mais il a la dimensionnalité appropriée.

>>> arr
array([], shape=(0, 3), dtype=int64)

Assurez-vous ensuite d'ajouter le long de l'axe 0:

arr = np.append(arr, np.array([[1,2,3]]), axis=0)
arr = np.append(arr, np.array([[4,5,6]]), axis=0)

Mais @jonrsharpe a raison. En fait, si vous souhaitez ajouter des éléments dans une boucle, il serait beaucoup plus rapide d’ajouter des éléments à une liste, comme dans votre premier exemple, puis de les convertir en tableau numpy à la fin, car vous n’utilisez pas réellement numpy. destiné pendant la boucle:

In [210]: %%timeit
   .....: l = []
   .....: for i in xrange(1000):
   .....:     l.append([3*i+1,3*i+2,3*i+3])
   .....: l = np.asarray(l)
   .....: 
1000 loops, best of 3: 1.18 ms per loop

In [211]: %%timeit
   .....: a = np.empty((0,3), int)
   .....: for i in xrange(1000):
   .....:     a = np.append(a, 3*i+np.array([[1,2,3]]), 0)
   .....: 
100 loops, best of 3: 18.5 ms per loop

In [214]: np.allclose(a, l)
Out[214]: True

La façon numpythonique de le faire dépend de votre application, mais ce serait plutôt comme:

In [220]: timeit n = np.arange(1,3001).reshape(1000,3)
100000 loops, best of 3: 5.93 µs per loop

In [221]: np.allclose(a, n)
Out[221]: True
142
askewchan

Dans ce cas, vous pouvez utiliser les fonctions np.hstack et np.vstack

arr = np.array([])
arr = np.hstack((arr, np.array([1,2,3])))
# arr is now [1,2,3]

arr = np.vstack((arr, np.array([4,5,6])))
# arr is now [[1,2,3],[4,5,6]]

Vous pouvez également utiliser la fonction np.concatenate.

À votre santé

21
mrcl

Voici ma solution:

arr = []
arr.append([1,2,3])
arr.append([4,5,6])
np_arr = np.array(arr)
17
just4fun

en utilisant une définition de type personnalisée, ce qui a fonctionné pour moi était:

import numpy

# define custom dtype
type1 = numpy.dtype([('freq', numpy.float64, 1), ('amplitude', numpy.float64, 1)])
# declare empty array, zero rows but one column
arr = numpy.empty([0,1],dtype=type1)
# store row data, maybe inside a loop
row = numpy.array([(0.0001, 0.002)], dtype=type1)
# append row to the main array
arr = numpy.row_stack((arr, row))
# print values stored in the row 0
print float(arr[0]['freq'])
print float(arr[0]['amplitude'])
1
boclodoa

Je veux faire une boucle for, mais avec la méthode de askewchan, cela ne fonctionne pas bien, donc je l'ai modifiée.

x=np.empty((0,3))
y=np.array([1 2 3])
for i in ...
x = vstack((x,y))
0
Qingdong Wang

Si vous ajoutez de nouvelles lignes pour array in loop, assignez le tableau directement pour la première entrée en boucle au lieu d'initialiser un tableau vide.

for i in range(0,len(0,100)):
    SOMECALCULATEDARRAY = .......
    if(i==0):
        finalArrayCollection = SOMECALCULATEDARRAY
    else:
        finalArrayCollection = np.vstack(finalArrayCollection,SOMECALCULATEDARRAY)

Ceci est principalement utile lorsque la forme du tableau est inconnue

0
Rajesh_Saladi