web-dev-qa-db-fra.com

Comment créer un graphique à barres empilées pour mon DataFrame à l'aide de seaborn?

J'ai un DataFrame df:

df = pd.DataFrame(columns=["App","Feature1", "Feature2","Feature3",
                           "Feature4","Feature5",
                           "Feature6","Feature7","Feature8"], 
                  data=[["SHA",0,0,1,1,1,0,1,0],
                        ["LHA",1,0,1,1,0,1,1,0],
                        ["DRA",0,0,0,0,0,0,1,0],
                        ["FRA",1,0,1,1,1,0,1,1],
                        ["BRU",0,0,1,0,1,0,0,0],
                        ["PAR",0,1,1,1,1,0,1,0],
                        ["AER",0,0,1,1,0,1,1,0],
                        ["SHE",0,0,0,1,0,0,1,0]])

Je veux créer un graphique à barres empilées de sorte que chaque pile corresponde à App alors que l'axe des Y contiendrait le nombre de 1 valeurs et l’axe X seraient Feature.

Il devrait ressembler à ce graphique à barres avec la seule différence que maintenant je veux voir des barres de pile et une légende avec des couleurs:

df_c = df.iloc[:, 1:].eq(1).sum().rename_axis('Feature').reset_index(name='Cou‌​nt')
df_c = df_c.sort_values('Count')

plt.figure(figsize=(12,8))
ax = sns.barplot(x="Feature", y="Count", data=df_c, palette=sns.color_palette("GnBu", 10))
plt.xticks(rotation='vertical')
ax.grid(b=True, which='major', color='#d3d3d3', linewidth=1.0)
ax.grid(b=True, which='minor', color='#d3d3d3', linewidth=0.5)
plt.show()
14
Dinosaurius

Vous pouvez utiliser pandas) comme le suggère @Bharath:

import seaborn as sns
sns.set()
df.set_index('App').T.plot(kind='bar', stacked=True)

Sortie:

enter image description here

Mis à jour:

depuis matplotlib.colors import ListedColormap df.set_index ('App')\.reindex_axis (df.set_index ('App'). sum (). sort_values ​​(). index, axis = 1)\.T.plot (kind = ' bar ', stacked = True, palette de couleurs = ListedColormap (sns.color_palette ("GnBu", 10)), figsize = (12,6))

Mis à jour Pandas 0.21.0+ reindex_axis est obsolète, utilisez reindex

from matplotlib.colors import ListedColormap
    df.set_index('App')\
      .reindex(df.set_index('App').sum().sort_values().index, axis=1)\
      .T.plot(kind='bar', stacked=True,
              colormap=ListedColormap(sns.color_palette("GnBu", 10)), 
              figsize=(12,6))

Sortie:

enter image description here

34
Scott Boston