web-dev-qa-db-fra.com

Plot pandas dates in matplotlib

J'ai un fichier de données à largeur fixe contenant des dates, mais lorsque j'essaie de tracer les données, les dates ne s'affichent pas correctement sur l'axe des x.

Mes fichiers ressemblent

2014-07-10 11:49:14.377102    45
2014-07-10 11:50:14.449150    45
2014-07-10 11:51:14.521168    21
2014-07-10 11:52:14.574241     8
2014-07-10 11:53:14.646137    11
2014-07-10 11:54:14.717688    14

etc

et j'utilise pandas pour lire le fichier

#! /usr/bin/env python
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_fwf('myfile.log',header=None,names=['time','amount'],widths=[27,5])
data.time = pd.to_datetime(data['time'], format='%Y-%m-%d %H:%M:%S.%f')
plt.plot(data.time,data.amount)
plt.show()

Je suppose donc que le problème ici est la conversion de pandas vers matplotlib datetime, comment ferait-on une conversion?

J'ai aussi essayé avec pandas directement:

data.time = pd.to_datetime(data['time'], format='%Y-%m-%d %H:%M:%S.%f')
data.set_index('time') # Fails!!
data.time.plot()

mais cela échoue avec

TypeError: 'Series' vide: aucune donnée numérique à tracer

17
Gerhard

Si vous utilisez une liste contenant le (s) nom (s) de colonne au lieu d'une chaîne, data.set_index fonctionnera

Ce qui suit devrait montrer les dates sur l'axe des x:

#! /usr/bin/env python
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_fwf('myfile.log',header=None,names=['time','amount'],widths=[27,5])
data.time = pd.to_datetime(data['time'], format='%Y-%m-%d %H:%M:%S.%f')
data.set_index(['time'],inplace=True)
data.plot()

#OR 
plt.plot(data.index, data.amount)
24
Osmond Bishop