web-dev-qa-db-fra.com

Décomposition des éléments de tendance, de séries temporelles saisonnières et résiduelles

J'ai une DataFrame avec quelques séries chronologiques:

         divida    movav12       var  varmovav12
Date                                            
2004-01       0        NaN       NaN         NaN
2004-02       0        NaN       NaN         NaN
2004-03       0        NaN       NaN         NaN
2004-04      34        NaN       inf         NaN
2004-05      30        NaN -0.117647         NaN
2004-06      44        NaN  0.466667         NaN
2004-07      35        NaN -0.204545         NaN
2004-08      31        NaN -0.114286         NaN
2004-09      30        NaN -0.032258         NaN
2004-10      24        NaN -0.200000         NaN
2004-11      41        NaN  0.708333         NaN
2004-12      29  24.833333 -0.292683         NaN
2005-01      31  27.416667  0.068966    0.104027
2005-02      28  29.750000 -0.096774    0.085106
2005-03      27  32.000000 -0.035714    0.075630
2005-04      30  31.666667  0.111111   -0.010417
2005-05      31  31.750000  0.033333    0.002632
2005-06      39  31.333333  0.258065   -0.013123
2005-07      36  31.416667 -0.076923    0.002660

Je souhaite décomposer la première série temporelle divida de manière à pouvoir séparer sa tendance de ses composantes saisonnière et résiduelle.

J'ai trouvé une réponse ici et j'essaie d'utiliser le code suivant:

import statsmodels.api as sm

s=sm.tsa.seasonal_decompose(divida.divida)

Cependant, je continue à avoir cette erreur:

Traceback (most recent call last):
File "/Users/Pred_UnBR_Mod2.py", line 78, in <module> s=sm.tsa.seasonal_decompose(divida.divida)
File "/Library/Python/2.7/site-packages/statsmodels/tsa/seasonal.py", line 58, in seasonal_decompose _pandas_wrapper, pfreq = _maybe_get_pandas_wrapper_freq(x)
File "/Library/Python/2.7/site-packages/statsmodels/tsa/filters/_utils.py", line 46, in _maybe_get_pandas_wrapper_freq
freq = index.inferred_freq
AttributeError: 'Index' object has no attribute 'inferred_freq'

Quelqu'un peut-il éclairer un peu?

10
abutremutante

Fonctionne bien lorsque vous convertissez votre index en DateTimeIndex:

df.reset_index(inplace=True)
df['Date'] = pd.to_datetime(df['Date'])
df = df.set_index('Date')
s=sm.tsa.seasonal_decompose(df.divida)

<statsmodels.tsa.seasonal.DecomposeResult object at 0x110ec3710>

Accéder aux composants via:

s.resid
s.seasonal
s.trend
20
Stefan

Statsmodel décompose la série uniquement si vous fournissez une fréquence. En règle générale, toutes les séries chronologiques contiennent une fréquence, par exemple: jour, jours ouvrables, hebdomadaire. Vous pouvez supprimer cette erreur de deux manières:

  1. Ce que Stefan a fait, c'est qu'il a donné la colonne d'index à la fonction pandas DateTime. Il utilise la fonction interne infer_freq pour rechercher la fréquence et renvoyer l’index avec la fréquence.
  2. Sinon, vous pouvez définir la fréquence de votre colonne d'indexation comme suit: df.index.asfreq(freq='m'). Ici, m représente le mois. Vous pouvez définir la fréquence si vous avez une connaissance du domaine ou par d.
1

Faites simple:

Suivez les trois étapes suivantes:

df ['Date'] = pd.to_datetime (df ['Date'])

3-le décomposer en utilisant:

from statsmodels.tsa.seasonal import saisonnier_décompose decomposition = saisonnier_compose (ts_log)

Et enfin:----  enter image description here

0
Reeves