comment faire avancer la somme mobile dans les pandas?

Question

J'ai ce dataframe:

dates = pd.date_range(start='2016-01-01', periods=20, freq='d') df = pd.DataFrame({'A': [1] * 20 + [2] * 12 + [3] * 8, 'B': np.concatenate((dates, dates)), 'C': np.arange(40)})

J'ai trié la trame de données par date:

df.sort_values('B',inplace=True)

Je cherche à faire une somme glissante à terme à ce jour. Cependant, je ne peux faire qu'une somme glissante vers l'arrière en utilisant:

df.groupby('A').rolling(7, on='B',min_periods=0).C.sum() A B 1 2016-01-01 0.0 2016-01-02 1.0 2016-01-03 3.0 2016-01-04 6.0 2016-01-05 10.0 2016-01-06 15.0

Je veux faire une somme glissante.

jezrael · Accepted Answer

Je crois que j'ai besoin d'un changement de commande par iloc[::-1]:

df1 = (df.iloc[::-1] .groupby('A', sort=False) .rolling(7, on='B',min_periods=0).C .sum() .iloc[::-1])

piRSquared · Answer

Installer

dates = pd.date_range(start='2016-01-01', periods=20, freq='d') df = pd.DataFrame({'A': [1] * 20 + [2] * 12 + [3] * 8, 'B': np.concatenate((dates, dates)), 'C': np.arange(40)})

Trier par `'B'` puis quand on roule, inversez avec `iloc[::-1]`

def rev_roll(x): return x.iloc[::-1].rolling(7, min_periods=0).sum().iloc[::-1] df.assign(Roll=df.sort_values('B').groupby('A').C.transform(rev_roll))

Production

 A B C Roll 0 1 2016-01-01 0 21 1 1 2016-01-02 1 28 2 1 2016-01-03 2 35 3 1 2016-01-04 3 42 4 1 2016-01-05 4 49 5 1 2016-01-06 5 56 6 1 2016-01-07 6 63 7 1 2016-01-08 7 70 8 1 2016-01-09 8 77 9 1 2016-01-10 9 84 10 1 2016-01-11 10 91 11 1 2016-01-12 11 98 12 1 2016-01-13 12 105 13 1 2016-01-14 13 112 14 1 2016-01-15 14 99 15 1 2016-01-16 15 85 16 1 2016-01-17 16 70 17 1 2016-01-18 17 54 18 1 2016-01-19 18 37 19 1 2016-01-20 19 19 20 2 2016-01-01 20 161 21 2 2016-01-02 21 168 22 2 2016-01-03 22 175 23 2 2016-01-04 23 182 24 2 2016-01-05 24 189 25 2 2016-01-06 25 196 26 2 2016-01-07 26 171 27 2 2016-01-08 27 145 28 2 2016-01-09 28 118 29 2 2016-01-10 29 90 30 2 2016-01-11 30 61 31 2 2016-01-12 31 31 32 3 2016-01-13 32 245 33 3 2016-01-14 33 252 34 3 2016-01-15 34 219 35 3 2016-01-16 35 185 36 3 2016-01-17 36 150 37 3 2016-01-18 37 114 38 3 2016-01-19 38 77 39 3 2016-01-20 39 39

Toby Petty · Answer

Je pense que tu veux

df["C"] = df["A"].cumsum()

Voir la documentation ici

Idan Richman · Answer

Si vos dates ne sont pas complètement continues (comme si vous avez un ou deux jours manquants ici et là) et que vous souhaitez une fenêtre N-Days fixe (et non une fenêtre N-records), vous pouvez utiliser:

def forward_rolling_mean(sub_df, col='units', days_ahead=7): rolling_data = [sub_df[sub_df['date'].between(date+pd.Timedelta(days=1), date+pd.Timedelta(days=1+days_ahead-1))][col].mean() for date in sub_df['date']] return pd.DataFrame({'%s_next%idays_mean' % (col, days_ahead): rolling_data}, index=sub_df['date'])

vous pouvez également le modifier pour renvoyer une série au lieu d'une trame de données. plus tard, vous pouvez le joindre aux données d'origine.

comment faire avancer la somme mobile dans les pandas?

Installer

Trier par 'B' puis quand on roule, inversez avec iloc[::-1]

Production

Trier par `'B'` puis quand on roule, inversez avec `iloc[::-1]`