I have a dataframe,df
Index eventName Count pct
2017-08-09 ABC 24 95.00%
2017-08-09 CDE 140 98.50%
2017-08-10 DEF 200 50.00%
2017-08-11 CDE 150 99.30%
2017-08-11 CDE 150 99.30%
2017-08-16 DEF 200 50.00%
2017-08-17 DEF 200 50.00%
我希望通过计算列pct中的值来按每周每周发生一次分组。例如,我们现在有:
2017-08-09 has 2 values in pct column and 2017-08-16 has 1 value in pct, then we have Monday:3
2017-08-10 has 1 value and 2017-08-17 has 1 value,then we have Tuesday:2 and so on
那么结果数据框应如下所示:
Index Count
Monday 3
Tuesday 2
Wednesday 2
我已经尝试了df2=df.groupby(pd.Grouper(freq='D')).size().sort_values(ascending=False)
,但它没有在一周中的某一天进行分组而没有转换为日期索引到单词
温家宝对value_counts
的回答很好,但没有说明在NaN
专栏中pct
s的可能性。
假设Index
是索引,你可以调用groupby
+ count
-
df.index = pd.to_datetime(df.index)
df.groupby(df.index.weekday_name).pct.count()
Index
Friday 2
Thursday 2
Wednesday 3
Name: pct, dtype: int64
要在工作日排序,请转换为pd.Categorical
,如here所示。
通过使用value_counts
df.Index=pd.to_datetime(df.Index)
df.Index.dt.weekday_name.value_counts()
Out[994]:
Wednesday 3
Thursday 2
Friday 2
Name: Index, dtype: int64
您可以使用:
df.rename(columns={'Index': 'New_name'}, inplace=True)
df['New_name'] = pd.to_datetime(df['New_name'])
df['Day_df'] = df['New_name'].dt.weekday_name
df.groupby(['Day_df']).count()