根据日期,周,月获取平均数据

问题描述 投票:1回答:1

我有一个数据集,其中包含工厂工人产出的三年数据。现在,我想获取基于日期,星期,月份的平均输出。问题在于日期格式类似于%d。%m。%Y(日-月-年)。我的问题是如何在获取预期输出的同时保持日期格式不变。

我的数据集就是这样(每天有很多值。)

date         output 
17.1.2017    256
17.1.2017    261
18.1.2017    193
18.1.2017    462
....


1.3.2018    360

我收到这样的错误消息:时间数据'2017-01-01'与格式'%d。%m。%Y'(匹配)不匹配。仅供参考,当我读取数据集时,我的代码是这样的

df['date'] = pd.to_datetime(df['date'],format='%d.%m.%Y').dt.date
df.groupby(['date'],as_index=False).mean()

我已经尝试通过谷歌搜索不同的解决方案来解决它。但是我无法获得预期的结果。日期和月份之间的输出完全混乱了。 2017年1月2日(2017年1月2日)被视为2017年2月1日,我该如何解决?谢谢!

python pandas numpy
1个回答
0
投票

您的代码似乎很好,并且实际上至少对于前四个数据记录来说效果很好。这里的问题是日期格式与您报告的错误不一致。就像其他人指出的那样,让大熊猫为您找出格式会解决问题,即df["date"]=pd.to_datetime(df["date"])。但是我只是觉得这有点棘手或危险。我建议您在对它们进行任何分析之前,先使用Python中的字符串操作统一日期格式。希望这会有所帮助。

© www.soinside.com 2019 - 2024. All rights reserved.