很抱歉,您没有发布数据,但并没有真正的帮助。事情是需要做一个图,我有一个csv文件,里面充满了按日期组织的信息。它具有“案例”,“死亡”,“恢复”,“严重”,“住院”,“国家”作为类别。它按日期顺序排列,并具有每个州每天的病例,死亡,恢复量。如何对这些类别求和以制作一个图表,显示总数如何增加?我真的不知道如何开始,所以我无法发布数据。下面是一些数字,试图解释我所拥有的。
0 2020-02-20 1 Andalucía NaN NaN NaN
1 2020-02-20 2 Aragón NaN NaN NaN
2 2020-02-20 3 Asturias NaN NaN NaN
3 2020-02-20 4 Baleares 1.0 NaN NaN
4 2020-02-20 5 Canarias 1.0 NaN NaN
.. ... ... ... ... ... ...
888 2020-04-06 19 Melilla 92.0 40.0 3.0
889 2020-04-06 14 Murcia 1283.0 500.0 84.0
890 2020-04-06 15 Navarra 3355.0 1488.0 124.0
891 2020-04-06 16 País Vasco 9021.0 4856.0 417.0
892 2020-04-06 17 La Rioja 2846.0 918.0 66.0
尚不清楚您对“类别总和”的确切含义。我假设您的意思是,对于每个日期,您想对所有不同区域的值求和以得出西班牙的总值?
在这种情况下,您想groupby
日期,然后是.sum()
列(可以删除States
类别。
grouped_df = df.groupby("date")["Cases", "Deaths", ...].sum()
grouped_df.set_index("date").plot()
此代码段可能无法直接使用,您可能需要重新格式化日期等。但是应该足以使您入门。