我有一个大约1300行的数据集,用于跟踪每个用户注册月份(每月)的每月登录次数,并且我试图绘制一个堆叠的区域图,其中每个系列/跟踪都是用户注册月份。 >
数据集如下所示:
------------------------------------------------------------------------------ user signup month | login month | monthly login count | cumulative login count ------------------------------------------------------------------------------ 2016-01 | 2016-01 | 50 | 50 2016-01 | 2016-02 | 25 | 75 2016-01 | 2016-03 | 15 | 90 ... 2019-05 | 2019-05 | 1000 | 1000 2019-05 | 2019-06 | 500 | 1500 ------------------------------------------------------------------------------
问题是,当我尝试在python笔记本中使用[]对其进行图形处理时>
x=data['login_month'] y=data['cumulative_login_count'] plt.figure(figsize=(20,10)) plt.stackplot(x,y, labels=['user_signup_month']) plt.legend(loc='upper left') plt.show()
它显示为一个系列,而不是期望的一个系列per
不同的用户注册月份。
我搜索过的所有示例均手动输入系列数据,例如:
data={'A': [-378, -2347, 509, 987, 513], 'B': [-527, -2599, 765, 533, 670], 'C': [-2343, -2273, 2093, 2197, 1990], 'D': [-1845, -1853, 3325, 1306, 2160]}
这对我来说是不切实际和不可持续的。
我对python可视化还很陌生,所以我不太确定哪个搜索词最有效,但是我发现“ python matlibplot多系列跟踪stackedplot”的结果仅引用了手动输入的上述解决方案系列数据
我有大约1300行的数据集,用于跟踪每个用户注册月份(每月)的每月登录次数,并且我试图用每个系列/迹线绘制堆叠的面积图……
您可以并且应该一直尝试给出并举例说明您的数据。它不需要充满,但具有代表性。例如:
signup login log_count
0 2016-01 2016-02 16
1 2016-01 2016-03 11
2 2016-01 2016-04 26
3 2016-01 2016-05 29
4 2016-02 2016-03 25
5 2016-02 2016-04 11
6 2016-02 2016-05 11
7 2016-03 2016-04 28
8 2016-03 2016-05 23
9 2016-04 2016-05 12