所以我想构建一个箱线图(最好使用seaborn,但你可以使用任何库),x 上有“county_name”,y 上有“deaths”,这是数据框:
deaths cases
country_name
Austria 609 84909
Belgium 853 66573
Bulgaria 1951 60310
Croatia 863 51483
Cyprus 78 23391
Czechia 2412 108071
Denmark 94 40406
Estonia 208 20884
Finland 66 22581
France 7938 951817
Germany 4886 500498
Greece 2265 127250
Hungary 3985 125906
Iceland 1 1486
Ireland 175 52376
Italy 9282 552558
Latvia 304 21478
Liechtenstein 0 258
Lithuania 439 36487
Luxembourg 51 5212
Malta 48 3980
Netherlands 749 275044
Norway 5 17713
Poland 11166 399129
Portugal 420 77958
Romania 4505 107550
Slovakia 1433 59812
Slovenia 274 30183
Spain 69299 3119260
Sweden 435 74259
我使用的代码是
holGROUPED = hol.groupby(hol['country_name']).agg({'deaths': 'sum', 'cases': 'sum'})
对特定日期内出现死亡和病例的国家进行分组
然后我这样做了:
sns.boxplot(data = holGROUPED, x = 'country_name', y = 'deaths')
尝试对数据集进行箱线图(每个国家/地区必须有不同的框),但我收到错误:
ValueError: Could not interpret input 'country_name'
有人可以帮我组织箱线图并提供如何使用字符串作为 x 轴在一张图中构建多个箱线图的建议吗?
将解决方案从评论迁移到答案:
当您执行
时,groupby
会移至索引。因此,将 x 值更改为countries
应该可以工作x = holGROUPED.index
– Redox 2023 年 10 月 4 日 10:00