数据集用法和变量选择

问题描述 投票:-1回答:1

我上传了数据集。但是我该如何向那些在欧洲死亡的人展示。

df <- read.csv ('https://raw.githubusercontent.com/ulklc/covid19-timeseries/master/countryReport/raw/rawReport.csv')

europe <-- df[df$region =="Europe"]

df$death [europe]

r
1个回答
0
投票

我们只能过滤欧洲国家,并按国家/地区计算死亡人数。

这可以在基数R中完成:

df1 <- aggregate(death~countryName, subset(df, region =="Europe"), sum)

dplyr

library(dplyr)
df1 <- df %>% 
        filter(region == 'Europe') %>% 
        group_by(countryName) %>% 
        summarise(total_death = sum(death))

data.table中>

df1 <- setDT(df)[region == 'Europe', (total_death = sum(death)), countryName]
© www.soinside.com 2019 - 2024. All rights reserved.