我一直在尝试寻找变量的均值,但是当我运行代码时,它说:“最大对象的长度不是最小对象长度的倍数。”
以下是问题的陈述:“在经历至少一次暗杀企图的国家中,平均每年暗杀企图为多少?
以下是所需的数据集:领导者https://raw.githubusercontent.com/umbertomig/intro-prob-stat-FGV/master/datasets/leaders.csv”)
这是我使用的代码:
avrn$avrnbr <- as.numeric(leaders$result == "wounded lightly","dies within a day after the attack",
"dies between a day and a week", "dies between a week and a month",
"dies, timing unknown", "survives, whether wounded unknown",
"not wounded",
"plot stopped",
"hospitalization but no permanent disability",
leaders$year == 1878:2001)
我试图创建一个变量来衡量每年的暗杀次数。
数据集包含有关特定国家/地区领导人之间暗杀企图的信息。从1878年到2001年的124年间,共有250条记录。
您的问题:“在经历至少一次暗杀尝试的国家中,平均每年暗杀尝试次数是多少?”
根据定义,此数据集中的每个国家都经历了至少1次暗杀企图。因此,无需子集或过滤。您也不必像过去那样过滤年份。我们只需要计算暗杀尝试的总数(250)除以数据的年数(124)。 答案:2。
好奇心使我变得更好。哪些国家的领导人最受欢迎?
library(dplyr)
count(leaders, country) %>% arrange(-n)
# A tibble: 88 x 2
country n
<chr> <int>
1 Japan 11
2 Mexico 11
3 France 10
4 Russia 10
5 United States 8
6 Guatemala 7
7 Egypt 6
8 Iran 6
9 Italy 6
10 Argentina 5
# ... with 78 more rows