这里是我的查询,因为我还没有找到合适的答案。我有一个数据集,描述了13年跨丹麦城市之间流动人口总数的所有组合。
[我想得到的是一年中所有市政组合之间的移动总和。
请参见下面的代码:
library("tidyverse")
library("statsDK")
# GETTING DATA FROM DANISH ARCHIVES
fly66_0 <- retrieve_data("FLY66", ALDER = "0")
fly66_1 <- retrieve_data("FLY66", ALDER = "1")
fly66_2 <- retrieve_data("FLY66", ALDER = "2")
fly66_3 <- retrieve_data("FLY66", ALDER = "3")
fly66_4 <- retrieve_data("FLY66", ALDER = "4")
fly66_5 <- retrieve_data("FLY66", ALDER = "5")
fly_66 <- rbind(fly66_0, fly66_1, fly66_2, fly66_3, fly66_4, fly66_5)
fly_66 <- fly_66 %>%
group_by(TO_muni, FROM_muni, YEAR) %>%
summarise(Number = sum(Number))
这将产生下表(我将列名更改为英语):
# A tibble: 6 x 4
# Groups: TILKOMMUNE, FRAKOMMUNE [3]
TO_muni FROM_muni YEAR Number
<chr> <chr> <dbl> <dbl>
1 101 202 2006 1
2 101 202 2007 3
3 202 101 2006 2
4 202 101 2007 3
5 101 303 2006 2
6 303 101 2007 1
但是我想要的是类似的东西:
# A tibble: 6 x 4
# Groups: TILKOMMUNE, FRAKOMMUNE [3]
TO_muni FROM_muni YEAR Number
<chr> <chr> <dbl> <dbl>
1 101 202 2006 -1
2 101 202 2007 0
3 202 101 2006 1
4 202 101 2007 0
5 101 303 2006 2
6 303 101 2006 -2
5 101 303 2007 -1
6 303 101 2007 1
我已经尝试过以下方法,但是我感觉不多:
library("reshape2")
fly_66 <- fly_66 %>%
dcast(TO_muni + YEAR ~ FROM_muni, value.var = "YEAR", fill = 0)
希望有道理,并提前致谢。