df <- read.csv ('https://raw.githubusercontent.com/ulklc/covid19-timeseries/master/countryReport/raw/rawReport.csv')
df8 <- read.csv ('https://raw.githubusercontent.com/hirenvadher954/Worldometers-Scraping/master/countries.csv')
在第一个数据集中,有被划分为大洲的国家。
在第二个数据集中,有国家和人口信息。
如何根据数据集1中的大陆信息来组合数据集2中的人口信息。
使用dplyr软件包,您要做的就是通过一个公共变量(在本例中为国家/地区名称)进行联接。由于在一个数据框中该名称称为countryName
,而在另一个数据框中则称为country_name
,因此我们只需要指定它们实际上属于同一变量即可。
library(dplyr)
df %>%
left_join(df8, by = c("countryName" = "country_name"))