我有一个由66个国家(按4个地理区域分组)和16年的面板数据集。
我想绘制我的因变量(FDI净流量)的超时趋势,但是由于我有太多的国家,所以我只想显示这些国家的代表性样本。同样,我想排除一些国家,或者仅列出外国直接投资最高的国家和外国直接投资最低的国家。]
你知道我该怎么办吗?
这是我的数据库
enter image description here我已经尝试过使用某些代码来排除某些国家/地区,但它们不起作用(我希望直接创建一个子集)
graph <- ggplot(data = na.omit(compdata), aes(x = time, y = lnfdinet, group = country), na.rm=TRUE)
graph + geom_line(na.rm = TRUE) + aes(color=namegeozone)
graph %+% subset(compdata, country %in% c("ALB"))
或
ggplot(data=compdata, aes(time, lnfdinet, group=country, colour=country)) + geom_line(data=function(x){x[!x$country %in% c("ALB", "ARG"), ]}, alpha=0.5)
为什么在绘制之前不提供子集数据??
类似
Dt=subset(compdata, country %in% c("ALB"))
并将dt传递到ggplot
一旦创建了ggplot
,由于该对象不再是数据帧,因此应用的子设置逻辑将不起作用。