如果我将条件应用于特定年份,如何从面板数据集中删除多年的重复值?

问题描述 投票:0回答:1

我有看起来像这样的面板数据集 -

CompanyName  Industry  Year   Sales   Assets...
A             Gas      2015   150     900
A             Gas      2016   100     1,000
A             Gas      2017   107     1,500
B             Gas      2015   90      900
B             Gas      2016   100     1,000
B             Gas      2017   99      1,500

我想创建一个有条件的子集 - 如果2017年的销售额大于100,那么我想从我的小组中删除相应的公司多年。

我试图创建一个过滤条件并创建一个新的数据集但是,我无法在多年内删除这些公司。

子集(数据,数据$年== 2017年和数据$销售> 100)

我试图找到一种方法来删除我从上述条件中获得的公司多年来创建一个平衡的面板

r filtering subset tidyr panel-data
1个回答
0
投票

一种选择是

subset(data, !CompanyName %in% unique(CompanyName[Sales[Year == 2017] > 100]))

或者它可以写成

subset(data, !CompanyName %in% unique(CompanyName[Year == 2017 & Sales > 100]))
© www.soinside.com 2019 - 2024. All rights reserved.