我有一个包含数百万行的数据。我想在R中做一些数据操作
下图描述了这些条件。我希望最终结果存储在Result变量中。这里NA意味着不适用于这种逻辑。
Outputdata是我的最终数据集。创建一个新变量Result并根据以下条件插入值。
案例1:如果Lost = 1且PPP> = 0.8则结果= PPP案例2:如果Lost = 1且PPP <0.8则结果= 0.935294
此外,如果Result为非空白,则对这些行应用Case 2。如果Result由于先前的情况而具有值,则不要过度写入该值。
请帮我。 R对我来说很新鲜。
如果df
存储您的数据框(只需使用dplyr
包):
df %>% mutate(Result=ifelse( Lost==1 & PPP >=0.8, as.character(PPP), ifelse(Lost==1 & PPP<0.8,0.935294,NA ))