我知道如何添加列,但我不明白说明在问我什么,所以我将它们发布在下面。
这是名为 Example.Data
的数据集我需要将包含这些规则的新列添加到我现有的数据集中
12 <= Educ < 16: “HighSchool”
16 <= Educ < 17: “College”
17 <= Educ < 19: “Masters”
Educ >= 19: “Doctorate”```
Income Career Age Sex Married
1. 39540 Lawyer 20 F N
2. 45098 Teacher 65 F y
3. 54565 Doctor 45 M y
4. 48356 Teacher 26 M N
5. 68959 Nurse 32 F y
6. 98459 Lawyer 34 F Y
7. 34343 Nurse 49 M N
我假设有一列名为“Educ”的数据你还没有包含(仅使用前四行):
收入 | 职业生涯 | 年龄 | 性 | 已婚 | 教育 |
---|---|---|---|---|---|
39540 | 律师 | 20 | F | N | 18 |
45098 | 老师 | 65 | F | 是 | 15 |
54565 | 医生 | 45 | M | 是 | 22 |
48356 | 老师 | 26 | M | N | 16 |
代码:
Example.Data$Degree = ""
Example.Data[Example.Data$Edu>=12 & Example.Data$Edu<16,"Degree"] = "HighSchool"
Example.Data[Example.Data$Edu>=16 & Example.Data$Edu<17,"Degree"] = "College"
Example.Data[Example.Data$Edu>=17& Example.Data$Edu<19,"Degree"] = "Masters"
Example.Data[Example.Data$Edu>=19,"Degree"] = "Doctorate"
View(Example.Data)
结果:
收入 | 职业生涯 | 年龄 | 性 | 已婚 | 教育 | 学位 |
---|---|---|---|---|---|---|
39540 | 律师 | 20 | F | N | 18 | 大师 |
45098 | 老师 | 65 | F | 是 | 15 | 高中 |
54565 | 医生 | 45 | M | 是 | 22 | 博士学位 |
48356 | 老师 | 26 | M | N | 16 | 大学 |
有更优雅的方法可以做到这一点,但这是基础 R,并且非常清楚你在做什么!