我有一份学生名单,我需要查看其中有多少学生转学到不同的学院。
第一个条目代表学生的 "母校",如果学院条目在所有学期都保持不变,那么该学生没有转学。如果其中一个学期的学院是不同的,那么学生就没有转学。我希望将Transfer设置为一个二分变量(0,1)。
这是我的试验数据。
Semester <-c(1,2,3,4,5,1,2,3,4,1,2,3,4,5,1,2,3,1,2,1,2,1,2,3,4,5,1,2,3,4,5,6,1,2,3,4,1,2,3,4)
Student <- rep(c("A","B","C","D","E","F","G","H","I","J"),c(5,4,5,3,2,2,5,6,4,4))
College <- rep(c("ATC","CCTC","DTC","FDTC","GTC","HGTC","MTC","NETC"),c(5,6,4,5,6,4,5,5))
test.dat1 <- cbind(Semester,Student, College)
我需要做一个表,看起来像下面的:-。
您的帮助是非常感激的
会 group_by
每个学生,然后认为母校是该学生的第一所大学。
调剂栏将是母校和新校是否不同的数字逻辑结果。
编辑: 如果有多所大学就读,新学校是指与母校不同的第一所就读学校。
library(tidyverse)
test.dat1 %>%
as.data.frame() %>%
group_by(Student) %>%
summarise(Home_School = first(College),
New_School = if_else(n_distinct(College) > 1, first(College[College != first(College)]), Home_School),
Transfer = +(Home_School != New_School))
輸出
# A tibble: 10 x 4
Student Home_School New_School Transfer
<fct> <fct> <fct> <int>
1 A ATC ATC 0
2 B CCTC CCTC 0
3 C CCTC DTC 1
4 D DTC FDTC 1
5 E FDTC FDTC 0
6 F FDTC GTC 1
7 G GTC GTC 0
8 H HGTC MTC 1
9 I MTC NETC 1
10 J NETC NETC 0