我有一个 CSV 文件
我想将相似的 DeptID 分组在一起,并按升序对 MID 进行排序,并将最低 MID 的值分配给具有相似 DeptID 的 SID,使用 talend open studio 进行数据集成。如果有一个DeptID,则将MID的相同值分配给SID。
输入 CSV :
部门ID | SID | 学生姓名 | 中 |
---|---|---|---|
111 | 南希 | C1 | |
111 | 南希 | B1 | |
111 | 南希 | A1 | |
222 | 詹姆斯 | Z1 |
我使用 tFileInputDelimited 读取输入文件,我使用 tSortRow 对 MID 进行排序。我已经使用 tAggregateRow 对值进行分组。
我得到的输出为:
部门ID | SID | 学生姓名 | 中 |
---|---|---|---|
111 | 南希 | [A1,B1,C1] | |
222 | 詹姆斯 | [Z1] |
输出 CSV 应如下所示:
部门ID | SID | 学生姓名 | 中 |
---|---|---|---|
111 | A1 | 南希 | A1 |
111 | A1 | 南希 | B1 |
111 | A1 | 南希 | C1 |
222 | Z1 | 詹姆斯 | Z1 |