如何使用Talend数据准备删除重复项?

问题描述 投票:0回答:1

我想通过Talend Data Preparation删除重复项,并且有一列名为:HOURS,我想计算它们之间的时间,并删除电子邮件和姓名重复项,这是我的表格示例:

enter image description here

您可以看到我有很多用户名和电子邮件,但是我的工作时间并不相同,我想根据用户名和电子邮件将我的时间加在一起,并删除同一用户名和电子邮件的所有重复项时间。

talend
1个回答
0
投票

(我不是真的很喜欢数据准备,所以也许有一个我不了解的内部解决方案。

我认为您在Talend Data Preparation中不能通过SUM操作使用GROUP BY,因为该工具只能纠正数据行,而不能进行聚合操作。

从数据准备中导出校正后的数据后,您就可以在Talend Data Integration中使用tAggregateRow对数据求和。

© www.soinside.com 2019 - 2024. All rights reserved.