我有一个火花数据框,其中包含列ID,类别,时间戳,价格列。我想按客户ID对数据进行分组,按时间戳对类别进行分类,并获得每个组中的最后n行。
我尝试了下面的代码,但是它只调整了3行以获取整体数据。a <- data1 %>% dplyr::group_by(customer_id, category) %>% dplyr::arrange(dplyr::desc(timestamp)) %>% head(., n = 3)
请提出有效的解决方案
没有示例数据,我们不知道这是否行得通。
在Base R
中
data1 <- data1[order(data1$timestamp),]
lapply(split(data1,data1$customer_ID), tail, n=5)