如何对多列进行分组并在熊猫中汇总数据

问题描述 投票:0回答:2

我有一个带有多列的熊猫数据框(words, start time, stop time, speaker:]]

  • 我想合并word列中的所有值,而data列中的值不变,或者meta_data列中的值不变。
  • 此外,我想在组合中保留第一个单词的start值和最后一个单词的stop值。
  • 我目前有:

      word  start  stop     data    meta_data  
0      but   2.72  2.85        2      9
1   that's   2.85  3.09        2      9
2  alright   3.09  3.47        2      1
3    we'll   8.43  8.69        1      4
4     have   8.69  8.97        1      4
5       to   8.97  9.07        1      4
6     okay   9.19 10.01        2      2
7     sure  10.02 11.01        2      1
8    what?  11.02 12.00        1      4

但是,我想将其转换为:

       word       start  start  data  meta_data
0  but that's      2.72   3.09     2    9
1  alright         3.09   3.47     2    1
2  we'll have to   8.43   9.07     1    4
3  okay            9.19  10.01     2    2
4  sure            10.02 11.01     2    1
5  what?           11.02 12.00     1    4

我有一个带有几列(单词,开始时间,停止时间,说话者的熊猫数据框:我想合并单词列中的所有值,而数据列中的值不改变或值...

python pandas pandas-groupby
2个回答
1
投票

这需要创建一个帮助键,然后我们shift + cumsum基于该键创建组密钥


1
投票

在这里做一些数学运算

© www.soinside.com 2019 - 2024. All rights reserved.