我有一个 ags 格式的混乱文件,我想通过在所有类似的“ MBH02”,整个文件中的“MBH 03”)。
我有几千个ags文件需要处理,有没有办法一次性搞定?
难度一: 每组中的标题(以空白行为界)不在一行中,我尝试使用熊猫但我不知道如何将两行作为一个标题读取。
难度2: 并不是所有的数据组都包含两行作为标题,大多数都是单行作为标题
难度三:
最终目标:
像这样将数据组正确读入数据框:
HOLE_ID | 其他属性 |
---|---|
MBH 02 | ... |
MBH 03 | ... |
然后像这样重写 HOLE_ID(不改变文件中凌乱的结构):
HOLE_ID | 其他属性 |
---|---|
12345/MBH 02 | ... |
12345/MBH 03 | ... |