解析多个制表符和空格分隔并获取 2 行以“排列”起来

问题描述 投票:0回答:0

我生成了一个有点乱的文件,它只是将所有内容都转储到 HTML

<pre>
标签中 and 决定将标题分成两行。我是 Python 和正则表达式的新手,无法找到一种方法将这两行正确合并为一行,以便将列标题放在一行上并匹配,最终目标是将整个文件解析为字段。

这是它在网络上的外观示例:

我想要做的是将字段匹配成一行。例如,如果我只是去掉多余的空间,“时钟”将与 Finisher 而不是 Time 匹配。我想要的是:

ID# |地点 |上课地点 |终结者 |时钟时间 |净时间 |步伐

这是实际的 HTML:

</B>             CLASS                                            CLOCK       NET    
  ID#  PLACE PLACE         FINISHER                          TIME       TIME     PACE  

python regex html-parsing
© www.soinside.com 2019 - 2024. All rights reserved.