我生成了一个有点乱的文件,它只是将所有内容都转储到 HTML
<pre>
标签中 and 决定将标题分成两行。我是 Python 和正则表达式的新手,无法找到一种方法将这两行正确合并为一行,以便将列标题放在一行上并匹配,最终目标是将整个文件解析为字段。
我想要做的是将字段匹配成一行。例如,如果我只是去掉多余的空间,“时钟”将与 Finisher 而不是 Time 匹配。我想要的是:
ID# |地点 |上课地点 |终结者 |时钟时间 |净时间 |步伐
这是实际的 HTML:
</B> CLASS CLOCK NET
ID# PLACE PLACE FINISHER TIME TIME PACE