从文本文件中删除不符合条件的行

问题描述 投票:0回答:2

我有一个包含以下内容的文本文件:

========数据:00:05:08.627012 =========

1900-01-01 00:05:08.627012 ; 0 ; 1.16198 ; 10000000.0

1900-01-01 00:05:08.627012 ; 1 ; 1.16232 ; 10000000.0

=========数据:00:05:12.721536 =========

1900-01-01 00:05:08.627012 ; 0 ; 1.16198 ; 10000000.0

1900-01-01 00:05:12.721536 ; 0 ; 1.16209 ; 1000000.0

1900-01-01 00:05:08.627012 ; 1 ; 1.16232 ; 10000000.0

我试图将它转换为csv,其中每个项目在它进入自己的单元格后用分号。这是想要的结果的想法.enter image description here

我不想在文本文件中包含具有=符号的行。我目前正在使用以下代码:

txt_file = open('Data/Mkt_data_test.txt', 'r')
lines = txt_file.readlines()
txt_file.close()

header_line = ['Time,', 'Bid/Ask,', 'Price,', 'Volume,']

data_lines = []

for line in lines:
    if '=' not in line:
        time_data = line.split('\n')
        for time in time_data:
            data_lines.append(time+'\n')
            data_lines = [data.replace(';', ',') for data in data_lines]

finished_file = open('mktDataFormat.csv', 'w')
finished_file.writelines(header_line)
finished_file.writelines(data_lines)
finished_file.close()

这样可以正确地写入不包含等号的行,但是有空行,其中带有'='的行,并且文本文件中只有一个空行。 enter image description here

我怎样才能摆脱那些空白线?

python
2个回答
0
投票

您的问题是您的程序没有跳过空行,因此将空行视为数据。我添加了一张支票(稍微改了一下你的代码),以确保没有空白行。

txt_file = open('Data/Mkt_data_test.txt', 'r')
lines = txt_file.readlines()
txt_file.close()

header_line = ['Time,', 'Bid/Ask,', 'Price,', 'Volume,\n']

data_lines = []

for line in lines:
    if '=' not in line and line.strip() != "":
        line = line.replace(';', ',')
        data_lines.append(line)

 finished_file = open('mktDataFormat.csv', 'w')
 finished_file.writelines(header_line)
 finished_file.writelines(data_lines)
 finished_file.close()

0
投票
for line in lines:
    if '=' not in line:
        time_data = line.split('\n')
        for time in time_data:
            data_lines.append(time+'\n')
        data_lines = [data.replace(';', ',') for data in data_lines]

试试看,让我知道

© www.soinside.com 2019 - 2024. All rights reserved.