我有一个包含以下内容的文本文件:
========数据:00:05:08.627012 =========
1900-01-01 00:05:08.627012 ; 0 ; 1.16198 ; 10000000.0
1900-01-01 00:05:08.627012 ; 1 ; 1.16232 ; 10000000.0
=========数据:00:05:12.721536 =========
1900-01-01 00:05:08.627012 ; 0 ; 1.16198 ; 10000000.0
1900-01-01 00:05:12.721536 ; 0 ; 1.16209 ; 1000000.0
1900-01-01 00:05:08.627012 ; 1 ; 1.16232 ; 10000000.0
我试图将它转换为csv,其中每个项目在它进入自己的单元格后用分号。这是想要的结果的想法.
我不想在文本文件中包含具有=符号的行。我目前正在使用以下代码:
txt_file = open('Data/Mkt_data_test.txt', 'r')
lines = txt_file.readlines()
txt_file.close()
header_line = ['Time,', 'Bid/Ask,', 'Price,', 'Volume,']
data_lines = []
for line in lines:
if '=' not in line:
time_data = line.split('\n')
for time in time_data:
data_lines.append(time+'\n')
data_lines = [data.replace(';', ',') for data in data_lines]
finished_file = open('mktDataFormat.csv', 'w')
finished_file.writelines(header_line)
finished_file.writelines(data_lines)
finished_file.close()
这样可以正确地写入不包含等号的行,但是有空行,其中带有'='的行,并且文本文件中只有一个空行。
我怎样才能摆脱那些空白线?
您的问题是您的程序没有跳过空行,因此将空行视为数据。我添加了一张支票(稍微改了一下你的代码),以确保没有空白行。
txt_file = open('Data/Mkt_data_test.txt', 'r')
lines = txt_file.readlines()
txt_file.close()
header_line = ['Time,', 'Bid/Ask,', 'Price,', 'Volume,\n']
data_lines = []
for line in lines:
if '=' not in line and line.strip() != "":
line = line.replace(';', ',')
data_lines.append(line)
finished_file = open('mktDataFormat.csv', 'w')
finished_file.writelines(header_line)
finished_file.writelines(data_lines)
finished_file.close()
for line in lines:
if '=' not in line:
time_data = line.split('\n')
for time in time_data:
data_lines.append(time+'\n')
data_lines = [data.replace(';', ',') for data in data_lines]
试试看,让我知道