所以我有这个项目,需要我读取.dat文件并将其转换为表,.dat文件如下所示:
50123456_lam tai man_70.0_60.0_
50223456_li tai man_60.0_90.5_
50323456_wong tai man_34.5_30.0_
50423456_ng tai man_90.5_70.0_
50523456_lau tai man_86.0_92.4_
50623456_chui tai man_70.0_64.5_
50723456_lim tai man_64.5_60.0_
50823456_pok tai man_37.5_35.50_
50923456_kim tai man_92.4_60.0_
50023456_tsang tai man_15.0_20.0_
50999999_chan peter_100.00_80.00_
我希望用下划线分割线条,这样我就可以列出每个元素的列表。由于我是业余爱好者,我现在只能将文件导入到我的程序中,我仍然需要弄清楚将行分成可用变量的方法。
这是有问题的导入程序:
import matplotlib.pyplot as plt
import fileinput
import sys
def main():
lineNum = 0
for line in fileinput.input('markdata.dat'):
lineNum += 1
sys.stdout.write(str(lineNum)+' ')
sys.stdout.write(line)
pass
if __name__ == "__main__":
main()
如果有人想帮助我,我很感激。
如果你想要做的就是用下划线拆分它们,csv库应该满足你的需求。这是一个例子;只需将分隔符更改为下划线。
import csv
with open('my_sample_data.dat') as f:
reader = csv.reader(f, delimiter=',')
for row in reader:
print(row)
>>>
['Date', 'Time', 'Event', 'OrgID', 'Email']
['12/15/2018', '6:55:41 AM', 'abc', '1', '[email protected]']
['12/15/2018', '1:36:39 PM', 'def', '2', '[email protected]']
['12/15/2018', '2:21:56 PM', 'com', '3', '[email protected]']
处理此类dat文件的好方法是使用pandas库。您在Dataframe中读取此文件并使用分隔符作为下划线。
import pandas as pd
df = pd.read_csv('sample.dat',delimiter='_',header=None)