不知道如何拆分.dat文件行

问题描述 投票:1回答:2

所以我有这个项目,需要我读取.dat文件并将其转换为表,.dat文件如下所示:

50123456_lam tai man_70.0_60.0_
50223456_li tai man_60.0_90.5_
50323456_wong tai man_34.5_30.0_
50423456_ng tai man_90.5_70.0_
50523456_lau tai man_86.0_92.4_
50623456_chui tai man_70.0_64.5_
50723456_lim tai man_64.5_60.0_
50823456_pok tai man_37.5_35.50_
50923456_kim tai man_92.4_60.0_
50023456_tsang tai man_15.0_20.0_
50999999_chan peter_100.00_80.00_

我希望用下划线分割线条,这样我就可以列出每个元素的列表。由于我是业余爱好者,我现在只能将文件导入到我的程序中,我仍然需要弄清楚将行分成可用变量的方法。

这是有问题的导入程序:

import matplotlib.pyplot as plt
import fileinput
import sys

def main():
    lineNum = 0
    for line in fileinput.input('markdata.dat'):
        lineNum += 1
        sys.stdout.write(str(lineNum)+' ')
        sys.stdout.write(line)
    pass

if __name__ == "__main__":
    main()

如果有人想帮助我,我很感激。

python-3.x
2个回答
0
投票

如果你想要做的就是用下划线拆分它们,csv库应该满足你的需求。这是一个例子;只需将分隔符更改为下划线。

import csv

with open('my_sample_data.dat') as f: 
    reader = csv.reader(f, delimiter=',')

    for row in reader:
        print(row)

>>>
['Date', 'Time', 'Event', 'OrgID', 'Email']
['12/15/2018', '6:55:41 AM', 'abc', '1', '[email protected]']
['12/15/2018', '1:36:39 PM', 'def', '2', '[email protected]']
['12/15/2018', '2:21:56 PM', 'com', '3', '[email protected]']

0
投票

处理此类dat文件的好方法是使用pandas库。您在Dataframe中读取此文件并使用分隔符作为下划线。

import pandas as pd
df = pd.read_csv('sample.dat',delimiter='_',header=None)
© www.soinside.com 2019 - 2024. All rights reserved.