我无法从文本文件中获取正确的值到字典列表中。我正在调用文本文件的原始输出,逐行读取,删除空格并解析为字典。
请在下面找到包含产品ID和产品名称的txt文件。请注意,文件源中的一些数据内容是颠倒的...我的意思是产品ID在产品名称之前出现(不按顺序)...请参考下面的示例数据
Product id: sq112
Prodname: ment-bar1
Product id: sq001
Prodname: jumw-cd12
Product id: mcc-hg921
Prodname: emq-vx02
Product id: mmc112
Prodname: ment-bar2
Product id: cx022
Prodname: mxx-21ed
Product id: vcb113
Prodname: emq-vx05
Prodname: trc-vc01
Product id: emx-21ee
这是用于获取id和名称的脚本
file = open("prd1.txt")
data = file.readlines()
dict = {"ProdList":[]}
temp_dict ={}
for line in data:
line = line.replace('\n', '').strip()
line = line.split(':')
line = list(filter(None,line))
temp_dict["ID"] = line[0]
temp_dict["Name"] = line[1]
dict["ProdList"].append(temp_dict)
temp_dict = {}
print(dict)
dict输出如下生成
{'ProdList': [{'ID': 'Product id', 'Name': ' sq112'}, {'ID': 'Prodname',
'Name': ' ment-bar1'}, {'ID': 'Product id', 'Name': ' sq001'}, {'ID':
'Prodname', 'Name': ' jumw-cd12'}, {'ID': 'Product id', 'Name': ' mcc-
hg921'}, {'ID': 'Prodname', 'Name': ' emq-vx02'}, {'ID': 'Product id',
'Name': ' mmc112'}, {'ID': 'Prodname', 'Name': ' ment-bar2'}, {'ID':
'Product id', 'Name': ' cx022'}, {'ID': 'Prodname', 'Name': ' mxx-21ed'},
{'ID': 'Product id', 'Name': ' vcb113'}, {'ID': 'Prodname', 'Name': ' emq-
vx05'}]}
预期产出如下
{'ProdList':[{'ID':'sq112','Name':' ment-bar1'},{'ID':'sq001','Name':'
jumw-cd12'},{'ID':'mcc-hg921','Name':' emq-vx02'}]}
我按照下面的建议尝试了
for i in range(0,len(data),2):
line = data[i].split(':')
nxt_line = data[i+1].split(':')
if 'id' in data[0]:
dict['ProdList'].append({'ID':line[1], 'Name': nxt_line[1]})
else:
dict['ProdList'].append({'ID':nxt_line[1], 'Name': line[1]})
我得到以下输出
{'ProdList':[{'ID':' sq112\n','Name':' ment-bar1\n'},{'ID':'
sq001\n','Name':' jumw-cd12\n'},{'ID':' mcc-hg921\n','Name':' emq-vx02\n'},
{'ID':' mmc112\n','Name':' ment-bar2\n'},{'ID':' cx022\n','Name':' mxx-
21ed\n'},{'ID':' vcb113\n','Name':' emq-vx05\n'},{'ID':' trc-
vc01\n','Name':' emx-21ee \n'}]}
最后一个id和产品名称颠倒......它应该是ID:emx-21ee和Name:trc-vc01
对于产品ID出现在产品名称之前的文件,请尝试以下操作:
file = open("prd1.txt")
data = file.readlines()
data = [i.strip() for i in data]
dict_ = {"ProdList":[]}
for i in range(0,len(data),2):
line = data[i].split(':')
nxt_line = data[i+1].split(':')
dict_['ProdList'].append({'ID':line[1], 'Name': nxt_line[1]})
输出:
{'ProdList': [{'ID': ' sq112', 'Name': ' ment-bar1'}, {'ID': ' sq001', 'Name': ' jumw-cd12'}, {'ID': ' mcc-hg921', 'Name': ' emq-vx02'}, {'ID': ' mmc112', 'Name': ' ment-bar2'}, {'ID': ' cx022', 'Name': ' mxx-21ed'}, {'ID': ' vcb113', 'Name': ' emq-vx05'}]}
如果对于某些文件,产品名称位于产品ID之前,则必须在for循环部分内部进行修改,我们将值分配给'ID'
和'Name'
密钥。此更改需要先验知道文件是否包含产品ID之前的产品名称。这是代码:
for i in range(0,len(data),2):
line = data[i].split(':')
nxt_line = data[i+1].split(':')
dict_['ProdList'].append({'ID':nxt_line[1], 'Name': line[1]}) # Change here
如果您想要使整个过程一致自动化,即您不知道哪个文件包含产品ID之前的产品名称以及相反的方式,则必须检查第一行是否包含关键字id
或name
:
if 'id' in data[0]:
# proceed with the first loop
else:
# proceed with the second loop
您可以通过将文件生成器与自身压缩来对每两行进行配对:
with open('prd1.txt') as file:
print({'ProdList': [{'ID': id.split(': ')[1].rstrip(), 'Name': name.split(': ')[1].rstrip()} for id, name in zip(data, data)]})
这输出:
{'ProdList': [{'ID': 'sq112', 'Name': 'ment-bar1'}, {'ID': 'sq001', 'Name': 'jumw-cd12'}, {'ID': 'mcc-hg921', 'Name': 'emq-vx02'}, {'ID': 'mmc112', 'Name': 'ment-bar2'}, {'ID': 'cx022', 'Name': 'mxx-21ed'}, {'ID': 'vcb113', 'Name': 'emq-vx05'}]}