Python 读取 csv - BOM 嵌入到第一个密钥中

Question

我正在使用 Python 2.7.12。使用此代码片段，我正在保存一个 utf-8 csv 文件。我在文件开头写了BOM（byte order mark）

import codecs
import csv

outputFile = open("test.csv", "wb")
outputFile.write(codecs.BOM_UTF8)
fieldnames = ["a", "b"]
writer = csv.DictWriter(outputFile, fieldnames, delimiter=";")
writer.writeheader()
row = dict([])
for i in range(10):
    row["a"] = str(i).encode("utf-8")
    row["b"] = str(i*2).encode("utf-8")
    writer.writerow(row)
outputFile.close()

我想加载那个csv文件：

import codecs
import csv
inputFile = open("test.csv", "rb")
reader = csv.DictReader(inputFile, delimiter=";")
for row in reader:
    print row["a"]
inputFile.close()

上面的代码会失败：

KeyError: 'a'

如果我打印行键，这就是它们的样子：

[u'\ufeffa', u'b']

。 BOM 已嵌入密钥

。我做错了什么？

Answer 1

你要告诉open这是UTF-8带BOM。我知道这适用于 io.open：

import io

.
.
.
inputFile = io.open("test.csv", "r", encoding='utf-8-sig')
.
.
.

而且你必须以文本模式打开文件，“r”而不是“rb”。

Answer 2

在Python 3中，内置的

open

函数是

io.open

的别名。

所有你需要打开一个编码为 UTF-8 和 BOM 的文件：

open(path, newline='', encoding='utf-8-sig')

例子

import csv

...

with open(path, newline='', encoding='utf-8-sig') as csv_file:
    reader = csv.DictReader(csv_file, dialect='excel')
    for row in reader:
        print(row['first_name'], row['last_name'])

Python 读取 csv - BOM 嵌入到第一个密钥中

问题描述投票：0回答：2

2个回答

例子

最新问题

Python 读取 csv - BOM 嵌入到第一个密钥中

问题描述 投票：0回答：2

2个回答

例子

最新问题

问题描述投票：0回答：2