Python:类型错误:不可散列的类型:'切片'

问题描述 投票:0回答:2

我正在使用 python 读取 CSV,这是代码。

train_csv = open('train.csv')
test_csv = open('test.csv')
train_data_reader = csv.DictReader(train_csv)
test_data_reader = csv.DictReader(test_csv)

row=[]
for row in train_data_reader:
    X.append([int(item) for item in row[4:]]) 
    char = row[1]
    Y.append(charIntConversion(char))
    train_id.append(row[0])
    prediction.append(row[1])
for row in test_data_reader:
    test_id.append(row[0])
    test_X.append([int(item) for item in row[4:]]

当我尝试运行代码时,它显示 TypeError: unhashable type: 'slice' for

X.append([int(item) for item in row[4:]])
test_X.append([int(item) for item in row[4:]] 

X 和 test_X 应包含 CSV 从第 4 列到最后一列的值。

我可以知道我的代码有什么问题以及如何解决这个问题吗?

python csv
2个回答
8
投票

我可以看到您已经解决了您的问题,但我想我应该在这里为未来的读者留下答案。谁可能会被这个抓住(我就是)。

问题是该对象是一个字典,并且您试图向它传递一个切片,该切片不可散列,因此不能用作字典键。

简单的例子

>>> d = {0: 5, 1: 6, 2: 7, 3: 8, 4: 9}
>>> d[:5]
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: unhashable type: 'slice'

您要做的就是从收藏中取出

n
项。所以实现这一点的方法是首先将字典转换为列表(可切片)。为此,请根据您的用例使用
dict.items
dict.keys
dict.values

字典(尽管最近有 python 3.6 开发)没有排序,因此您从

dict.items
(或朋友)返回的内容可能不是按对您有用的顺序排列的。所以你可以在切片之前对其进行排序。

>>> sorted(d.items())[:5]
[(0, 5), (1, 6), (2, 7), (3, 8), (4, 9)]

上面的代码有点难看,但是可以用。

您可以使用 itertools 中的

islice
来避免索引

>>> from itertools import islice
>>> list(islice(sorted(d.items()), 5))
[(0, 5), (1, 6), (2, 7), (3, 8), (4, 9)]

如果默认排序顺序不是您想要的,您需要提供一个排序键。这种方法效率低下,因为它在切片之前对整个集合进行排序,但不确定是否有解决方法。

任何到达此页面并对上述错误感到困惑的人都不会意识到他们正在尝试对字典进行切片。在字典上执行切片并没有多大意义,大多数有经验的开发人员都会意识到,如果你这样做,你会得到一个不可预测的结果。

如果您确实想从字典中获取前 n 个元素,请假设 csv 文件中的一行,其中的列按某种规定的顺序排列。最好将所需的键格式化为一个元组,然后从字典中获取这些元素。

例如

仅从字典中获取前两列

people = [{'name': 'paul', 'job': 'programmer', 'age': 'old'}, 
          {'name': 'chris', 'job': 'student', 'age': 'young'}]

>>> for p in people:
...     res = [p[key] for key in ('name', 'job')]
...     print(res)
['paul', 'programmer']
['chris', 'student']

hth


0
投票

多元线性回归模型的编码器示例:

# Importing the dataset
dataset = pd.read_csv('Data.csv')
X = dataset.iloc[:, 0:4].values
y = dataset.iloc[:,4].values

# Encoding categorical data
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
labelencoder_X = LabelEncoder()
X[:, 3] = labelencoder_X.fit_transform(X[:, 3])
onehotencoder = OneHotEncoder(categorical_features = [3])
X = onehotencoder.fit_transform(X).toarray()
© www.soinside.com 2019 - 2024. All rights reserved.