读取和过滤 CSV 文件列

问题描述 投票:0回答:1

我正在读取数据帧并使用如下条件查找 len:

import pandas as pd
gf = pd.read_csv(raw_github_csv_file_url)
print(len(gf[gf["gender"]=="M"]))

我的 CSV 有这些列:

id |简介 |作者 |性别 |旗帜

但我收到此错误:

KeyError Traceback(最近一次调用最后一次) /usr/local/lib/python3.10/dist-packages/pandas/core/indexes/base.py 中 get_loc(自身,键,方法,容差)3801尝试: -> 3802 返回 self._engine.get_loc(casted_key) 3803 除了 KeyError 之外,错误:

4 帧 pandas/_libs/hashtable_class_helper.pxi 中 pandas._libs.hashtable.PyObjectHashTable.get_item()

pandas/_libs/hashtable_class_helper.pxi 中 pandas._libs.hashtable.PyObjectHashTable.get_item()

关键错误:“性别”

上述异常是导致以下异常的直接原因:

KeyError Traceback(最近一次调用 最后的) /usr/local/lib/python3.10/dist-packages/pandas/core/indexes/base.py 中 get_loc(自身,键,方法,容差)3802返回 self._engine.get_loc(casted_key) 3803 除了 KeyError 如错误: -> 3804 raise KeyError(key) from err 3805 except TypeError: 3806 # 如果我们有一个类似列表的键, _check_indexing_error 将引发

关键错误:“性别”

我以相同的方式读取其他文件并成功,但不明白为什么我在这里遇到错误。或者根本情况是什么。

python pandas google-colaboratory
1个回答
0
投票

我认为您有尾随空格 avec 列名称。尝试剥离它:

gf = pd.read_csv(raw_github_csv_fileurl)
gf.columns = gf.columns.str.strip()  # clean your column names
print(len(gf[gf["gender"]=="M"]))
© www.soinside.com 2019 - 2024. All rights reserved.