如何正确地删除数据框（熊猫）的列？

Question

用熊猫我无法从csv删除列。我试图删除它使用不同的轴，DEL功能很多方面，但它不工作。是否有人知道为什么吗？

这里是我的pandas.head（）

age;"job";"marital";"education";"default";"balance";"housing";"loan";"contact";"day";"month";"duration";"campaign";"pdays";"previous";"poutcome";"y"
0  58;"management";"married";"tertiary";"no";2143...

1  44;"technician";"single";"secondary";"no";29;"...

2  33;"entrepreneur";"married";"secondary";"no";2...

3  47;"blue-collar";"married";"unknown";"no";1506...

4  33;"unknown";"single";"unknown";"no";1;"no";"n...

这里是我的代码：

import pandas  
df = pd.read_csv('bank-full.csv')
print(df.head())
df = df.drop(['day', 'poutcome'], axis=1)

以下是错误：

Traceback (most recent call last):
  File "/home/administrator/PycharmProjects/BankMarketinData/main.py", line 21, in 
    main()
  File "/home/administrator/PycharmProjects/BankMarketinData/main.py", line 19, in main
    df = df.drop(['day', 'poutcome'], axis=1)
  File "/home/administrator/anaconda3/lib/python3.6/site-packages/pandas/core/frame.py", line 3697, in drop
    errors=errors)
  File "/home/administrator/anaconda3/lib/python3.6/site-packages/pandas/core/generic.py", line 3111, in drop
    obj = obj._drop_axis(labels, axis, level=level, errors=errors)
  File "/home/administrator/anaconda3/lib/python3.6/site-packages/pandas/core/generic.py", line 3143, in _drop_axis
    new_axis = axis.drop(labels, errors=errors)
  File "/home/administrator/anaconda3/lib/python3.6/site-packages/pandas/core/indexes/base.py", line 4404, in drop
    '{} not found in axis'.format(labels[mask]))
KeyError: "['day' 'poutcome'] not found in axis"

Answer 1

所以这是一个非常简单的问题。首先，我劝你，每当你处理delimiter数据使用tabular。现在，让我们专注于您的问题，让你读你的dataframe是这样的：

import pandas as pd  
df = pd.read_csv('bank-full.csv')
df = df.drop(['day', 'poutcome'], axis=1)

现在你column名称包含""在其中。所以你列的名称是"day"＆"poutcome"不day＆poutcome。请记住这些double quotes ""是您的列名的一部分。所以，你应该写这样的事情，以删除这些列：

df = df.drop(['"day"', '"poutcome"'], axis=1)

我希望这可以帮助你。如果您有任何进一步的问题，让我知道

Answer 2

您可以通过一个拖放一个，或使用循环删除多个列。你需要确保这些列名在数据帧的人。它看起来像从你的问题你的列名被包裹在“”。确保在数据帧读书时也正确定义分隔符。当使用read_csv它会默认为“”，但在这种情况下，它是‘;’。

逐一

df = pd.read_csv('bank-full.csv', sep=';')
df = df.drop(['day'], axis=1)
df = df.drop(['poutcome'], axis=1)

环

df = pd.read_csv('bank-full.csv', sep=';')
Drop_list = ['day','poutcome']
for column in Drop_list: 
    df = df.drop([column], axis=1)

测试我使用的问题：

df = pd.DataFrame(np.random.randn(50, 4), columns=list('ABCD'))
df.head(5)

              A         B         C         D
    0  0.860680 -0.408577  0.727530 -0.119050
    1 -1.140042  0.241970 -1.509257 -0.303601
    2  0.811929  0.146228  2.102941  0.772328
    3 -0.590157  0.753719  0.220592 -0.563953
    4  0.031505 -0.521978  0.410718 -0.325865

Drop_list = ['A','B','C']
for column in Drop_list:
    df = df.drop([column], axis=1)
df.head(5)

          D
0 -0.119050
1 -0.303601
2  0.772328
3 -0.563953
4 -0.325865

Answer 3

df = pd.read_csv('bank-full.csv', sep=';')
df.columns = [col.replace('"', '') for col in df.columns]
df.drop(columns=['day','poutcome'], inplace=True)

正如你可以跟进评论看，你的问题是，你在你的csv文件将在有错误的分隔符。然后，你需要删除在列名是带引号这样就可以把那些列。

如何正确地删除数据框（熊猫）的列？

问题描述投票：0回答：3

3个回答

最新问题

如何正确地删除数据框（熊猫）的列？

问题描述 投票：0回答：3

3个回答

最新问题

问题描述投票：0回答：3