多条件降行

Question

我想从我的数据框中选择一个满足以下条件的子集。我有一个数据框，显示了三个学生的不同测试结果。只要其中一个学生的结果是 "差"，他们就不能被考虑在实验中，需要从数据集中删除。我的Dataframe是这样的。

import pandas as pd

data = {'Name':  ['Peter', 'Peter','Anna', 'Anna','Anna', 'Max'],
        'Result': ["Good", "Good", "Good", "Good", "poor", "Very Good"],
         }

df = pd.DataFrame (data, columns = ['Name','Points'])

这意味着，我首先需要查看谁的成绩差，然后删除每一条有这个人的记录。在这个例子中，我想要的结果是。

df_res = pd.DataFrame({'Name': ('Peter', 'Peter', 'Max', 'Max'), 
                   'Result': ("Good", "Good", "Very Good")})

谁能帮我一下？尤其是删除所有有对应名字的行，对我来说是一个障碍。

Answer 1

查找 Name的物品的数量。'poor' Result的记录，然后用它来过滤其 Name的不在这个列表中。

>>> df = pd.DataFrame(data) # leave out the columns parameter.
>>>
>>> df[~df.Name.isin(df[df.Result == 'poor'].Name.values)]
    Name     Result
0  Peter       Good
1  Peter       Good
5    Max  Very Good

我想我们称之为 "布尔遮蔽"。

我们是不是对安娜有点不公平，她的好成绩比其他人都多。那又怎样，她今天的成绩不好... ...

=) 总之...

你也可以特别使用 .drop() 方法也。

>>> df.drop(index=df[df.Name.isin(df[df.Result == 'poor'].Name)].index)
    Name     Result
0  Peter       Good
1  Peter       Good
5    Max  Very Good

多条件降行

问题描述投票：0回答：1

1个回答

最新问题

多条件降行

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1