我想从我的数据框中选择一个满足以下条件的子集。我有一个数据框,显示了三个学生的不同测试结果。只要其中一个学生的结果是 "差",他们就不能被考虑在实验中,需要从数据集中删除。我的Dataframe是这样的。
import pandas as pd
data = {'Name': ['Peter', 'Peter','Anna', 'Anna','Anna', 'Max'],
'Result': ["Good", "Good", "Good", "Good", "poor", "Very Good"],
}
df = pd.DataFrame (data, columns = ['Name','Points'])
这意味着,我首先需要查看谁的成绩差,然后删除每一条有这个人的记录。在这个例子中,我想要的结果是。
df_res = pd.DataFrame({'Name': ('Peter', 'Peter', 'Max', 'Max'),
'Result': ("Good", "Good", "Very Good")})
谁能帮我一下?尤其是删除所有有对应名字的行,对我来说是一个障碍。
查找 Name
的物品的数量。'poor'
Result
的记录,然后用它来过滤其 Name
的不在这个列表中。
>>> df = pd.DataFrame(data) # leave out the columns parameter.
>>>
>>> df[~df.Name.isin(df[df.Result == 'poor'].Name.values)]
Name Result
0 Peter Good
1 Peter Good
5 Max Very Good
我想我们称之为 "布尔遮蔽"。
我们是不是对安娜有点不公平,她的好成绩比其他人都多。那又怎样,她今天的成绩不好... ...
=) 总之...
你也可以特别使用 .drop()
方法也。
>>> df.drop(index=df[df.Name.isin(df[df.Result == 'poor'].Name)].index)
Name Result
0 Peter Good
1 Peter Good
5 Max Very Good