基于列值删除行 - 但不仅仅是一个列值 - 值列表

Question

我理解下面这个例子，如果列包含“XYZ”，则删除一行：

df = pd.DataFrame(dict(A=[5,3,5,6], C=["foo","bar","fooXYZbar", "bat"]))
In [92]: df
Out[92]:
   A          C
0  5        foo
1  3        bar
2  5  fooXYZbar
3  6        bat

In [93]: df[df.C.str.contains("XYZ") == False]
Out[93]:
   A    C
0  5  foo
1  3  bar
3  6  bat

但是如果你希望它删除行，如果列包含在另一个dataframes列中的任何内容，那么假设我们有第二个数据帧

df2 = pd.DataFrame(dict(A=["XYZ","ABC","EFg","6","foo"], C=["test","bar","testABC", "ba6t"]))

所以我想做一些事情列出这个（注意伪代码）

df[df.C.str.contains(df2.'Column A') == False]

如果df列C包含df2列A内的任何内容，请删除df中的行

Answer 1

试试这个，

l=df2['A'].unique().tolist()
reg='|'.join(l)
print df1[df1['C'].str.contains(reg)==False]

输出：

   A    C
1  3  bar
3  6  bat

用于NaN去除

l=df2[df2['A'].notnull()]['A'].unique().tolist()

Answer 2

你可能想检查一下，因为contains接受'|'

df[~df.C.str.contains('|'.join(df2.A.tolist()))]
Out[65]: 
   A    C
1  3  bar
3  6  bat

基于列值删除行 - 但不仅仅是一个列值 - 值列表

问题描述投票：0回答：2

2个回答

最新问题

基于列值删除行 - 但不仅仅是一个列值 - 值列表

问题描述 投票：0回答：2

2个回答

最新问题

问题描述投票：0回答：2