假设我有以下内容
pandas
DataFrame
:
import pandas as pd
import numpy as np
df = pd.DataFrame({"A": [1, np.nan, 2], "B": [5, 6, 0]})
看起来像:
>>> df
A B
0 1.0 5
1 NaN 6
2 2.0 0
我知道一种方法来检查特定值是否为
NaN
:
>>> df.isnull().iloc[1,0]
True
我认为下面的选项,使用
iloc
,也可以工作,但事实并非如此:
>>> df.iloc[1,0] == np.nan
False
但是,如果我检查该值,我会得到:
>>> df.iloc[1,0]
nan
那么,为什么第二个选项不起作用? 是否可以使用
NaN
检查 iloc
值?
编者注:这个问题以前使用
pd.np
代替np
,并在.ix
之外使用.iloc
,但由于这些不再存在,因此已被删除以保持简短和清晰。
试试这个:
In [107]: pd.isnull(df.iloc[1,0])
Out[107]: True
更新:在较新的 Pandas 版本中使用 pd.isna():
In [7]: pd.isna(df.iloc[1,0])
Out[7]: True
上面的答案非常好。为了更好地理解,这里也有一个例子。
>>> import pandas as pd
>>> import numpy as np
>>> s = pd.Series([np.nan, 34, 56])
>>> s
0 NaN
1 34.0
2 56.0
dtype: float64
>>> pd.isnull(s[0])
True
我也尝试过几次,以下的尝试都没有成功。感谢@MaxU。
>>> s[0]
nan
>>> s[0] == np.nan
False
>>> s[0] is np.nan
False
>>> s[0] == 'nan'
False
pd.isna(cell_value)
可用于检查给定单元格值是否为 nan。或者,pd.notna(cell_value)
检查相反的情况。
来自pandas源代码:
def isna(obj):
"""
Detect missing values for an array-like object.
This function takes a scalar or array-like object and indicates
whether values are missing (``NaN`` in numeric arrays, ``None`` or ``NaN``
in object arrays, ``NaT`` in datetimelike).
Parameters
----------
obj : scalar or array-like
Object to check for null or missing values.
Returns
-------
bool or array-like of bool
For scalar input, returns a scalar boolean.
For array input, returns an array of boolean indicating whether each
corresponding element is missing.
See Also
--------
notna : Boolean inverse of pandas.isna.
Series.isna : Detect missing values in a Series.
DataFrame.isna : Detect missing values in a DataFrame.
Index.isna : Detect missing values in an Index.
Examples
--------
Scalar arguments (including strings) result in a scalar boolean.
>>> pd.isna('dog')
False
>>> pd.isna(np.nan)
True
df.isnull().loc[1,0]
我尝试了上面的语法并且它有效。
我想出了一些解决方法:
x = [np.nan]
In [4]: x[0] == np.nan
Out[4]: False
但是:
In [5]: np.nan in x
Out[5]: True
您可以查看列表包含方法实现,以了解其工作原理。