检查 pandas DataFrame 中的特定值(在单元格中)是否为 NaN 无法使用 ix 或 iloc

问题描述 投票:0回答:5

假设我有以下

pandas
DataFrame

import pandas as pd
df = pd.DataFrame({"A":[1,pd.np.nan,2], "B":[5,6,0]})

看起来像:

>>> df
     A  B
0  1.0  5
1  NaN  6
2  2.0  0

第一个选项

我知道一种检查特定值是否为

NaN
的方法,如下所示:

>>> df.isnull().ix[1,0]
True

第二个选项(不起作用)

我认为下面的选项,使用

ix
,也可以工作,但事实并非如此:

>>> df.ix[1,0]==pd.np.nan
False

我也尝试了

iloc
,结果相同:

>>> df.iloc[1,0]==pd.np.nan
False

但是,如果我使用

ix
iloc
检查这些值,我会得到:

>>> df.ix[1,0]
nan
>>> df.iloc[1,0]
nan

那么,为什么第二个选项不起作用? 是否可以使用

NaN
ix
检查
iloc
值?

python pandas dataframe nan
5个回答
154
投票

试试这个:

In [107]: pd.isnull(df.iloc[1,0])
Out[107]: True

更新:在较新的 Pandas 版本中使用 pd.isna():

In [7]: pd.isna(df.iloc[1,0])
Out[7]: True

14
投票

上面的答案非常好。为了更好地理解,这里也有一个例子。

>>> import pandas as pd
>>> import numpy as np
>>> s = pd.Series([np.nan, 34, 56])
>>> s
0     NaN
1    34.0
2    56.0
dtype: float64
>>> pd.isnull(s[0])
True

我也尝试过几次,以下的尝试都没有成功。感谢@MaxU。

>>> s[0]
nan
>>> s[0] == np.nan
False
>>> s[0] is np.nan
False
>>> s[0] == 'nan'
False

8
投票

pd.isna(cell_value)
可用于检查给定单元格值是否为 nan。或者,
pd.notna(cell_value)
检查相反的情况。

来自pandas源代码:

def isna(obj):
    """
    Detect missing values for an array-like object.

    This function takes a scalar or array-like object and indicates
    whether values are missing (``NaN`` in numeric arrays, ``None`` or ``NaN``
    in object arrays, ``NaT`` in datetimelike).

    Parameters
    ----------
    obj : scalar or array-like
        Object to check for null or missing values.

    Returns
    -------
    bool or array-like of bool
        For scalar input, returns a scalar boolean.
        For array input, returns an array of boolean indicating whether each
        corresponding element is missing.

    See Also
    --------
    notna : Boolean inverse of pandas.isna.
    Series.isna : Detect missing values in a Series.
    DataFrame.isna : Detect missing values in a DataFrame.
    Index.isna : Detect missing values in an Index.

    Examples
    --------
    Scalar arguments (including strings) result in a scalar boolean.

    >>> pd.isna('dog')
    False

    >>> pd.isna(np.nan)
    True

0
投票

df.isnull().loc[1,0]

我尝试了上面的语法并且它有效。


-1
投票

我想出了一些解决方法:

x = [np.nan]

In [4]: x[0] == np.nan
Out[4]: False

但是:

In [5]: np.nan in x
Out[5]: True

您可以查看列表包含方法实现,以了解其工作原理。

© www.soinside.com 2019 - 2024. All rights reserved.