如何根据其他变量估算缺失值

问题描述 投票:0回答:1

我有如下数据框:

df = pd.DataFrame({'one' : pd.Series(['a', 'b', 'c', 'd','aa','bb',np.nan,'b','c',np.nan, np.nan] ), 
  'two' : pd.Series([10, 20, 30, 40,50,60,10,20,30,40,50])} )

dataframe

其中第一列是变量,第二列是值。可变值是常量,永远不变。

示例'a'的值为10每出现一个'a'对应的值将为10] >>

这里第一列中缺少某些值例如:NaN 10是a,NaN 40是d

像明智的数据框包含200个变量。

在这种情况下,我们如何估算缺失的值。预期输出应为:

Expected output

请对此提供帮助。

关于,Venkat。

我有一个如下数据框:df = pd.DataFrame({'one':pd.Series(['a','b','c','d','aa','bb',np .nan,'b','c',np.nan,np.nan]),'two':pd.Series([10,20,30,40,50,60,10,20,30,40, 50])})在...

python pandas missing-data
1个回答
0
投票

这里是:


0
投票

尝试一下:

© www.soinside.com 2019 - 2024. All rights reserved.