在数据框中查找具有最高平均值的行

Question

我试图在一个非常大的数据帧中找到具有最高均值的行。

原因：我使用激光跟踪器扫描一些东西并使用“更高”的点作为扫描开始位置的参考。我试图通过我的数据找到放置的对象。

我已计算出每行的平均值：

base = df.mean(axis=1)
base.columns = ['index','Mean']

以下是每行平均值的示例：

0       4.407498
1       4.463597
2       4.611886
3       4.710751
4       4.742491
5       4.580945

这似乎工作正常，除了它添加一个索引列，并给出索引类型为float64的列。然后我试着找到具有最高平均值的行：

moy = base.loc[base.reset_index().groupby(['index'])['Mean'].idxmax()]

这给出了tis：

 index      Mean
0         0  4.407498
1         1  4.463597
2         2  4.611886
3         3  4.710751
4         4  4.742491
5         5  4.580945

但它只重新索引（我现在有3列而不是2列）并且什么也没做。它仍然显示所有行。

Answer 1

这是一种不使用groupby的方法

moy=base.sort_values('Mean').tail(1)

Answer 2

看起来您的数据是字符串或单列，两个数字之间有空格。建议将列拆分为两个和/或使用类似于下面的内容将索引设置为您感兴趣的特定列。

import pandas as pd

df = pd.read_csv('testdata.txt', names=["Index", "Mean"], delimiter="\s+")
df = df.set_index("Index")
print(df)