我把.describe()
放到Dataframe上,输出看起来不太好。我希望输出显示整数,而不是用指数简化。
输入:
df["A"].describe()
输出如何:
count 6.000000e+01
mean 7.123568e+04
std 2.144483e+05
min 1.000000e+02
25% 2.770080e+03
50% 1.557920e+04
75% 4.348470e+04
max 1.592640e+06
Name: A, dtype: float64
预期产出:
count 60.0
mean 7123.568
std 214448.3
min 100.0000
25% 2770.080
50% 15579.20
75% 43484.70
max 1592640.0
Name: A, dtype: float64
你可以在pandas float_format
中更改大熊猫的set_option
import pandas as pd
import numpy as np
pd.set_option('display.float_format', lambda x: '%.5f' % x)
data = pd.DataFrame()
data['X'] = (np.random.rand(1000, ) + 10000000) * 0.587
data['X'].describe()
# Output
count 1000.00000
mean 5870000.47894
std 0.28447
min 5870000.00037
25% 5870000.23637
50% 5870000.45799
75% 5870000.71652
max 5870000.99774
Name: X, dtype: float64
或者不使用set_option
在这样的输出系列上使用apply
import pandas as pd
import numpy as np
data = pd.DataFrame()
data['X'] = np.random.rand(1000, ) + 10000000 * 0.587
data['X'].describe().apply("{0:.5f}".format)
#output
count 1000.00000
mean 5870000.48955
std 0.29247
min 5870000.00350
25% 5870000.22416
50% 5870000.50163
75% 5870000.73457
max 5870000.99995
您可以使用
df["A"].describe(include=['category'])
尝试为使用pandas获得的输出设置浮点格式
import pandas as pd
pd.set_option('display.float_format', lambda x: '%.3f' % x)