如何在熊猫数据框中创建倾斜的列?

问题描述 投票:2回答:1

我想在数据框架中使用偏斜分布创建一个新列。我希望它有64000个数据点,最小值为0(没有负值),并且某种偏斜的形状,其中大多数人接近0,然后以较高的值向右平移。

我已经尝试过了,但是我做不到。非常感谢您的帮助。

rv = skewnorm.rvs(400000, size=100000)
python pandas numpy statistics distribution
1个回答
2
投票

您可以根据所要使用的内容使用exponentialpoisson分布。 指数分布将给出连续值,而泊松将给出离散值。两者都可以在numpy包中找到。创建numpy数组后,可以轻松将其添加到pandas数据帧中。

指数分布(numpy):

import numpy as np

beta = 10
s = np.random.exponential(beta, 64000)

beta用作比例参数,将确定值的大小,同时保持总体分布形状。用beta=10和100个箱进行绘图:

Exponential plot

泊松分布(numpy):

import numpy as np

lam = 0.9
s = np.random.poisson(lam , 64000)

速率参数lam将确定分布的形状。平均值和方差都将等于lam。注意,仅获得离散值。带有lam=0.9和8个槽的图:

Poisson plot

© www.soinside.com 2019 - 2024. All rights reserved.