Loadrunner分析:第90百分位数如何高于平均值?

问题描述 投票:2回答:4

有点困惑。我从一份报告中得到了一些Loadrunner Analysis。我是新手测试。我对第90个百分位数的理解是,鉴于它占据了第90个百分位并且省略了异常值,它呈现出更真实的图像。虽然我正在查看两个不同的报告,但两者中,第90百分位响应时间高于摘要报告中给出的平均响应时间。怎么可能呢?

我正在查看交易响应时间(Percentile)和最后10%上涨的图表,因此告诉我90%应该会看到更短的响应时间。

 Example
Transaction 1

Min 0.012
Avg 1.919
Max 20.935
SD 2.718
90 Percentile 6.412

许多交易看起来像这样,或多或少。为什么第90个百分点高于平均值?

c performance-testing loadrunner percentile vugen
4个回答
2
投票

第90个百分位意味着90%的值低于此值。这种情况下的值是您的响应时间。因此,如果您有1000个值且第90个百分位数是n,那些值中的900个将低于n,并且仅比n高100个 - 所以有意义的是平均值小于第90个百分点。


3
投票

中位数是第50百分位数。它总是低于90%。如果您的数据集中有一小部分非常长,则平均值实际上可能高于第90个百分点,从而拖累整个数据集的平均值更高。

#FoundationSkills #Statistics


0
投票

Giles说:“第90个百分位意味着90%的值低于此值。在这种情况下,值将是您的响应时间。因此,如果您有1000个值且第90个百分位数是n,那么这些值中的900个将低于n,只有100以上 - 所以平均值小于90%时才有意义。“对不起,我看不出它有多大意义。我会说,如果你删除最长的响应,剩下的是较短的响应时间,所以在这种情况下,当你计算较小数字的平均值时,你会得到一个较小的数量:90百分位数总是小于平均而言,肯定不是这样!

是不是发明了90%的百分位来展示该网站如何为90%的客户提供服务?那么,收集所有最常见的结果并切断一些罕见的极端(两端),这种情况经常不会发生?这可以解释为什么在loadrunner平均值的输出中几乎总是小于90%。 ?我认为这是它的工作原理:Pic: 90% calculation


0
投票

平均值与n分位数/中位数/四分位数/百分位数非常不同。

可以设置具有均值>中值或甚至第90百分位<均值的值。它们不是一回事。

看到这个https://math.stackexchange.com/questions/382117/average-is-higher-than-percentile-90

人们对其数据做出的一般假设依赖于未说明的假设,即数据遵循中心分布,均值为〜=中位数(如高斯分布)。

只要看看幂律/帕累托定律,看看这个假设有多么错误。同样适用于多模态分布。没有适当的分析,不做这样的假设是至关重要的,否则这只是某种“数据废话”

(顺便说一句,这就是为什么平均收入提供的信息少于中位收入的原因)

© www.soinside.com 2019 - 2024. All rights reserved.