R Hmisc描述函数失真值摘要

问题描述 投票:1回答:1

在Hmisc(版本4.0-3)中使用describe()函数时,我一直在尝试协调一个问题。值摘要中的唯一值似乎已被更改或误解释,因为它们与基数R中的table()函数的结果不匹配。

library(Hmisc)

test <- data.frame(
        'j6033' = c(0, 0, 0, 0, 2053, 2098, 0, 2053, 2098, 2, 5, 0, 0, 0, 
                    5, 13, 13, 0, 2053, 2098)
        )

describe(test$j6033)
table(test$j6033)

我看到的结果是:

> describe(test$j6033)
test$j6033 
       n  missing distinct     Info     Mean      Gmd 
      20        0        6    0.902    624.5    920.6 

Value         0    5   15 2055 2100
Frequency    10    2    2    3    3
Proportion 0.50 0.10 0.10 0.15 0.15
> table(test$j6033)

   0    2    5   13 2053 2098 
   9    1    2    2    3    3 

2053的值被解释为2055,单个值2被解释为0,2098被解释为2100,13被解释为15.是否有人知道为什么这里存在差异以及如何纠正它?

注意:由Hmisc库调用加载的支持包版本如下:lattice(0.20-35),survival(2.41-3),Formula(1.2-2)和ggplot2(2.2.1)。

r hmisc
1个回答
0
投票

当有<= 20个不同的值时,函数在某些情况下舍入值。我已修复代码,如果<= 20值,则不进行此分级。这将在下一个版本中。如果需要,Linux用户可以提前获得新版本。

© www.soinside.com 2019 - 2024. All rights reserved.