我正在尝试对包含 20 个组、每组 392 个观察值和三个变量(Time_Seconds、Age、Grp)的数据集运行线性回归。这二十组是 Grp 和 Age 变量的组合。目标是绘制 5 组中每组的 y=Time_Seconds、x=Age 和回归线。这些组最初分布不均匀,因此在 Time_Seconds 类别中添加了 NA 的附加变量。这是与错误一起使用的代码。
time = Stats.Data.2$Time_Second
age = Stats.Data.2$Age
grp = Stats.Data.2$Grp
grp.list = unique(grp)
gl.model = gl(40, 392, length = 15680, labels = grp.list, order = FALSE)
time.age = c(time, age)
lm.time = lm(time.age ~ gl.model)
我收到以下错误返回:
Error in unique.default(x[!is.na(x)]) : hash table is full
任何帮助将不胜感激。
我尝试通过消除 NA 值来纠正问题,但出现以下错误:
Error in model.frame.default(formula = time.age ~ gl.model, drop.unused.levels = TRUE) :
variable lengths differ (found for 'gl.model')
我还尝试更正该数据并设置 NA 级别以帮助防止 NA 出现问题。这是代码:
levels(Stats.Data.2$Time_Second) = c(levels(Stats.Data.2$Time_Second),'(NA)')
Stats.Data.2$Time_Second[is.na(Stats.Data.2$Time_Second)] = '(NA)'
这仍然返回以下错误:
Error in unique.default(x[!is.na(x)]) : hash table is full