我现在正在R中创建一个多元模型。
[当我将分类变量绘制到lm()函数中并检查summary()输出时,我的分类变量被分解为该变量中每个选项的beta系数。
[当我检查数据类型时,它作为因子变量返回,here is the output of summary to visualize the issue easier.
简而言之,由于回归分析需要数值变量;因此,当在回归模型中使用分类变量执行回归时,变量的每个类别都转换为单独的变量,也称为“虚拟”变量。当虚拟变量为1时,表示类别变量属于此虚拟变量代表的类别。
此链接很好地说明了如何在R中执行带分类变量的回归: