我的目标是创建模型训练和测试以预测和找到最低的 RMSE
之后我必须使用训练模型预测来测试名为( scoringData ,其中没有我的目标变量评级)的第二个数据集
我尝试过多种算法,如 lm 、随机森林、ranger 等
但主要问题是,当我将执行者列从字符转换为因子时,然后我将其与前 5 名执行者进行排序,所以我得到 5 个级别,剩下的是 NA 值(不知道为什么,然后我把其他人的 NA 值)
我得到 RMSE n all for train model
但是当我在第二个数据集( socringData )上预测它时,它会触发错误,例如 训练模型中不存在因子水平
有什么办法可以解决这个问题,我在编码领域是全新的 任何帮助将不胜感激