我有一个名为 song_analysis 的数据集,它有 23 列,其中 3 列是角色(表演者姓名、歌曲名称、流派)l

问题描述 投票:0回答:0

我的目标是创建模型训练和测试以预测和找到最低的 RMSE

之后我必须使用训练模型预测来测试名为( scoringData ,其中没有我的目标变量评级)的第二个数据集

我尝试过多种算法,如 lm 、随机森林、ranger 等

但主要问题是,当我将执行者列从字符转换为因子时,然后我将其与前 5 名执行者进行排序,所以我得到 5 个级别,剩下的是 NA 值(不知道为什么,然后我把其他人的 NA 值)

我得到 RMSE n all for train model

但是当我在第二个数据集( socringData )上预测它时,它会触发错误,例如 训练模型中不存在因子水平

有什么办法可以解决这个问题,我在编码领域是全新的 任何帮助将不胜感激

r testing random-forest prediction training-data
© www.soinside.com 2019 - 2024. All rights reserved.