我正在尝试通过RWeka创建一个NB分类器,它返回一个变量类型错误。
我有以下变量:
dtm_df.train
作为包含以下内容的data.frame
ask check state
1_10 0 1 bad
1_100 1 0 bad
1_11 2 1 good
1_13 0 0 bad
1_14 0 0 good
1_15 0 1 bad
1_16 0 1 good
1_17 0 0 bad
1_19 0 0 bad
1_2 2 0 bad
和class.formula
作为配方包含:state ~ ask + check
使用时
NB <- make_Weka_classifier("weka/classifiers/bayes/NaiveBayes")
classifier <- NB(class.formula ~ ., dtm_df.train)
它返回:
Error in model.frame.default(formula = class.formula ~ ., data = dtm_df.train) : object is not a matrix
将数据参数dtm_df.train
转换为矩阵不起作用,因为它需要data.frame。
尝试时:
classifier <- NB(class.formula ~ ., dtm_df.train)
它回来了
Error in .jcall(o, "Ljava/lang/Class;", "getClass") :
weka.core.UnsupportedAttributeTypeException: weka.classifiers.bayes.NaiveBayes: Cannot handle string class!
发现原因实际上是列车集dtm_df.train
中的州列的格式。
解决方案是通过以下方式将该列转换为因子:
dtm_df.train$state <- as.factor(dtm_df.train$state)