我有一个具有多个特征的数据集。其中一项特征可以采用 10 个可能的离散值。使用 sklearn 生成回归树时,如何让树在离散值之一而不是连续范围上分割节点。例如,假设特征 X 可以取值 0.0、0.1、0.2、0.3、0.4、0.5.0.6、0.7、0.8 和 0,9。目前在生成回归树时,当前图显示当 X < 0.25. Is it possible to modify my code so that a split can only be made using the above discrete values?
时进行分割我认为将数值数据转换为分类数据将有助于树离散分裂,但显然 sklearn 不能使用分类数据
感谢您阅读这个问题