当我在数据上应用这个决策树算法时,我遇到了下面提到的错误--有人能帮助解决这个问题吗?
from sklearn.tree import DecisionTreeRegressor
regressor = DecisionTreeRegressor()
regressor.fit(X_train, y_train)
错误:ValueError。Input contains NaN, infinity or a value too large for dtype('float32').
sklearn 告诉你,你的 X_train 或 y_train 中有缺失值。这在现实世界的数据集中非常常见。由于机器学习算法通常需要数值来进行数学运算,因此你需要以某种方式来填补缺失的数值。常见的方法包括用列的平均值、中位数或模式来替换它们。
下面是一个在sklearn中推算缺失值的综合指南。https: /scikit -learn.orgstablemodulesimpute.html