sklearn-pandas 相关问题

Python模块提供了Scikit-Learn的机器学习方法和熊猫式DataFrame之间的桥梁

Sklearn 预处理器按顺序工作,但在 Pipeline 中使用时会产生 NA

上下文如下: 我正在使用包含各种特征类型(数字、分类)的数据集。 我的任务是根据定义的目标变量对启动成功进行二元预测

回答 1 投票 0

model.fit() 类权重在训练模型时不起作用

计算classes_weight时 从 sklearn.utils 导入 class_weight class_weights = class_weight.compute_class_weight(class_weight="平衡", 类=np.unique(

回答 1 投票 0

使用掩码插入 sklearn 迭代输入器中的值

我创建了一组随机缺失值来使用树输入器进行练习。但是,我一直不知道如何将缺失的值覆盖到我的数据框中。我的缺失值如下所示: 来自

回答 1 投票 0

尝试安装 scikit-learn 时出现“UnsatisfiableError”

我需要 sklearn,这就是为什么我尝试使用 conda install scikit-learn 在 conda 环境中安装 scikit-learn 但结果是: 求解环境:初始冻结求解失败。使用 fl 重试...

回答 2 投票 0

Pycharm 中没有名为“pandas”的模块

我阅读了所有相关主题,但无法解决我的问题: 回溯(最近一次调用最后一次): 文件“/home/.../.../.../reading_data.py”,第 1 行,位于 将 pandas 导入为 pd

回答 6 投票 0

数据基数不明确 sklearn.train

model.fit(x_train, y_train, epochs=1000) 我正在尝试制作一个人工智能,但我的代码给出了一个错误,我不知道如何修复它? 这是错误 ValueError:数据基数不明确: x 尺寸:455 ...

回答 1 投票 0

Mlflow log_figure删除神器

我正在运行带有自动记录功能的 mlflow 来跟踪 xgboost 模型。默认情况下,它在工件下保存模型、需求和功能重要性。我想保留很酷的东西。 但是,如果我尝试添加

回答 1 投票 0

多元线性回归房价r2得分问题

我有样本房价数据和简单代码: 将 pandas 导入为 pd 从 sklearn.preprocessing 导入 LabelEncoder、StandardScaler 从 sklearn.model_selection 导入 train_test_split 来自sklearn。

回答 1 投票 0

ModuleNotFoundError:没有名为“sklearn.metrics.regression”的模块

尝试执行以下导入: 从 sklearn.metrics.regression 导入mean_absolute_error、mean_squared_error、r2_score 我收到错误: ModuleNotFoundError:没有名为“sklearn.metrics”的模块。

回答 3 投票 0

如何将 Dataframe Mapper 转换为 PMML?

我想使用多个PMML来将数据的转换和模型的应用分开。这是我正在使用的代码。我这样做是因为我想包括某种

回答 1 投票 0

如何仅将Dataframe Mapper转换为PMML

我想使用多个PMMLS来将数据转换和模型应用分开。以下是我正在使用的代码。我这样做是因为我想包括某种

回答 1 投票 0

使用多列对 pandas DataFrame 进行精确分层

我找到了一种将 pandas DataFrame 分层到多个列的解决方案。然而,获得的分层并不准确,因为有些标签在证书中更具代表性......

回答 1 投票 0

如何使用 kd 树获取直接邻居而不考虑间距?

我想在多维空间(最多 7 维)中找到给定点周围的直接邻居。 有关该空间的重要事实: 一毛钱内的点之间的非线性间距...

回答 1 投票 0

如何将列值与另一个数据帧逐行相乘?

我有一个像这样的数据框。我必须将“因子”列值逐行与另一个数据框相乘 我想要这样的结果 我尝试过 df.mul。但它给了我所有的 NAN 价值...

回答 3 投票 0

我正在使用 sklearn 进行分类预测模型,并不断收到相同的错误“支持的目标类型是:('二元','多类')

我正在使用以下分类模型: 线性回归 逻辑回归 K邻居分类器 决策树分类器 我正在尝试制作一些预测模型,每次我尝试......

回答 1 投票 0

如何为 test_train_split 选择数据框中的数据列和目标列?

我正在尝试使用从 csv 读取到 pandas 数据帧的数据来设置 test_train_split 。我正在读的书说我应该分成 x_train 作为数据和 y_train 作为目标,但是...

回答 2 投票 0

如何在具有分类和数字特征的 pandas 数据帧上应用一种热编码?

一些特征是数字的,例如“学校毕业率”,而其他特征是分类的,例如学校名称。我在类别特征上使用了标签编码器...

回答 1 投票 0

ValueError:“顺序”层的输入 0 与该层不兼容:预期形状=(无,455,30),发现形状=(无,30)

这是癌症检测的小项目,它已经有了数据集和colab代码,但是执行时出现错误 model.fit(x_train, y_train, epochs=1000) 错误是: 值错误...

回答 4 投票 0

“为什么我的机器学习模型的准确率低于预期?”

在此输入图像描述 我训练了一个天气预报模型,但是它的准确率太低,如何提高天气预报准确率% 决策树分类器 随机森林分类器 SVC

回答 1 投票 0

将 kNN 与加权数据集结合使用

我有一个数据集 df: 类别 变种1 ... 变种32 加权 国家 1 蓝色的 1.0 54.2 3.0 我们 2 粉色的 0.0 101.0 1.0 其他 3 蓝色的 1.0 49.9 3.0 我们 4 绿色的 1.0 72.2 9.0 我们 我正在使用 kNN 分类...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.