scikit-learn 相关问题

scikit-learn是一个用于Python的机器学习库,它为数据分析和数据挖掘提供简单有效的工具,重点是机器学习。它可供所有人使用,并可在各种环境中重复使用。它建立在NumPy和SciPy之上。该项目是开源的,可商业使用(BSD许可证)。

对于我使用 GB、树和随机森林进行房价数据分析,我的 MSE 太高了

我尝试过使用所有变量,也尝试过选择某些变量,但 MSE 仍然很高。我想知道我的代码是否有错误。我还尝试添加一些功能引擎...

回答 1 投票 0

如何将 sklearn 与 numpy 和 pandas 一起导入

我从我们大学的 ipynb 笔记本上复制了这个,但它在导入 sklearn 时停止了(它已经用 pip 安装了)。即使我拿出sklearn,它也会停在pandas上。 小鬼...

回答 1 投票 0

SKlearn 中带有嵌套交叉验证的分类报告(平均值/个体值)

是否可以通过一些解决方法从 cross_val_score 获取分类报告?我正在使用嵌套交叉验证,我可以在这里获得模型的各种分数,但是,我想...

回答 4 投票 0

为什么我的 Pickled 类给我 AttributeError: Can't get attribute 'MyClass'?

我尝试在两台不同的计算机上运行它,但是每当我尝试加载pickle文件时,我都会得到: AttributeError:无法获取属性“MyClass” 我试图了解我做错了什么或者我是否

回答 1 投票 0

在 sklear 风格的类中指定自定义参数

我正在尝试用 Python 实现我自己的、与 sklearn 兼容的分类器。为此,我继承了 BaseEstimator 和 ClassifierMixin,但我还在构造函数中定义了自己的参数。 同时

回答 1 投票 0

Python中通过定义和ROC方法计算准确率(基尼系数)

为什么以下计算准确率的方法会给出不同的结果? 方法 1:累积精度曲线 (CAP) 曲线 准确率是根据定义计算得出的,因为不同...

回答 1 投票 0

AttributeError:估计器ordinalencoder不提供get_feature_names_out。您的意思是调用 pipeline[:-1].get_feature_names_out() 吗?

我已经使用序数编码器为我的分类特征(cat_transformer_ordinal)实现了一个管道,但是当我想要获取特征名称时,该方法(get_feature_names_out())不...

回答 1 投票 0

如何将FastAI分类器集成到sklearn VotingClassifier中?

我有一堆表格数据,我设法用它们训练一个 RandomForestClassifier、一个 GradientBoostingClassifier 和一个深度学习模型(来自 fastai 的表格学习器)。我注意到

回答 1 投票 0

在投票分类器中使用多个机器学习模型

我有一堆表格数据,我设法用它们训练随机森林、梯度增强分类器和深度学习模型(来自 fastai 的表格学习器)。我在结果中注意到...

回答 1 投票 0

在 Transformer 中使用 LabelEncoding 的 ML 模型管道

我正在尝试将各种转换与 LightGBM 模型一起合并到 scikit-learn 管道中。该模型旨在预测二手车的价格。训练完成后,我计划

回答 1 投票 0

sklearn AgglomerativeClustering 中的关键字参数“connectivity”无法按预期工作

在我的Python代码中,我想根据给定的距离矩阵对一组对象进行聚类。然而,有些对象永远不应该出现在同一个簇中。簇数...

回答 1 投票 0

如何在自定义估计器上使用GridSearchCV?

我使用 sklearn BaseEstimator 和 ClassifierMixin 构建了一个自定义 Estimator。但当涉及到交叉验证时,GridSearchCV 给我的分数是 nan 值。 这是估计器的代码:...

回答 1 投票 0

使用 Keras 和 scikit-learn 进行分类时出现无法克隆对象错误(尝试将交叉验证添加到工作模型中)(训练分割有效)

我有一个现有的 NN 模型(顺序模型),带有列车分割测试。我需要向我的数据集添加交叉验证;实施交叉验证后,出现以下错误。 类型错误:...

回答 4 投票 0

如何使 CNN 对 DNA 序列中模式的位置不变?

我正在尝试使用 CNN 在 DNA 序列中查找模式(例如“CTCATGTCA”)来进行二元分类。我用pytorch写了一个模型。当图案位于序列的中心时,

回答 1 投票 0

如何用Python训练朴素贝叶斯模型进行情感分析

我正在尝试训练朴素贝叶斯模型进行情感分析,但我是Python新手,因为我一直在R中工作。 将 pandas 导入为 pd 从 sklearn.feature_extraction.text 导入 TfidfVecto...

回答 1 投票 0

小数据集上的 r 平方分数变化极大

我目前正处于回归任务中。我们收到了一个非常小的数据集,由 47 个数据点组成,具有 2 个特征和 1 个目标值。它看起来像这样: N级,物种,植物

回答 1 投票 0

从内核矩阵中删除特征

我正在尝试使用 SVM 和使用 sklearn 的预计算内核来执行二元分类任务。 我创建了我的火车内核,但我包含了一个我不打算包含的功能,而且这不是预...

回答 1 投票 0

precision_recall_curve 中精度的最后一个值不应该是 1

我正在尝试使用sklearn中的 precision_recall_curve 。但是,我不明白它给我的输出,我认为它看起来是错误的。 将 numpy 导入为 np 从 sklearn 导入指标 y = np.ar...

回答 2 投票 0

pca.tranform(data) 与 data @ pca.components_.T

给定矩阵 X,假设我们这样做: 从 sklearn.decomposition 导入 PCA pca = PCA(n_components=5).fit_transform(X) 给定一个数据矩阵数据,我预计减少到 5 维是......

回答 1 投票 0

如何在 google colab 等 IDE 中导入加州住房数据集

我尝试在我的 Kaggle 和 google colab 笔记本中导入加州住房数据集,但出现 HTTPError。不过这段代码在我的 Jupyter 笔记本上运行良好 从 sklearn.datasets 导入

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.