scikit-learn 相关问题

scikit-learn是一个用于Python的机器学习库,它为数据分析和数据挖掘提供简单有效的工具,重点是机器学习。它可供所有人使用,并可在各种环境中重复使用。它建立在NumPy和SciPy之上。该项目是开源的,可商业使用(BSD许可证)。

model.compile 损失类型错误:缺少必需的位置参数

最小的例子是 将 numpy 导入为 np 将张量流导入为 tf 从张量流导入keras 从 keras.losses 导入 huber # 创建数据集 x = np.random.rand(10, 1) y = 2 * x + np.random.randn...

回答 1 投票 0

文本分类。 TFIDF 和朴素贝叶斯? [已关闭]

我正在尝试执行文本分类任务,其中有大约 500 条餐厅评论的训练数据,这些评论被标记为 12 个类别。我花费的时间比实施 TF.IDF 的时间要长......

回答 1 投票 0

在 Github Codespace 中安装 scikit-fda 时出错(fdasrsf 构建问题)

我正在尝试在 github 代码空间上的脚本中导入一个库,即 skfda。 该包不存在,所以我尝试 pip install,我尝试 conda,我尝试从 github 克隆 repo ...

回答 1 投票 0

Sklearn 预处理器按顺序工作,但在 Pipeline 中使用时会产生 NA

上下文如下: 我正在使用包含各种特征类型(数字、分类)的数据集。 我的任务是根据定义的目标变量对启动成功进行二元预测

回答 1 投票 0

ValueError:顺序模型“顺序”尚未定义输出

我想用 akerasClassifier 包装模型并运行 model_prediction = model.fit 我收到了几个月前从未遇到过的错误 这是我建造的模型 def create_model(embed_dim = 16,

回答 1 投票 0

仅具有一个数字特征的逻辑回归

当您只有一个数字特征时,使用 scikit-learn 的 LogisticRegression 求解器的正确方法是什么? 我运行了一个我发现很难解释的简单示例。谁能解释一下我是什么

回答 3 投票 0

scikit-learn 1.1.3。 import 无法在 python 中导入名称“METRIC_MAPPING64”

我正在尝试将 scikit-learn 中的线性模型导入到 vscode 中的 python 代码中,并收到意外的错误消息。 导入sklearn 从sklearn导入线性模型 错误: 无法导入名称 '

回答 1 投票 0

多模态数据的自定义朴素贝叶斯实现与 sklearn.naive_bayes

我目前正在使用朴素贝叶斯算法进行一些分类。 为此,通常假设 p(x|C_i) 是高斯分布。在这个假设下,我会假设这个应用程序...

回答 1 投票 0

不平衡学习管道的哪些部分应用于测试集?

我创建了一个由 RobustScaler、SMOTE-NC、RandomUndersampling 和随机森林分类器组成的不平衡学习管道。 RandomSearchCV 用于选择最佳的超参数。 我...

回答 1 投票 0

每个示例使用多个类别对分类特征进行编码

我正在研究一个数据集,该数据集的一个特征是单个示例具有多个类别。 该功能如下所示:- 特征 0 [类别 1、类别 2、类别...

回答 4 投票 0

为什么我的交叉验证始终比训练测试分割表现更好?

我有下面的代码(使用sklearn),首先使用训练集进行交叉验证,并使用测试集进行最终检查。然而,交叉验证始终表现得更好,因为......

回答 1 投票 0

Sklearn Pipeline:在 ColumnTransformer 中 OneHotEncode 后获取特征名称

我想在安装管道后获取功能名称。 categorical_features = ['品牌', '类别名称', '子类别'] categorical_transformer = 管道(步骤=[ ('imputer', SimpleImputer(stra...

回答 6 投票 0

如何使用 scikit-learn python 库中的聚合聚类算法以及集群中声明的对象数量?

我在代码中使用 scikit-learn Agglomerative Clustering python 库来自动对点进行聚类,并在聚类中心放置一个新的、更大的点。我有一套几千块

回答 1 投票 0

是否可以训练神经网络以输入随机森林分类器或任何其他类型的分类器(例如 XGBoost 或决策树)?

我想创建一个模型架构来预测未来的股价走势,如下所示: 该模型的目标是预测未来 3 个月内价格是上涨还是下跌。 我尝试过...

回答 1 投票 0

为什么我的 PCA 和 sklearn 的 PCA 得到不同的结果?

我尝试使用《机器学习实战》中提供的PCA,但发现它得到的结果与sklearn中PCA得到的结果不一样。我不太明白...

回答 2 投票 0

计算RandomForestClassifier和IsolationForest的内存使用量

我想评估一下两者都用了多少内存 sklearn.ensemble.IsolationForest sklearn.ensemble.RandomForestClassifier 但 sys.sizeof(my_isolation_forest_model) 系统大小(

回答 2 投票 0

通过交叉验证评估逻辑回归

我想使用交叉验证来测试/训练我的数据集,并评估逻辑回归模型在整个数据集上的性能,而不仅仅是在测试集上(例如 25%)。 这些...

回答 2 投票 0

放置在树根中的变量的信息增益是多少?

我正在尝试从 Stepic 解决这个问题: 下载包含三个变量的数据集:sex、exang、num。想象一下 我们想使用决策树来分类患者是否 有心

回答 2 投票 0

sklearn ImportError:无法导入名称plot_roc_curve

我正在尝试按照 sklearn 文档中提供的示例,通过交叉验证绘制接收器操作特性 (ROC) 曲线。但是,以下导入给出了 ImportE...

回答 7 投票 0

对于我使用 GB、树和随机森林进行房价数据分析,我的 MSE 太高了

我尝试过使用所有变量,也尝试过选择某些变量,但 MSE 仍然很高。我想知道我的代码是否有错误。我还尝试添加一些功能引擎...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.