scikit-learn 相关问题

scikit-learn是一个用于Python的机器学习库,它为数据分析和数据挖掘提供简单有效的工具,重点是机器学习。它可供所有人使用,并可在各种环境中重复使用。它建立在NumPy和SciPy之上。该项目是开源的,可商业使用(BSD许可证)。

Python 中多重处理的停滞

我遇到了多处理模块的奇怪行为。谁能解释一下这是怎么回事? 以下 MWE 停止(永远运行而不会出现错误): #!/usr/bin/env python3 导入

回答 1 投票 0

是否可以通过 scikit-learn 中的自定义内核的网格搜索来调整参数?

我有一个自定义内核函数,并且我将 GridSearchCV 函数与 SVC(kernel=my_kernel)一起使用。 my_kernel 函数需要一个参数 k 来调整,所以我想知道是否可以配置...

回答 4 投票 0

Heroku 上的 Python Flask Web API,代码在本地工作,但部署时超时

我正在开发一个 Flutter 移动应用程序,该应用程序在应用程序中使用 ML 模型。我将我的文件发送到 Heroku 服务器上的 Flask API,以通过 python 提取特征并将它们发送回 ap...

回答 1 投票 0

Scikit-learn PR:“上传到 Codecov”失败

下午好, 当我向 scikit-learn 发出拉取请求时,管道“Linux pymin_conda_defaults_openblas”“上传到 Codecov”部分失败,并出现错误: [2024-04-05T12:5...

回答 1 投票 0

使用cross_val_score时如何每次打乱数据?

训练 Ridge 分类器时,我能够执行 10 折交叉验证,如下所示: clf = Linear_model.RidgeClassifier() n_folds = 10 分数 = cross_val_score(clf, X_train, y_train, cv=n_folds)

回答 1 投票 0

sklearn ndcg_score 返回了错误的结果

我正在从事一个涉及使用NDCG(归一化分布累积增益)的项目,并且我了解该方法的基础计算。 所以我从 sklearn.metric 导入了 ndcg_score...

回答 2 投票 0

Mlflow log_figure删除神器

我正在运行带有自动记录功能的 mlflow 来跟踪 xgboost 模型。默认情况下,它在工件下保存模型、需求和功能重要性。我想保留很酷的东西。 但是,如果我尝试添加

回答 1 投票 0

Windows 7 中 Kmeans 出现“无法找到物理核心数量”错误

我在 64 位 Windows 7 上运行 Python 3.8.10。我正在尝试运行这个简单的示例: 从 sklearn.cluster 导入 KMeans 将 numpy 导入为 np X = np.array([[1, 2], [1, 4], [1, 0], ...

回答 1 投票 0

如何从嵌入 ColumnTransformer 中的 OneHotEncoder 获取特征名称?

如何从嵌入 ColumnTransformer 中的 OneHotEncoder 获取特征名称? 下面这段代码: 将 pandas 导入为 pd 从 sklearn.compose 导入 ColumnTransformer 来自sklearn。

回答 1 投票 0

平均精度 - python

我正在计算前 k 个检索对象的平均精度。这是我的代码。在这个阶段,我正在计算R@K。 代码从 csv 文件中读取两个列表,然后从列表中获取样本,c...

回答 1 投票 0

改进样本外预测 XG boost/RF

我有一个非常广泛的 XGB Boost/RF,其中样本内预测相当不错。根据验证集,它看起来并没有过度拟合。如果我做出实际预测,该模型只是采用......

回答 1 投票 0

某些模型可能会过度拟合而其他模型则不会在相同的数据上吗?

我正在使用 scikit learn 构建 ML 模型。根据特征重要性删除一些特征并尝试避免多重共线性后,一些模型显示出过度拟合的迹象,而另一些则没有......

回答 1 投票 0

Python sklearn r2_score 线性回归的混淆

抱歉,如果这是一个微不足道的问题。 使用 sklearn 库,可以计算以下列表的决定系数 r 平方: y_true = [200,280,320,346.47] y_pred = [228....

回答 1 投票 0

TypeError:“模块”对象在 django 4 中不可迭代

TypeError:“模块”对象在 django 4 中不可迭代 我收到上述错误,它已经持续了足够长的时间,此时我真的需要帮助。 我正在使用 pickle 加载 ML 模型,Djan...

回答 2 投票 0

在sklearn中制作自定义评分器是否会影响gridsearchCV中估计器的损失函数?

我正在使用 SVM 并尝试使用 GridSearchCV 调整超参数。我还制作了一个自定义评分器来适应我预期的性能指标,并将其传递给评分参数。 我有点……

回答 1 投票 0

Pylance 抱怨 sklearn.datasets.load_iris()

我正在使用 Pylance 和类型检查模式:基本,并且我正在使用 sklearn.datasets.load_iris() 加载 iris 数据集。 从 sklearn.datasets 导入 load_iris def main(): 虹膜 = load_iris() ...

回答 1 投票 0

Python:GridSearchCV 花费太长时间才能完成运行

我正在尝试进行网格搜索来优化我的模型,但执行时间太长。我的总数据集只有大约 15,000 个观察值,大约有 30-40 个变量。我成功...

回答 3 投票 0

是否有 xgb.XGBRegressor 的示例,其中回调=[early_stop],early_stop=xgb.callback.EarlyStopping 用于 cross_val_predict?

在文档中 XGBClassifier 有一个 EarlyStopping: ```` es = xgboost.callback.EarlyStopping( 轮数=2, min_delta=1e-3, save_best=真, 最大化=假, data_name="validation_0&

回答 1 投票 0

如何为自定义变压器创建 pandas 输出?

scikit-learn 1.2.0 中有很多变化,它支持所有变压器的 pandas 输出,但如何在自定义变压器中使用它? 在[1]中:这是我的自定义变压器...

回答 3 投票 0

scikit learn GridSearchCV 始终返回最佳参数

我将 GridSearchCV 的参数设置为: 参数 = {'kernel':['rbf'], 'C':[1, 5, 0.5], 'gamma':[1, 5, 0.5]} 网格 = GridSearchCV(SVC(), 参数) grid.fit(数据集,目标) 然后 grid.best_par...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.