scikit-learn 相关问题

scikit-learn是一个用于Python的机器学习库,它为数据分析和数据挖掘提供简单有效的工具,重点是机器学习。它可供所有人使用,并可在各种环境中重复使用。它建立在NumPy和SciPy之上。该项目是开源的,可商业使用(BSD许可证)。

如何在Python中使用kNN动态时间扭曲

我有一个带有两个标签(0 和 1)的时间序列数据集。我使用动态时间规整 (DTW) 作为相似性度量,使用 k 最近邻 (kNN) 进行分类,如这两篇文章中所述

回答 3 投票 0

如何计算整个 pandas 数据集的成对互信息?

我的数据框中有 50 个变量。 46 个是因变量,4 个是自变量(降水量、温度、露水、雪)。我想计算我的依赖者的互信息

回答 2 投票 0

使用sklearn进行层次分类

我想知道 sciki-learn 库是否支持分层分类。我正在处理 3 个类,每个类又分为 6 个子类,例如: 将 numpy 导入为 np 来自 sklearn.tree

回答 1 投票 0

sklearn GridSearchCV 给出的结果有问题

我的输入数据 X_train 尺寸为 (477 x 200),y_train 长度为 477。 我想使用支持向量机回归器,并且正在进行网格搜索。 param_grid = {'kernel': ['poly', 'rbf', '

回答 2 投票 0

如何为sklearn knn制作用户定义的可调用权重函数?

我正在尝试为 Sklearn KNN 分类器制作自定义权重,与此处类似。 在文档中只是简单地提到,您可以将自定义权重设置为接受

回答 1 投票 0

具有 NaN 值的 sklearn 管道

出于充分的理由,大多数(全部?)实现拟合和变换(变换器或估计器)的 sklearn 方法不能很好地处理包含 NaN 值的数据。因为大多数机器学习...

回答 1 投票 0

sklearn PolynomialFeatures:如果 LinearRegression 生成 y 截距,是否需要偏差

我是机器学习的新手,所以我一直在尝试一些模型,试图获得更好的理解。 当我创建特征矩阵时: X_Poly3 (X_Poly3 = 多项式特征(3))

回答 1 投票 0

“尝试在使用版本 Y 时从版本 X 中解开估计器 LinearRegression” - 但我的 .venv 上只有 Y 版本,需要做什么?

确切的警告是 ....\.venv\lib\site-packages\sklearn ase.py:329: UserWarning: 使用版本 1.0.2 时尝试从版本 0.24.1 中取消估算器 LinearRegression。这可能会导致...

回答 2 投票 0

Sklearn:如何通过 OneHotEncoder 保留 NaN 值?

输入 我有以下数据: 将 pandas 导入为 pd 将 numpy 导入为 np 从 sklearn.preprocessing 导入 OneHotEncoder 从 sklearn.impute 导入 SimpleImputer test_df = pd.DataFrame({'性别': ['fe...

回答 1 投票 0

使用 pip 后,出现错误“Scikit-learn 尚未正确构建”

我正在使用 Jetson Nano,并且我已经尝试重新安装tensorflow(尝试过不同版本)和numpy(也是不同版本)。我正在使用 pip3 命令,因为我正在使用 python3(版本 3.6...

回答 4 投票 0

如何显示/查看`sklearn.utils.Bunch`数据集?

我正在学习一个使用 sklearn.utils.Bunch 作为数据集的教程: cal_housing = fetch_california_housing() 我在 Databricks 笔记本上运行它。 我已经阅读了文档......

回答 3 投票 0

名称特征不匹配 ML

我正在尝试运行这段代码,它是我从 Git (https://github.com/Rishie-21/ML-based-IDS) 带来的: 从烧瓶导入烧瓶,渲染模板,请求 将 pandas 导入为 pd 从 joblib 导入加载 来自

回答 1 投票 0

标记问题的答案。类别“其他”,该怎么办?

我正在训练 SVC 模型来预测调查中答案的类别。在标签中有一个名为“其他”的类别。我尝试设置一个概率,以便只有答案...

回答 1 投票 0

决策树分类器的底层 sklearn“熵”和“log_loss”标准有区别吗?

我正在使用 sklearn 实现决策树分类器并测试不同的标准,但我似乎找不到“熵”和“log_loss”标准之间的区别。

回答 1 投票 0

MSD 算法输出产生“镜像”输出

我正在使用 MSD 算法将 3D 数据点减少为 2D。 在某些情况下,算法返回的结果似乎反映了 y 轴或 x 轴上的原始数据。我会...

回答 1 投票 0

Kmeans 算法的特征缩放

我知道下定义的 KMeans 算法需要特征缩放 sklearn.cluster.KMeans 我的问题是,在使用 KMeans 之前是否需要手动完成,或者 KMeans 会自动执行...

回答 3 投票 0

Python 数据过滤以消除密度图周围的异常值

参考下图,我想删除以黑色椭圆形标记的密度区域之外的所有异常值。我可以使用简单的水平过滤器,例如 -4 < data < 4. But

回答 1 投票 0

在管道中对目标进行标签编码

我想创建一个管道来对训练特征和目标进行预处理,然后训练模型。数据集会是这样的: v1 v2 目标 0 1 是 1 5 c 无 2 3 f ...

回答 1 投票 0

在一个巨大的向量上执行余弦相似度时出现内存错误

我试图使用词袋模型构建一个基于内容的推荐系统。我下面的教程使用 sklearn 库中大小为 (4000,5000) 的向量的余弦相似度...

回答 1 投票 0

如何从 Google Cloud Storage 存储桶加载保存在 joblib 文件中的模型

我想加载一个从 Google Cloud Storage 存储桶保存为 joblib 文件的模型。当它在本地路径时,我们可以按如下方式加载它(考虑model_file是系统中的完整路径):

回答 6 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.