sklearn-pandas 相关问题

Python模块提供了Scikit-Learn的机器学习方法和熊猫式DataFrame之间的桥梁

输入包含NaN,无穷大或在执行KMean函数时对于dtype('float64')而言太大的值

我是数据科学领域的新手,在尝试进行KMeans聚类时,我遇到了此错误:输入包含NaN,无穷大或对于dtype('float64')而言太大的值。显然我的编码是...

回答 1 投票 0

如何将图像转换为ML分类器的输入?

[我想构建一个图像分类器,我从Web上收集图像,然后使用PIL libray调整它们的大小,现在我希望将这些图像转换为输入。我需要对这些图像执行什么操作...

回答 1 投票 0

交替时间的机器学习

我有一个多项式回归脚本,可以正确地预测X和Y轴的值,在我的示例中,我使用CPU消耗,下面我们看到一个数据集的示例:完整的数据集...

回答 1 投票 0

要使用python确定给定数据集的最佳k均值

我对python和杂乱无章的东西很陌生。现在,我的任务是分析一组数据,并使用弯头和轮廓法确定最佳Kmean。如图所示,我的...

回答 1 投票 0

Sklearn的SimpleImputer在管道中时无法检索插补值

在尝试使用SimpleImputer后,我会打印出所有插补值。单独使用SimpleImputer时,我可以从实例的statistics_属性中检索它们。这有效...

回答 1 投票 1

使用余弦相似性的K均值-Python

我正在尝试在python中实现Kmeans算法,该算法将使用余弦距离而不是欧式距离作为距离度量。我了解使用不同的距离函数可能是致命的...

回答 1 投票 12

我们如何在Python中创建超链接的字符串?有办法吗?

我正在使用nltk.util对构建一个聊天机器人。我正在为组合使用正则表达式!我希望回答之一是“访问Google”,其中“ Google”应该是一个超链接,应该...

回答 2 投票 0

PCA之后的sklearn余弦相似度内存错误

我有一个包含9000行(文档)和1810列(术语)的文档术语矩阵。我将PCA应用于降维,即输出9000x200矩阵。我的目的是聚类...

回答 1 投票 0

具有sklearn的2个相似网格数据帧中的最近成员

我有2个数据帧:df1:xy c0 2 468958.147443 4.633810e + 06 1.253041 43 475516.484948 4.634928e + 06 1.423767 72 475802.708042 4.635308e + ...

回答 1 投票 0

如何使用交叉验证计算RMSE时如何舍入y

[当我在sklearn中使用交叉验证时,它将返回我一个RMSE值。 RMSE值由预测y值(例如7.11)的均方根-实际y值(例如6)的均方根计算得出...

回答 1 投票 0

XGBoost-scale_pos_weight和class_weights之间的差

假设我们有一个高度不平衡的二进制分类问题。现在,XGBoost为我们提供了2个选项来管理培训期间的班级失衡。一种是使用参数...

回答 1 投票 0

如何使用Python在Excel文件中删除具有特定值的列中的行

我有这样的数据:我想删除用户ID_2列中数据大于和小于5位的行

回答 3 投票 -4

近端成员属性分析

我有以下数据帧df(样本):纬度crs Band1 x y 0 41.855584 20.619156 b''1568.0 468388.198606 4.633812e + 06 1 41.855584 20.622590 b''...

回答 1 投票 1

如何通过交叉验证来测试看不见的测试数据并预测标签?

1。包含数据(即文本描述)以及分类标签的CSV df = pd.read_csv('./ output / csv_sanitized_16_.csv',dtype = str)X = df ['description_plus'] y = df ['category_id'] 2.This ...

回答 1 投票 0

如何使用python在excel文件中删除具有特定值的列中的行

我有这样的用户数据,我想删除用户ID_2列中数据大于和小于5位的行

回答 2 投票 -2

[当机器学习模型标准化StandardScaler时如何预测新值

[我正在使用机器学习模型,我有一个带有数据的数据框,我使用标准分布缩放器= StandardScaler()df = scaler.fit_transform(df)对数据进行归一化,然后除以...

回答 1 投票 -1

Groupby并归一化所选列Pandas DF

我有一个样本DF,我想根据2个条件进行归一化。创建样本DF:sample_df = pd.DataFrame(np.random.randint(1,20,size =(10,3)),column = list(' ABC'))sample_df [“ date”] = [“ 2020-02 -...

回答 2 投票 0

Pandas / sklearn:向量化大量的LinearRegression计算

我有一个Pandas DataFrame,我需要在其中计算大量的回归系数。每次计算都是二维的。自变量将是['Base'],它是...

回答 2 投票 0

产生Kmeans的重心按升序排列

我正在尝试使用Sklearn库在Python中使用Kmean算法。我的问题是,这有什么办法可以使我产生升序的中间状态。例如,这是我的代码:...

回答 2 投票 3

通过嵌套的JSOn构建Pandas数据框

我具有以下格式的JSON数据-[{“分数”:0.9228411211686975,“ keypoints”:[{“分数”:0.9997879266738892,“ part”:“ ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.