sklearn-pandas 相关问题

Python模块提供了Scikit-Learn的机器学习方法和熊猫式DataFrame之间的桥梁

如何在python中使用linearRegression

我想在我的csv文件中提取两个功能之间的关系。我想使用linearRegression来确定与这些年相关的肥胖趋势。这是我的代码; CODE#肥胖分析...

回答 1 投票 -1

使用python在数据集中插入数据的函数

我创建了一个从数据集中预测数字的程序。我想当它预测数据时应该是两种情况,如果它预测正确,那么数据应该自动添加到数据集中,否则需要...

回答 1 投票 -2

在DataFrameMapper中显式删除列

请考虑以下人工数据:data = pd.DataFrame({'pet':['cat','dog','dog','fish','cat','dog','cat','fish '],'children':[4.,6,3,...

回答 1 投票 0

如何将第一个值放在一个列中并保留在另一列中?

ROCO2_CLEF_00001.jpg,C3277934,C0002978我想将第一行条目放入一列中,并给列名指定“文件名”,而其余条目则放入另一列名“类”中。怎么做?

回答 1 投票 0

预测类别及其对应的概率

我已经使用maxvoting(决策树,随机森林,逻辑回归)分类器建立了机器学习模型。为此,我输入了{{“工资”:50000,“当前贷款”:15000,“ ...

回答 1 投票 0

如何使用sklearn获得准确的机器学习模型输出

我已经使用maxvoting(决策树,随机森林,逻辑回归)分类器建立了机器学习模型。为此,我输入了{{“工资”:50000,“当前贷款”:15000,“ ...

回答 1 投票 -1

使用DBSCAN进行轨迹聚类

我正在尝试确定轨迹的路径。我有一条经纬度长的轨迹。这是我的代码:def clustersDBSCAN(data):从sklearn.cluster导入DBSCAN a = data coords = a ['...

回答 1 投票 0

如何在具有多个数据框列输入的sklearn管道中编写转换器

我的数据框看起来像+ --------------------- + ------------- ++ ------- -+ --------- + --------- + --------- + |日期pre_close |打开高|低|关闭| | ----------------...

回答 2 投票 0

如何使用预训练的模型来填充缺失的值?

我有一个时间序列索引,几乎没有变量和湿度读数。我已经训练了一个ML模型来基于X,Y和Z预测湿度值。现在,当我使用pickle加载保存的模型时,I ...

回答 1 投票 0

Pandas Groupby均值和多列中的第一列

[我的熊猫df就像下面一样,想要应用groupby,然后想要计算平均值和许多列的第一个索引col1 col2 col3 col4 col5 col6 0 a c 1 2 ...

回答 2 投票 0

如何添加新的5分钟间隔

我想为仅在某些日期上出现的所有日期添加公共时间间隔。这是我的数据样本。此样本数据中没有更多的时间间隔。数据:...

回答 1 投票 0

如何通过熊猫遍历另一列的列值?

我想在X列上使用Z的值。但我想以这种方式工作:Z列的0索引值将被填充为X列的索引1。我想将值从1转换为100索引。...

回答 1 投票 0

StratifiedShuffleSplit错误的输出?

我正在尝试基于分类变量“ Accident_Severity”(严重,严重或轻微)运行StratifiedShuffleSplit。初始分布:轻微182994严重40442 ...

回答 1 投票 0

Sklearn中的ValueError

我组合了以下功能,这些功能可读取csv,训练模型并预测请求数据。我遇到了以下ValueError:当...

回答 1 投票 0

仅在值范围内运算

我有一个数据框,需要在其中基于其他样本来估算一个值。该列为数字,表示行业编号fx(1111-IT,1234-Finance,依此类推)。我试图申请...

回答 1 投票 0

绘制简单的线性回归模型出错

我想创建一个线性回归模型,该模型显示BMI与疾病风险(基线后一年的疾病定量测量)之间呈正相关。数据集是相同的...

回答 1 投票 0

为分类变量sklearn创建我的自定义Imputer

我有一个缺少很多分类值的数据集,我想制作一个定制的imputer,它将用等于“ no-variable_name”的值填充空值。例如,如果列“ ...

回答 3 投票 3

数据点被很好分类的概率

我混合了带标签的数据和未带标签的数据,这最后一个我想使用半监督学习对其进行分类。假设我已经有一种算法,可以在...

回答 1 投票 0

Jupyter Notebook PySpark OSError [WinError 123]文件名,目录名称或卷标签语法不正确:

系统配置:操作系统:Windows 10 Python版本:3.7 Spark版本:2.4.4 SPARK_HOME:C:\ spark \ spark-2.4.4-bin-hadoop2.7问题我正在使用PySpark在..上进行并行计算。 。

回答 1 投票 3

输入包含NaN,无穷大或在执行KMean函数时对于dtype('float64')而言太大的值

我是数据科学领域的新手,在尝试进行KMeans聚类时,我遇到了此错误:输入包含NaN,无穷大或对于dtype('float64')而言太大的值。显然我的编码是...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.