categorical-data 相关问题

统计数据类型,其值是固定数量的名义类别之一。

尝试修改分类数据时出现 dask 错误

我想转换 dask.DataFrame 的一个分类列。 这是我现在正在做的事情: # 玩具示例 df = pd.DataFrame({'文件': ['A.csv', 'B.csv', 'C.csv']}) df['文件'] = df.file.astype('猫...

回答 1 投票 0

如何更改 R Plotly choropleth 地图中的州边界颜色?

我已经使用此链接中建议的方法复制了 R 中离散颜色的等值线图:如何基于分类变量在 R Plotly 中创建叶绿体图? 然而,正如您...

回答 1 投票 0

为什么当 DF 可以首先容纳分类列中的 None 时,串联无法处理它

我有 2 个带有对象类型列的 DF,它们可以很好地连接。 代码 df1 = pd.DataFrame({'A': ['A0', 'A1'], 'B': ['B0', 无]}) df2 = pd.DataFrame({'A': ['A4', 'A5'], 'B': [无, 无]})

回答 1 投票 0

我想在Python中将分类变量转换为数值

我有一个包含分类变量的数据框。我想使用以下逻辑将它们转换为数字: 我有 2 个列表,其中一个包含列中不同的分类值,并且

回答 5 投票 0

如何将 pandas 中的变量指定为序数/分类变量?

我正在尝试使用 scikit-learn 在数据集上运行一些机器学习算法。我的数据集有一些类似于类别的特征。就像一个特征是 A,它的值是 1,2,3,指定 q...

回答 4 投票 0

查找数据框中所有分类列中每个值的概率

我的问题与查找数据框中所有分类列中每个值的频率几乎相同,但我需要概率,而不是频率。我们可以使用相同的例子

回答 1 投票 0

在 R 中使用一个因变量和一个独立二元变量执行逻辑回归时结果出现错误?

强调文本我有一个数据集 df,其中一个因变量的级别为“0”和“1”,一个自变量的级别为“1”和“2”。关于表演

回答 1 投票 0

从多项回归估计狄利克雷参数

我正在尝试使用多项回归的预测概率,使用 R 中 nnet 包中的多项函数来估计狄利克雷分布的参数,同时采用...

回答 1 投票 0

Pandas - 用 numpy 数组替换分类文本以进行机器学习

我有一个文件: 数据 = pd.read('data.csv') 该文件包含有关数字用户的分类文本数据,例如:(来源 = 'google'、'facebook'、'twitter')和(国家 = 'US'、'FR'、'GER')。 ...

回答 2 投票 0

在 pandas 中重新编码分类变量,每列都有不同的映射

我有一个分类数据的数据框,我想重新编码。 每列都有其单独的重新编码值字典。 下面是我迄今为止所拥有的代码的玩具示例: 进口熊猫...

回答 1 投票 0

测试和训练数据有不同的城市,如何查找差异并在测试和训练数据的两列上使用相同的编码系统进行编码

我有一个测试集和训练集。他们有一个城市列,其中一个(火车)有 290 个唯一的,而测试有 30 个。我希望有重叠,即伦敦、布里斯托尔都在两组中,但格洛斯特可能......

回答 2 投票 0

每个示例使用多个类别对分类特征进行编码

我正在研究一个数据集,该数据集的一个特征是单个示例具有多个类别。 该功能如下所示:- 特征 0 [类别 1、类别 2、类别...

回答 4 投票 0

处理不平衡分类数据的模型

我正在尝试创建出生缺陷数据的分类模型。目标是确定哪些父亲变量与前 5 种出生缺陷最相关。目标变量 'd...

回答 1 投票 0

lavaan:输出分类变量

我们正在运行一个中介模型(SEM),以分类变量作为中介和结果。我们使用“WLSMV”估计器并按顺序定义分类变量。 有没有可能...

回答 1 投票 0

根据列表按列中的值对Python数据帧进行排序

我有一个 pandas 数据框,我试图根据列中的值进行排序,但排序不是按字母顺序排列的。排序基于“排序器”列表(即给出...

回答 1 投票 0

对 pd.pivot_table 中的旋转列进行排序

我有一个这样的数据框: 原始数据框 我打算对其进行调整,使 3 种类型的奖牌成为列,它们各自的计数和平均分数成为值。像这样:

回答 1 投票 0

当 n = r

我最近发现了这个答案,它提供了 Cramer V 的无偏版本的代码,用于计算两个分类变量的相关性: 将 scipy.stats 导入为 ss def cramers_ Corrected...

回答 1 投票 0

Python pandas 字符串处理来自 SQL 数据库的分类数据

我有一个大数据集,需要读入 pandas 数据框。 它包含大量由一些相当长的字符串组成的分类数据。 尝试使用 pandas read_sql_query 方法我无法...

回答 2 投票 0

您能在seaborn中突出显示分类散点图中的具体观察结果吗?

我有 8 个类别,并且我已经使用 sns.catplot 绘制了分类散点图。有没有办法突出显示每个类别中的特定观察结果,以比较相对于...的位置

回答 1 投票 0

将全局 P 值添加到逻辑回归和 cox 比例风险模型 - 使用哪些测试?这是沃尔德测试吗?

我被要求为我的多变量逻辑回归模型和多变量 cox 比例风险模型中的分类变量添加全局 p 值。 我用过这个功能

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.