categorical-data 相关问题

统计数据类型,其值是固定数量的名义类别之一。

当 n = r

我最近发现了这个答案,它提供了 Cramer V 的无偏版本的代码,用于计算两个分类变量的相关性: 将 scipy.stats 导入为 ss def cramers_ Corrected...

回答 1 投票 0

Python pandas 字符串处理来自 SQL 数据库的分类数据

我有一个大数据集,需要读入 pandas 数据框。 它包含大量由一些相当长的字符串组成的分类数据。 尝试使用 pandas read_sql_query 方法我无法...

回答 2 投票 0

您能在seaborn中突出显示分类散点图中的具体观察结果吗?

我有 8 个类别,并且我已经使用 sns.catplot 绘制了分类散点图。有没有办法突出显示每个类别中的特定观察结果,以比较相对于...的位置

回答 1 投票 0

将全局 P 值添加到逻辑回归和 cox 比例风险模型 - 使用哪些测试?这是沃尔德测试吗?

我被要求为我的多变量逻辑回归模型和多变量 cox 比例风险模型中的分类变量添加全局 p 值。 我用过这个功能

回答 2 投票 0

如何使用pandas的read_csv读取分类列?

我尝试使用 read_csv 作为 dtype={n: pandas.Categorical} 传递 dtype 参数,但这无法正常工作(结果是一个对象)。说明书不清楚。 可以读吗

回答 2 投票 0

更改分类变量的值 - PYTHON

我有一个如下所示的日期框: 城市_公司 主题 伦敦 卫生保健 西雅图 创业精神 哥本哈根 工程 墨尔本 法律 山顶风光 乙 布里斯班 C 旧金山 d 有洛...

回答 1 投票 0

处理 QY 数据:如何定义 QY 因素的水平

我有一个包含“年”、“季度”、“QY”列和许多数值变量的数据集。 #示例数据集 年 = c("2019", "2020", "2021", “2019”、“2020”……

回答 1 投票 0

catboost 有最大类别数吗?

我正在考虑尝试对大量类别进行建模。我读到 catboost 有一种算法可以将类别转换为有序浮点数以优化决策树分割。算法有吗...

回答 1 投票 0

如何绘制 X 轴上有两个分类变量(一个嵌套,但都可见)并用其他变量填充的条形图?

我有一个包含两个分类变量、区域和函数的数据集。共有92个区域,分为13个功能类别。除了这些属于功能性区域的区域...

回答 1 投票 0

如果列是最近一年,则从多个列返回值

我有一个包含变量的数据集 “年”(2014-2023), 'Landcover2013'(分类变量 1-4), '土地覆盖2015', '土地覆盖2017', '土地覆盖2019', '土地覆盖2021', 'Sub_landcover2013' (

回答 1 投票 0

根据包含多个其他变量的子句计算新变量

我有一个包含变量的数据集 “年”(2014-2023), 'Landcover2013'(分类变量 1-4), '土地覆盖2015', '土地覆盖2017', '土地覆盖2019', '土地覆盖2021', 'Sub_landcover2013' (

回答 1 投票 0

在 R 中对时间序列数据中的分类变量进行上采样

如果这是多余的,我深表歉意,但我尝试寻找解决方案,但没有找到任何似乎是我的问题的答案。所以,我有一堆变量的时间序列数据......

回答 1 投票 0

如何从 pandas DataFrame 中删除所有分类列?

分类列是节省 pandas 内存的好方法,但有时它们只会减慢速度。特别是当你过了拥有大数据的阶段之后...

回答 2 投票 0

数值变量和分类变量之间的简单线性回归

我需要你的帮助,因为我是数据分析方面的新手。我有一个数据框 iv csv,其中包含有关销售业绩的数据。数据集的列是“SalesDate”作为 datetime64[ns]、“

回答 1 投票 0

使用 MICE 来输入分类变量,但限制可能的值

我有一个分类变量 var1,它可以采用“W”、“B”、“A”、“M”、“N”或“P”值。我想归咎于缺失,但我知道......

回答 3 投票 0

如何在 Polars Dataframe 中创建非字母顺序的分类列?

在 Pandas 中,您可以从现有字符串列创建“有序”分类列,如下所示: column_values_with_custom_order = [“B”、“A”、“C”] df["

回答 3 投票 0

在 Python 中识别大型数据集中的布尔值

请问有没有一个Python函数可以识别大型数据集中的布尔值? 有 30 多个列? 受益人摘要文件为每个成员提供了几个慢性疾病栏。这些 是布尔字段...

回答 1 投票 0

在 R 中创建比例表时出错:表中的错误(st2.affect):尝试创建包含 \>= 2^31 个元素的表

我在 R Error in table(st2.affect) 中遇到此错误:当我尝试使用函数(或任何其他比例函数)时,尝试制作一个包含 >= 2^31 元素的表格 比例(表(st2.affect),m...

回答 1 投票 0

dplyr 使用条件值 AND OR 进行变异以创建组类别

我有一个数据集,其中有一个名为“个体”的变量,有很多选项,就像这样。 我对某一天对不同个体 (Individual_ID) 的观察结果 不同的选择...

回答 1 投票 0

是否可以使用pandas的read_csv读取分类列?

我尝试使用 read_csv 作为 dtype={n: pandas.Categorical} 传递 dtype 参数,但这无法正常工作(结果是一个对象)。说明书不清楚。

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.