data-manipulation 相关问题

数据操作是将数据从不太有用的状态更改为更有用的状态的过程。

在 R 中转置具有重复/不完整观察的数据集

我有以下数据集: Pt_ID 重要_描述 重要_值 1小时70 1 收缩压 110 1 舒张压 75 1 小时 NA 1 收缩压 105 1 舒张压 60 2 收缩压 150 2 舒张压 90 3小时55 3 收缩压 150 3 舒张压 70 3...

回答 1 投票 0

如何将水平数据变为垂直?

在这里,我使用 Selenium 抓取了 2021/22 至 2024 赛季的英超联赛积分榜,并将其存储在 table_data 中,如下所示: [['1', '兵工厂', '33 23 5 5 77 26 51 74', 'D', ...

回答 1 投票 0

根据 PySpark 中的重复列行创建两个数组

我正在使用 PySpark 并有一个数据帧,它有两列 a 和 b,数据帧中的每列/行只有一个值。 b 中可能(但并不总是)存在重复值...

回答 2 投票 0

如何在linux中使用sed或awk在负数或正数小数前添加空格

我有一个如下所示的文件: GENERID1RSID2VALUE ENSG00000242220rs2826052rs28260520.20961262553802 ENSG00000242220rs2826052rs798932040.00583452893352463 ENSG00000242220rs2826052rs117256228-0.

回答 2 投票 0

编码变量 a、b、c 以匹配来自另一个数据点的变量 x

在 R 中做一些生物信息学,我对此很陌生。 在我的数据集中,每个患者有两个数据条目。然而,仅记录其中一项的患者特征。要做

回答 2 投票 0

如何根据时间戳条件对值进行分组?

我有一个数据框。它看起来像这样: prod_id prod_type 时间戳1 时间戳2 1 A1 2023-12-02 2023-12-01 2 A2 2023-10-10 2023-09-02 3 a1 202...

回答 1 投票 0

R/Python:将 PDF 转换为表格

我的计算机上保存有一个 PDF 图像文件(例如“p1.pdf” - 这是原始文档的扫描副本) - 该文件看起来像这样(我添加了红线以显示

回答 2 投票 0

R 中的字符串拆分为多个位置分隔符

我在分隔符之间分割文本时遇到一些问题,需要具体说明我选择的分隔符。 考虑以下: 一个<- "hello, my, name, is, monty, and, i, wo...

回答 1 投票 0

是否有 R 函数允许您从数值变量中提取单个数字,无论其位置如何(不仅仅是第一个或最后一个数字?

我看过很多关于如何使用 gsub 或 grep 等函数提取数字变量中的第一个数字或最后一个数字的帖子,但是我希望能够提取特定的数字 regar...

回答 1 投票 0

有没有一种方法可以使用 Microsoft Graph REST API 调用获取最近更新的设备和用户?

我正在尝试获取新创建或最近通过 MS Graph REST API 调用修改的用户和设备的列表。 返回的数据不包含任何内容...

回答 1 投票 0

我想用这样的方式总结R中的一个巨大的数据框,我只需要唯一的“lat”,“lon”,“Date(Year)”和“Maxium Value”

我需要总结一个巨大的CSV文件(nrow = 1102300)。这是来自各种气候模型的每日气候数据。 首先,我想总结所有具有“历史”名称的列。我的目标是...

回答 1 投票 0

对 pandas 数据框进行下采样,保持每个月相同比例的目标

我有一个 pandas 数据框 df,其中“TARGET”列的值为 0 或 1,“MONTH”列收集不同的月份: 月 #_OBS_TARGET=0 #_OBS_TARGET=1 202207 44619 52960 202208 4...

回答 1 投票 0

如果数据框中其他位置满足条件,则向 R 数据框添加空白行

文件在这里:https://github.com/pb865/exmaplefile 这些是来自行为任务的数据,其中事件代码 (ecode) 列下的 30 和 31 指的是响应,任何小于 30 的都是刺激...

回答 1 投票 0

使用 R 中的开始和结束日期计算活跃爆发的计数

我有一个数据集,用于查看设施中呼吸道疾病的爆发情况。爆发有开始和结束日期,并表明是否存在 COVID-19、流感或 RSV,可能有 mu...

回答 1 投票 0

合并更新键的对象

假设我有两个对象,例如 常量 obj1 = { a: [{asd1: 1}, {asd2: 2}, {asd3: 3}] } 常量 obj2 = { 一个:[{asd4:4}], b: [{a: "asd"}, {b: "asd"}] } 我必须合并...

回答 1 投票 0

R 有没有办法选择列的第一个实例并垂直排列列表?

我现在的数据结构是这样的。 年龄组 年龄分区 总估计 邮政编码 single_age ...

回答 1 投票 0

计算大型数据帧每条线的半径内点数的最快方法是什么?

我有大约 400 万行数据,主要是在大城市和旅游胜地收集的。我遇到的问题是我希望能够比较欠采样位置的数据...

回答 1 投票 0

有没有办法根据体重从各组中创建甚至单岁的年龄?

我正在尝试在这里进行一些高级数据操作。 下面的数据有字符格式的age_group类别。我还有age_division,它是一个数字,我们通过除以age_group 来得到它

回答 1 投票 0

有没有办法通过调节两列来扩展数据框中的行?

我的数据结构如下: 弧度_1 分区编号 间隔 1 2 4 1 3 2 2 3 3 我想按划分和间隔扩展行。如果间隔为 4 并且除法为 2,则展开行

回答 1 投票 0

计算满足 R 中条件的连续列

我正在 RStudio 中处理我的数据集,其中包含在不同地点饲养的奶牛的每日产奶量。另外,我有 5 列,其中包含相应的前 5 天的温度...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.