data-manipulation 相关问题

数据操作是将数据从不太有用的状态更改为更有用的状态的过程。

在 ggplot 中使用 3 个变量形成箱线图和散点图时出错

我正在尝试解决在 R 中不断遇到的问题,当我尝试创建并排箱线图以及三个变量的散点图时。我正在使用数据集“Bosto...

回答 1 投票 0

R 中使用数据集的四分位数

我对 R 编程相当陌生,我试图在波士顿数据集(我已将其重命名为 BSTN)中查找标题为“rm”的列的第一和第三四分位数。我不断收到

回答 1 投票 0

使用存储在不同数据帧中的标签值对重新编码整个数据帧

假设我有一个数据框: df <- data.frame( x = c("Yes","No","Yes","Don't Know"), y = c("Male","Female","Refused",&quo...

回答 1 投票 0

如何将当前日期添加到R中的字符串中?

我知道 Sys.Date() 以 YYYY-MM-DD 格式返回当前日期。 我有一个脚本正在保存刚刚被操作的数据集: write.xlsx(DTAX, "C:\User\Me\Documents\File N...

回答 1 投票 0

如何根据R中的条件连接两个数据框?

我们的气象站每周记录每日天气数据(约 7 行/观测)。我们每周收集一次疾病数据(每周一次观察/行)。怎么才能加入最后一排的wea...

回答 1 投票 0

在ggplot2中结合我的两个`geom_abline`来获得图例

我使用此代码绘制了下面的图(请参阅下面的数据),但是当我努力在 aes 调用中获取组以获得有意义的图例(黑色和蓝色线)时。我正在尝试结合...

回答 1 投票 0

如何向列添加月份并根据 pandas 中的频率创建多个列

我下面有一个 DF DF ID 名称 数量 价格 日期 频率 1 abc 20 3 17/01/2022 4 1 abc 10 5 18/03/2022 3 2 防御 10 7 24/01/2022 1 2 def 40 2 25/05...

回答 1 投票 0

使用 pandas 重新格式化数据

我有一个数据集,其结构如所附图像。您能找到一种使用 Python Pandas 更好地格式化这些数据的方法吗?理想情况下,去掉每列中所有领先的 NAN。解释一下,对于

回答 1 投票 0

Python Pandas - 使用校正文件进行数据校正

我通常有很大的数据集,我需要纠正其中的一些特定值。 我想出了一个修正文件,其中我连续有各种条件,其中的值需要根据...进行更改。

回答 1 投票 0

在 R 中转置具有重复/不完整观察的数据集

我有以下数据集: Pt_ID 重要_描述 重要_值 1小时70 1 收缩压 110 1 舒张压 75 1 小时 NA 1 收缩压 105 1 舒张压 60 2 收缩压 150 2 舒张压 90 3小时55 3 收缩压 150 3 舒张压 70 3...

回答 1 投票 0

如何将水平数据变为垂直?

在这里,我使用 Selenium 抓取了 2021/22 至 2024 赛季的英超联赛积分榜,并将其存储在 table_data 中,如下所示: [['1', '兵工厂', '33 23 5 5 77 26 51 74', 'D', ...

回答 1 投票 0

根据 PySpark 中的重复列行创建两个数组

我正在使用 PySpark 并有一个数据帧,它有两列 a 和 b,数据帧中的每列/行只有一个值。 b 中可能(但并不总是)存在重复值...

回答 2 投票 0

如何在linux中使用sed或awk在负数或正数小数前添加空格

我有一个如下所示的文件: GENERID1RSID2VALUE ENSG00000242220rs2826052rs28260520.20961262553802 ENSG00000242220rs2826052rs798932040.00583452893352463 ENSG00000242220rs2826052rs117256228-0.

回答 2 投票 0

编码变量 a、b、c 以匹配来自另一个数据点的变量 x

在 R 中做一些生物信息学,我对此很陌生。 在我的数据集中,每个患者有两个数据条目。然而,仅记录其中一项的患者特征。要做

回答 2 投票 0

如何根据时间戳条件对值进行分组?

我有一个数据框。它看起来像这样: prod_id prod_type 时间戳1 时间戳2 1 A1 2023-12-02 2023-12-01 2 A2 2023-10-10 2023-09-02 3 a1 202...

回答 1 投票 0

R/Python:将 PDF 转换为表格

我的计算机上保存有一个 PDF 图像文件(例如“p1.pdf” - 这是原始文档的扫描副本) - 该文件看起来像这样(我添加了红线以显示

回答 2 投票 0

R 中的字符串拆分为多个位置分隔符

我在分隔符之间分割文本时遇到一些问题,需要具体说明我选择的分隔符。 考虑以下: 一个<- "hello, my, name, is, monty, and, i, wo...

回答 1 投票 0

是否有 R 函数允许您从数值变量中提取单个数字,无论其位置如何(不仅仅是第一个或最后一个数字?

我看过很多关于如何使用 gsub 或 grep 等函数提取数字变量中的第一个数字或最后一个数字的帖子,但是我希望能够提取特定的数字 regar...

回答 1 投票 0

有没有一种方法可以使用 Microsoft Graph REST API 调用获取最近更新的设备和用户?

我正在尝试获取新创建或最近通过 MS Graph REST API 调用修改的用户和设备的列表。 返回的数据不包含任何内容...

回答 1 投票 0

我想用这样的方式总结R中的一个巨大的数据框,我只需要唯一的“lat”,“lon”,“Date(Year)”和“Maxium Value”

我需要总结一个巨大的CSV文件(nrow = 1102300)。这是来自各种气候模型的每日气候数据。 首先,我想总结所有具有“历史”名称的列。我的目标是...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.