data-manipulation 相关问题

数据操作是将数据从不太有用的状态更改为更有用的状态的过程。

Mean() 无法将函数用作饼图中的参数

我是 R 的初学者。我正在使用 dplyr 进行一些数据操作练习,但遇到了一些我不太明白的事情。 我正在进行一项使用“泰坦尼克号”训练数据的练习...

回答 1 投票 0

如何获取 R 列中某个段之后的每个字符?

德克萨斯州假城法院 我想返回: 法院大楼 这是我从另一篇文章中得到的。我用它来提取城市部分。 gsub(",.*$", "", COLUMN$Enti...

回答 2 投票 0

重构 Gamble 数据库进行比较

对于一个业余项目,我正在比较 2 个博彩机构的赔率,但在将这些信息以正确的格式放入我的表格中时遇到了一些麻烦。 目前我有下表: 提供者

回答 1 投票 0

如何将极坐标日期时间列转换为字符串列?

我正在尝试使用 Polars 库将日期时间列更改为字符串列。我只想要新列上的日期: 将极坐标导入为 pl df 形状:(139878, 1) ┌──────────────────────┐ │ 日期_ti...

回答 3 投票 0

关于使用loc方法根据现有列创建新列的问题

我有两个名为 df 和 df2 的数据框,具有相同的行数。我想基于一些逻辑比较在 df 中创建一个新列,如下所示 df['new_col']='什么都没有' df.loc[(df2['col...

回答 1 投票 0

学生在R中的互动效果

我正在使用 R 中的数据集 df1。它有两列:日期和学生 ID。我首先想找出在某个日期一起出现的学生对的数量。假设这些 p...

回答 1 投票 0

如果字符串显示,如何获取最短日期?

Stackoverflow 社区您好, 当出现字符串时,我无法找出如何获取最短日期。例如,我知道如何通过执行 df['date'].min() 来获取最短日期,但我有一个 co...

回答 1 投票 0

根据 PySpark 中的多个高级标准过滤行

目前,我正在对数据库执行一些计算,该数据库包含有关借款人如何支付贷款的信息。 我的目标是创建一个新的数据框架,其中包括...

回答 1 投票 0

crossJoin 不使用 crossJoin 的两个 Spark 数据帧

假设我有两个 Spark 数据框: 从 pyspark.sql 导入 SparkSession # 创建一个 SparkSession 火花 = SparkSession.builder.getOrCreate() # DataFrame 1 的示例数据 数据1 = [ (&q...

回答 1 投票 0

连接两个 Spark 数据框以获得所有可能的默认值组合

假设我有两个 Spark 数据框: 从 pyspark.sql 导入 SparkSession # 创建一个 SparkSession 火花 = SparkSession.builder.getOrCreate() # DataFrame 1 的示例数据 数据1 = [ (&q...

回答 1 投票 0

连接两个 Spark 数据帧以获取默认值

让我有两个 Spark 数据框: 从 pyspark.sql 导入 SparkSession 从 pyspark.sql.functions 导入 col、concat_ws、coalesce # 创建一个 SparkSession 火花 = SparkSession.builder \ .应用程序...

回答 0 投票 0

从对象中提取特定属性及其值

假设我有这个对象: 让用户信息 = { 姓名:“艾哈迈德”, 年龄:24岁, _id:“34ef5576”, 电子邮件:'[email protected]' } 我如何提取属性名称、_id 和电子邮件? 那...

回答 2 投票 0

基于离散日期的连续累计计数

我有一张包含客户 ID 的表格,以及他们购买第一辆车、第二辆车、第三辆车和第四辆车的日期。 (有些客户可能没有四次购买,对他们来说,日期将是 2099 年,数据显示...

回答 0 投票 0

tidyverse 中的列索引,适用于循环

嘿嘿, 我想将一个 for 循环转换为 tidyverse 工作流程,因为我通常遵循 tidyverse 方法并且喜欢使用管道工作流程。我可以使用 fo 轻松实现我想要的内容...

回答 2 投票 0

dplyr:旋转更长,同时保持一些宽/堆叠

我正在尝试将宽数据集转为长数据集,但通过此处搜索无法找到问题的解决方案。我有一个广泛的数据集,其中包括 3 波中的 3 项友谊提名,然后是 3 ...

回答 0 投票 0

尝试根据列表值和长度动态填充列

我一直在尝试尽可能优化包含两部分的数据操作。我正在处理 pandas 列,其中每个值都是具有不同长度或 NaN 值的列表,我想要

回答 0 投票 0

上传excel后R中的单元格值不同

上传my.df后为my.df <- read_excel("C:/mydirectory.xlsx", sheet = "my.sheet") the first value of the cell becomes "1.1000000000000001" rather than 1.1 why...

回答 0 投票 0

Postgres:将单行转换为多行(逆轴)

我有一张桌子: 表名:price_list ---------------------------------------------- - |编号 |价格类型a |价格类型b |价格类型c | ---------------------------------------------- - |...

回答 2 投票 0

setnames() 在 R 中的列表对象中

我下面有一个列表对象,我需要为每个列表对象分配一个特定的名称,例如如果该对象在 my.list 中位于第 1 位,则 DF.1,如果它位于第 10 位,则 DF。 10.非常感谢...

回答 1 投票 0

如果不满足条件,则将数据框丢弃在列表对象中

我下面有一个列表对象。我想从列表中删除 df2 和 df3,因为它们没有“ID”列。如何解决这个问题?提前谢谢了。 我的名单<- list(df1 ...

回答 4 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.