data-manipulation 相关问题

数据操作是将数据从不太有用的状态更改为更有用的状态的过程。

dplyr:如何像这样操作数据框

我想操纵 df1 和 df2 到 df3 df1=data.frame(开始=c("06:16","07:36","08:18"),结束=c("06:42","08:18","10:00" ),持续时间=c(0.6,0...

回答 0 投票 0

在 R 中重新格式化多列的函数

我在 R 中有五个数据框,在每个数据框中,我都有一个名为 DOB 的列用于出生日期,另一列名为 StudentID 以及其他变量。但是,我想要一个功能...

回答 1 投票 0

如何计算给定列中字符串第一次出现之前 NaN 的总和?

假设我有一个 df, 专栏 1 |专栏2 |专栏3 | 1 | 2023-02-21 |南 | 1 | 2023-02-22 |南 | 1 | 2023-02-23 | 8 | 1 | 2023-02-24 |南 | 1 ...

回答 1 投票 0

使用 group by [duplicate] 计算单词总数

我想按id统计文本组中的单词总数: 自由<- data.frame(id=rep(1:3, 2), tx=c("test one. test two", "this is a test. again test", "test two",...

回答 0 投票 0

将列的值扩展到数据框中值之前的 n 行和之后的 m 行

我有一个代表不同时间序列的数据框。在一栏中,我标记了有趣的时间点(注意:每个Id可以有多个有趣的时间点): ID 时间 价值 有趣的 1个 0...

回答 3 投票 0

计算给定因素中每个级别有多少个值?

每年,我想创建两个新列 temp_count 和 rh_count,分别计算每个 temp_catog 和 humidity_catog 列中出现的次数。这如何计算 m...

回答 1 投票 0

根据 R 中的条件估算分组数据中的值

我喜欢用 tidyverse 逻辑来估算分组面板数据中的变量。故事是这样的:这是调查数据,人们在特定年份(时间)被问及过去几年的行为。

回答 1 投票 0

使用 Python 数据框进行数据提取

我有以下数据框。在 4 个地方联系店主进行经销,每个店主最多可以接管所有 4 个经销店。如果任何北、南、东或西经销店被...

回答 0 投票 0

如何找到以前在 sql 列中未找到的值?

我正在尝试在 11 月份的数据集中查找所有新投标人。 第一的 第二 A 634a A 427f A 338吨 A 422r b 634a b 427f b 349岁 b 424e C 634a C 349岁 C 123u C 321q 注意如何...

回答 1 投票 0

根据 R 中的条件标记数据 ID

我需要对我的数据集进行有条件的修改。这是一个示例数据集。 数据<- data.frame(id = c(1,1,1,1,1,1, 2,2,2, 3,3,3), cat1 = c("A","A","A&q...

回答 1 投票 0

如何在非对称数据集上按条件对列求和?

这是我的问题的简化版本: 将熊猫导入为 pd v1 = [1, 5, 0] v2, v2_tocomb = [2, 4, 9], [0, 1, 0] v3, v3_tocomb = [3, 3, 8], [2, 0, 1] v4, v4_tocomb = [0, 7, 6], [1, 1, 1] v5 = [...

回答 1 投票 0

R 压缩数据框

我有以下数据框: 自由<- data.frame(rep = c(1,1,1,1,1,1,2,2,2,2,2,2), time = c(0.0000,0.0002,0.0003,0.0015,0.0450,0.07800,0.0000,0.0002,0.0003,0.0015,0.0450,0.07800...

回答 0 投票 0

在Python中从2个CSV中创建新的输出 (数据处理)

我有一个名为城市的csv文件,格式是这样的。City_id,City,Population,Weather,State la01,LA,24,72,CA ny01,NY,12,42,NY bo01,BO,32,65,BO 还有一个csv文件叫 shipping: Carrier,Type,Path,...

回答 1 投票 0

有条件地将数据合并到现有的pandas数据框架列中。

我有以下数据: one_dict = {0:"零",1:"一",2:"二",3:"三",4:"四"} two_dict = {0:"光",1:"算",2:"线",3:"模糊",4:"色"} np.random.seed(2) n = 15 a_df = pd......。

回答 1 投票 0

解除pandas数据框架,删除NaN[重复]。

给出以下数据: s = '{"PassengerId":{"0":1, "1":2, "2":3}, "Survived":{"0":0, "1":1, "2":1}, "Pclass":{"0":3, "1":1, "2":3}}' df = pd.read_json(s) 看起来是这样的。PassengerId Survived...

回答 1 投票 0

鉴别组内缺失值是否等于平均值

我有一个数据集如下。# dt 年份 ST CC ID M NonMissing Tot GRP_Mean 2004 55 35 60 NA 3 4 174.0000 2005 55 35 60 174 3 4 174.0000 ...。

回答 1 投票 0

创建一个表,显示数据框的分组列中是否包含列表。

给定以下数据: data = pd.DataFrame( dict( source=["file1", "file1", "file2", "file2"], variable=["shipp", "carrr", "shipp", "bikee"], ) vals = pd.Series(["ship", "...

回答 1 投票 1

在R中把最后一列移到第n位[重复]

良好的一天,我试图将数据集的最后一列移动到R中的数据框架中的第三列,我想知道什么是最有效的方法来做这件事。我的DataFrame结构如下......

回答 1 投票 0

如何在R中使用dplyr标记行值(基于条件)以创建新的功能。

原来的数据集和虚数据集类似,这里我根据当天的销售额之和新建了一列总销售额,同时我也根据总销售额库的df基础降序排序(...

回答 1 投票 1

在R中,将列表扁平化为数据框时,会丢失重复的列名。

这种类型的 "将列表扁平化为数据框 "的问题已经被问过几次了,然而我找不到一个对我的特殊问题有帮助的解决方案。我在下面做了一个小例子。在...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.