data-manipulation 相关问题

数据操作是将数据从不太有用的状态更改为更有用的状态的过程。

在python大熊猫中创建交叉表,显示存在哪些值

给定以下数据:pd.DataFrame(dict(name = ['a','a','a','b','b','b'],vals = [1,2,3, 99,3,4]))的样子:名称vals 0 a 1 1 a a 2 2 a 3 3 b ...

回答 2 投票 2

R different()不取出重复项

我已经为此战斗了一段时间。作为大型for循环的一部分,希望取出一些数据点以便能够在结果点周围创建凹壳(至少需要4 ...

回答 1 投票 0

如果列都相等,则删除组

仅当所有x或y值相同时,我才希望删除组(“集群”)。样本数据:结构(list(x = c(114.908,115.166,152.067,115.17,115.1116,115.133,152.0666,115.166999817,...

回答 1 投票 0

如何清理不规则字符串并将其组织到右列的数据框中

我在向量中有两个长字符串,看起来像这样:x

回答 1 投票 1

R:用绝对(正)输出将Y列除以Z,然后将X列的每个唯一值的输出相加]]

对于每个工作任务,我试图用两个单独的列按权重除以计算+1值和-1值。对于负输出,我特别需要绝对(正)值。 ...

回答 1 投票 1

(R中的(Amateur)数据操作:可变级别作为新列,其值来自另一列

我想创建一个新列,该列从类型中提取'b'和'c'并将值放在该列中。在它们之间还应保留其他随机列,我刚刚将其命名为...

回答 1 投票 0

R中的(Amateur)数据操作:一个变量级别作为新列,其值来自另一列

我想创建一个新列,该列从列类型及其值中提取b。我刚命名为keepthis的其他列应保持不变。而且,b可以简单地...

回答 1 投票 0

如何在R中截断数据?

我在R中有一个看起来像值10.01%20.02%的列。 。 。 。我希望它看起来像值10.01 20.02...。因为以前的版本默认将它作为因素,而我希望该行......>

回答 1 投票 0

创建与R中的数据时序相对应的序列指示符

我正在使用如下所示的数据:ID Year Variable_of_Interest 1 a 2000 0 2 a 2001 0 3 a 2002 0 4 a 2003 ...

回答 3 投票 1

R中变量的编码更改

我正在使用如下所示的数据:ID Year Variable_of_Interest 1 a 2000 0 2 a 2001 0 3 a 2002 0 4 a 2003 ...

回答 1 投票 0

R:将两列合并为具有唯一值的单列

非常感谢您的帮助,可以将两个列合并为一个列,同时使新值保持唯一。我试图找到解决此问题的方法,但由于在R中执行循环操作很糟糕,...

回答 1 投票 0

包含字典列的熔融大熊猫数据框,使字典值也被熔化

这不是重复的问题:熊猫列dict拆分为新的列和行不能回答本文中的问题。我提供了一种转换......>

回答 2 投票 1

按组划分的值

客户日期功能1 202001 A 1 202001 B 1 202002 A 2 202001 C 2 202002 A 2 202002 B 2 202002 ...

回答 1 投票 0

在R中创建组和特定于时间的均值

我有一个长格式的面板数据集。我正在尝试使用周期和组特定的方式创建对象,以创建特定的图。数据集看起来像这样:id

回答 1 投票 0

多列的回归,其中一列在R中包含超过20000个不同的值

我应该如何对在一列中包含175个唯一值的数据集进行回归分析?以下是我的数据集。如您所见,变量'Neighbourhood'包含超过20,000个值,其中175个值...

回答 1 投票 0

总结R中的特定列

[ID公司价格Country City 1 138761 GHI 1320荷兰阿姆斯特丹2 571119 GHI 2060荷兰阿姆斯特丹3112503 DEF 2310德国柏林4 885592 ...

回答 1 投票 0

我可以在不汇总长格式数据表的情况下在ggplot中绘制子类别的百分比吗?

我希望使用ggplot在以下数据集中绘制“阳性百分比”,我想知道是否可以在不修改数据集的情况下这样做。阳性率百分比= Pos /(Pos + Neg)编码为...

回答 1 投票 1

占行百分比

我有一个矩阵,我想用行而不是列的概率,是否有任何体面的方法来做mtcars1

回答 2 投票 0

Pandas-如何在多个日期/实体之间进行填充?

我正在尝试使用熊猫填充库存数据。我遇到的问题是我的数据框具有多个代码(Dim_Assets.Index)。在某种程度上,我认为需要一个分区。下面的df1是data -...

回答 1 投票 0

awk更改字符串

我在这里有一个大文件https://www.dropbox.com/s/ujesog1yv5yzbes/vep.txt?dl=0从这个文件中,我需要类似Uploaded_variation染色体位置参考等位基因1_3407069_C / T ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.