data-cleaning 相关问题

数据清理是删除或修复错误以及规范计算机程序中使用的数据的过程。例如,可以移除异常值,可以插入丢失的样本,可以将无效值标记为不可用,并且可以合并同义值。一种数据清理方法是Wickham的“整洁数据”框架,http://vita.had.co.nz/papers/tidy-data.pdf,这意味着每一行都是一个观察,每一列都是一个变量。

如何根据R中的条件将数据从列复制到另一列?

我有以下数据框,如下所示。 Funct.Area Environment ServiceType Ticket.Nature SLA.Result..4P。 IRIS.Priority Func_Environment 2 FUN DCF FUN SR ...

回答 1 投票 1

将字符串与前一行进行比较并计算相似性Pandas

我们有什么方法可以使用Pandas来计算与列中前一行的字符串相似性?第1行:商业私人有限公司第2排:商业私人有限公司第3排:环球私人有限公司它将......

回答 1 投票 0

按R中的一组条件划分行

我将原始数据的最大可能性与修改后的数据集进行比较。对于修改后的数据集,我需要创建一个函数,如果参数的值超过a,则将行划分为两行。

回答 1 投票 -1

R - 基于特定因子值对所选行和列中的数值求和

我有以下data.frame:引擎| MPG | Test_Distance 1. V6 | 17 | 751 2. V4 | 22 | 1850 3. V4-Hybrid | 26 | 210 4. V6-Hybrid | 24 | 85 5. Flat4 | ......

回答 1 投票 0

如何从R中的列中删除特定字符

我有一个属性,其中*与数值一起出现。我希望从数值中删除此*标记。我该怎么办?示例 - 将A转换为B列A - 54,6 *,9,0,189 *,......

回答 2 投票 -1

R等DPLYR:将数据帧列表转换为单个有组织的数据帧

我有一个包含多个条目的列表,示例条目如下:> head(gene_sets [[1]])患者诊断Eigen_gene ENSG00000080824 ENSG00000166165 ENSG00000211459 ENSG00000198763 ...

回答 1 投票 0

比较行中的日期并删除冲突

我有一个带有id的数据帧,以及三个日期列,每行应该相同,但有时会发生冲突。对于每一行,我想比较三个日期,如果至少两个......

回答 1 投票 0

丢弃大部分为0的pandas DF行

我有一个如下所示的数据集:并且想要删除像4,5和7这样的行,因为大多数列都有0但不是全部。同时,我不想删除像0和1这样的行...

回答 3 投票 0

R完全删除不同组中的重复项

我有一个像下面这样的数据集:用于复制数据集的R代码:mydata

回答 2 投票 0

将数据框中的两个混乱向量拆分为一个公共列

数据集样本:library(dplyr)样本

回答 3 投票 1

在R中查找唯一对(不重复任何值)

我有一个数据框,其中包含2组患者(组x和组y)的血液结果。每个队列中有相同数量的患者(具有不同的id号)(2000)。他们一直(模糊)......

回答 1 投票 0

使r忽略值在列中出现的顺序(通过粘贴多列创建)

给定变量x可以取值A,B,C,D和变量x的三列:df1

回答 1 投票 1

python chatclean和电子邮件干净

我有来自客户聊天室的一些数据,我想做一些干净,我不知道该怎么做。如果我已经有def chatClean(t,Agent = True).......#在其中的一些功能def emailClean(...

回答 1 投票 0

Python删除#标签符号并保留关键字

我想删除hashtag符号('#')并强调单词之间的分隔('_')示例:“这条推文是示例#key1_key2_key3”我想要的结果:“这条推文是示例key1 key2 key3”我的......

回答 5 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.