data-cleaning 相关问题

数据清理是删除或修复错误以及规范计算机程序中使用的数据的过程。例如,可以移除异常值,可以插入丢失的样本,可以将无效值标记为不可用,并且可以合并同义值。一种数据清理方法是Wickham的“整洁数据”框架,http://vita.had.co.nz/papers/tidy-data.pdf,这意味着每一行都是一个观察,每一列都是一个变量。

比较行中的日期并删除冲突

我有一个带有id的数据帧,以及三个日期列,每行应该相同,但有时会发生冲突。对于每一行,我想比较三个日期,如果至少两个......

回答 1 投票 0

丢弃大部分为0的pandas DF行

我有一个如下所示的数据集:并且想要删除像4,5和7这样的行,因为大多数列都有0但不是全部。同时,我不想删除像0和1这样的行...

回答 3 投票 0

R完全删除不同组中的重复项

我有一个像下面这样的数据集:用于复制数据集的R代码:mydata

回答 2 投票 0

将数据框中的两个混乱向量拆分为一个公共列

数据集样本:library(dplyr)样本

回答 3 投票 1

在R中查找唯一对(不重复任何值)

我有一个数据框,其中包含2组患者(组x和组y)的血液结果。每个队列中有相同数量的患者(具有不同的id号)(2000)。他们一直(模糊)......

回答 1 投票 0

使r忽略值在列中出现的顺序(通过粘贴多列创建)

给定变量x可以取值A,B,C,D和变量x的三列:df1

回答 1 投票 1

python chatclean和电子邮件干净

我有来自客户聊天室的一些数据,我想做一些干净,我不知道该怎么做。如果我已经有def chatClean(t,Agent = True).......#在其中的一些功能def emailClean(...

回答 1 投票 0

Python删除#标签符号并保留关键字

我想删除hashtag符号('#')并强调单词之间的分隔('_')示例:“这条推文是示例#key1_key2_key3”我想要的结果:“这条推文是示例key1 key2 key3”我的......

回答 5 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.