data-cleaning 相关问题

数据清理是删除或修复错误以及规范计算机程序中使用的数据的过程。例如,可以移除异常值,可以插入丢失的样本,可以将无效值标记为不可用,并且可以合并同义值。一种数据清理方法是Wickham的“整洁数据”框架,http://vita.had.co.nz/papers/tidy-data.pdf,这意味着每一行都是一个观察,每一列都是一个变量。

需要 Power BI 数据清理方面的帮助

我的目标是清理数据并将所有 3 个字母的单词和 2 个字母的单词分开。数据非常混乱,因为每一行都不同,但有一些共同点(3 个字母的单词和 2 个字母的单词...

回答 1 投票 0

如何从 R 中的给定行分配整数序列?

我有以下数据,其中包含二进制变量x: df <- data.frame(id = c("a", "a", "a", "a", "b", "b", "b", "b")...

回答 1 投票 0

是否有一个函数可以过滤具有多个“日期”列的数据框

所以我聚合来自不同时间段的多个源的数据,无论如何我有一个具有这种格式的数据框; |日期|变量...|日期.1|变量...|日期.2|变量..| 每个“日期”以及随后的...

回答 1 投票 0

如何在 R 中选择以特定字符串开头的行?

我有这样的数据: df <- data.frame(name = c("James", "jonathan", "Abel", "Cynthia", "Cornelius", "alex")) name James

回答 3 投票 0

大数据集重复

我怀疑我是数据分析新手,我有一个包含 17432 行和 7 列的大数据集作为一个项目。列是 sid,sname,sstate,scountry,comid,comname,comstate, comcou...

回答 1 投票 0

从给定的行中,如何选择R中的前“n”行?

我有一个虚拟变量,如下所示: df <- data.frame(year = seq(1990, 1997, 1), x = c(1, 0, 0, 0, 1, 1, 0, 0)) year x 1990 1 1991 0 1992 0 1993 0 1994 1 1995 1 1996 0 1997...

回答 1 投票 0

如何使用 as.Date() 将带有缩写月份名称的字符串转换为日期?

我有一列包含用“”分隔的日期和时间,我可以将其分成两列,称为“日期”和“时间”。现在我想选择非空行...

回答 1 投票 0

如何使用 as.Date() 将带有缩写月份名称的字符串转换为日期?

我有一列包含用“”分隔的日期和时间,我可以将其分成两列,称为“日期”和“时间”。现在我想选择非空行...

回答 1 投票 0

数据框-删除特殊字符

我的 DF 如下所示: 身份证日期 1 ' : 07/01/2020 23:25' 2': 07/02/2020' 3 ' 2020 年 7 月 3 日 23:25 1' 4 '07/04/2020' 5 '2020 年 7 月 5 日 23:50' 6'07 06 2023' 7 '00:00 07 07 2023' 我需要删除所有

回答 1 投票 0

如何在R中按组创建滞后差异?

我有以下数据框: df <- data.frame(id = c("1", "1", "1", "2", "2"), x = c(12, 20, 24, 10, 14)) id x 1 12 1...

回答 1 投票 0

如何修复数据中的拼写错误?

我有一个输入数据文件,其中包含城市名称列表,但是,城市名称存在拼写错误和空格字符问题。 例如:我们有汉堡、汉堡、哈堡、HAM 所以我不确定...

回答 1 投票 0

有没有DAX查询来计算不同值的比例

在此处输入图像描述我通过使用新的度量计算了幂 bi 中相同列的不同值的比率,计算后我已将该结果放入卡中,但它没有显示结果

回答 1 投票 0

R 中的数据清理任务

上周我因为一项任务而考试不及格。如果有人能够找出我的代码中的错误并帮助我了解可以改进的地方,我将非常高兴。 具体来说,我想知道是否...

回答 1 投票 0

如何以编程方式获取 csv 文件中的字段以相互对齐

我有一组非常旧的数据,正在清理。我已将其放入 csv 文件中,但数据逐行不一致。我想让每行中的每个字段匹配...

回答 2 投票 0

按分隔符之间的关键字提取文本

请帮我解决清除不必要部分文本的问题。 我有一个数据集的例子: df = pd.DataFrame({'addressfrom': ['Hüseyinağa, Rexee Hotel, Büyük Bayram Sokak', 'Rixos Re...

回答 2 投票 0

如何删除数据集中的表情符号

我正在使用 Kaggle 的灾难推文数据集进行 nlp。我正在清理数据并尝试删除表情符号。数据集太大了,我无法单独选择每个表情符号...

回答 1 投票 0

过滤 pandas 数据框以查找具有特定日期的行

我是Python新手(我过去使用过R)。我有一个 pandas 数据框,其中一列包含日期。我想过滤在某一特定日期发生的观察结果。 ## 创建帕...

回答 1 投票 0

如何自动化数据框操作,替换我必须返回该数据的操作版本的任何团队名称输入? R

我的目标是使用某种自动化流程,我可以在代码块中的所有事件中输入团队的团队名称。我一直在尝试使用一个函数来做到这一点。我已经提供了一个...

回答 1 投票 0

如何从任意字符串中删除base64字符串?

我有一个Python字符串。我想从中删除 base64 字符串。我阅读了有关 base64 规范的信息并环顾四周,但看起来我无法找到一种干净的方法来删除它们。 我试过了

回答 1 投票 0

如何从Python中的任意字符串中删除base64字符串?

我有一个Python字符串。我想从中删除 base64 字符串。我阅读了 base64 中的规范并环顾四周,但看起来我无法找到一种干净的方法来删除它们。我 tr...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.