如何从 R 中的列中删除多余的值

问题描述 投票:0回答:1

我正在处理一个数据集,在

date
列中,一些值也有字母。它是一个很大的数据集,所以我需要能够将其应用到整个列。

示例:

'XVII) (2016'

需要是:

'2016'

昵称:

"release_date"

str_remove_all(movie_data$year, "XVII")
- 这将其从单列中删除,但其他列有“I”或“II”,有些列中有句点。我无法让它简单地提取所有这些字母和特殊字符。 我也尝试过:
gsub("XVII",")",".","", movie_data$year)
- 我刚刚收到一条错误消息。

r date data-cleaning
1个回答
0
投票

您可以使用元字符

\\D
删除除数字之外的所有内容:

> string <- 'XVII) (2016'
> gsub("\\D", "", string)
[1] "2016"
© www.soinside.com 2019 - 2024. All rights reserved.