我是r新手,删除重复字符时遇到问题。
这是我的代码:
library(RCurl)
x <- getURL("https://raw.githubusercontent.com/eparker12/nCoV_tracker/master/input_data/coronavirus.csv")
y <- read.csv(text = x)
z <- duplicated(y$jhuID)
我尝试了类似z jhuID,它是类character
,但是有很多国家/地区名称重复了多次,而我的目标是删除那些重复的国家/地区名称,并确保该名称仅重复一次类别character
例如,如果我按y$jhuID
查看数据,则会看到该国家/地区的所有名称多次出现。当我查看z
时,我想要新的数据框,例如z$jhulD
,我将看到国家名称每次只出现一次。
对此的任何帮助将不胜感激!!在此先感谢
具有h distinct
和arrange
的选项
library(dplyr)
y %>%
distinct(jhu_ID, .keep_all = TRUE) %>%
arrange(jhu_ID)