删除r中数据集的重复列字符

Question

我是r新手，删除重复字符时遇到问题。

这是我的代码：

library(RCurl)
x <- getURL("https://raw.githubusercontent.com/eparker12/nCoV_tracker/master/input_data/coronavirus.csv")
y <- read.csv(text = x)
z <- duplicated(y$jhuID)

我尝试了类似z jhuID，它是类character，但是有很多国家/地区名称重复了多次，而我的目标是删除那些重复的国家/地区名称，并确保该名称仅重复一次类别character

例如，如果我按y$jhuID查看数据，则会看到该国家/地区的所有名称多次出现。当我查看z时，我想要新的数据框，例如z$jhulD，我将看到国家名称每次只出现一次。

对此的任何帮助将不胜感激！！在此先感谢

Answer 1

具有h distinct和arrange的选项

library(dplyr)
y %>%
     distinct(jhu_ID, .keep_all = TRUE) %>%
     arrange(jhu_ID)

删除r中数据集的重复列字符

问题描述投票：1回答：1

1个回答

最新问题

删除r中数据集的重复列字符

问题描述 投票：1回答：1

1个回答

最新问题

问题描述投票：1回答：1