如何删除数据框中的链接或R中的字符串?

问题描述 投票:0回答:1

我想删除数据框“消息”列中的所有链接。如何删除此类链接。

示例:example.com,example.net和example.us,还有example.com/foo、example ...

我还想从文本中删除以http:或https开头的示例。(http:\ www.example.com,https:\ example.com等)

简而言之,我不应该在链接上留下任何内容。我在this question中找不到R的解决方案。

我想按以下方式使用从上一个问题中获得的信息,但是没有发生。

fromDB$message<-gsub("[^\s\d]+\.[^\s\d]+","",fromDB$message)
Error: '\s' is an unrecognized escape in character string starting ""[^\s"
r regex gsub
1个回答
0
投票

这将是一个解决方案:

library(tidyverse)

tibble::tibble(URL = c("https:\\example.com",
                       "http:\\www.example.com",
                       "example.net",
                       "example.com",
                       "no_url_1")) %>% 
  dplyr::filter(!stringr::str_detect(URL, "\\.net|http|\\.com"))
© www.soinside.com 2019 - 2024. All rights reserved.