我想删除数据框“消息”列中的所有链接。如何删除此类链接。
示例:example.com,example.net和example.us,还有example.com/foo、example ...
我还想从文本中删除以http:或https开头的示例。(http:\ www.example.com,https:\ example.com等)
简而言之,我不应该在链接上留下任何内容。我在this question中找不到R的解决方案。
我想按以下方式使用从上一个问题中获得的信息,但是没有发生。
fromDB$message<-gsub("[^\s\d]+\.[^\s\d]+","",fromDB$message)
Error: '\s' is an unrecognized escape in character string starting ""[^\s"
这将是一个解决方案:
library(tidyverse)
tibble::tibble(URL = c("https:\\example.com",
"http:\\www.example.com",
"example.net",
"example.com",
"no_url_1")) %>%
dplyr::filter(!stringr::str_detect(URL, "\\.net|http|\\.com"))