R:Webscrap文章

问题描述 投票:0回答:1

我想通过网络剪贴以下文章(希腊语)

https://www.capital.gr/politiki/3460863/x-theoxaris-i-krisi-mporei-na-apotelesei-eukairia-gia-ton-elliniko-tourismo

我不确定该怎么做。我尝试了rvest,但未成功:

url <- 'https://www.capital.gr/politiki/3460863/x-theoxaris-i-krisi-mporei-na-apotelesei-eukairia-gia-ton-elliniko-tourismo'

read_html(url) %>%
  html_nodes(css = ".wcms-article-content") %>%
  html_text
r
1个回答
1
投票

这应该起作用:

url <- 'https://www.capital.gr/politiki/3460863/x-theoxaris-i-krisi-mporei-na-apotelesei-eukairia-gia-ton-elliniko-tourismo'

library(rvest)
read_html(url) %>%
  html_nodes(css = "#articleBody p") %>%
  html_text

[1] "\n\tΜία \"ανάσα\" πριν την έναρξη της τουριστικής σεζόν, ο υπουργός Τουρισμού Χάρης Θεοχάρης παρουσίασε από τη Σαντορίνη το πρόγραμμα \"Τουρισμός για όλους\", ένα πρόγραμμα για τη στήριξη της εσωτερικής τουριστικής κίνησης, των επιχειρήσεων και της απασχόλησης.\n"                                                                                                                                                                                                                                                                                                   
 [2] "\n\t\"Αυτές οι ημέρες etc. etc...
© www.soinside.com 2019 - 2024. All rights reserved.