我使用RSelenium包进行网页抓取
我的代码:
library(RSelenium)
driver <- rsDriver(port=4444L,browser="chrome")
remote_driver <- driver$client
remote_driver$open()
remote_driver$navigate("https://www.amazon.in/b/?_encoding=UTF8&node=1389401031&ref_=sv_top_elec_mega_1")
one<-remote_driver$findElement(using = "class", value="crwTitle")
k<- one$getElementText()
它工作但它只返回一个记录,如下所示
k的输出:
[1] "Samsung Galaxy M30 (Gradation Blue, 4+64 GB)"
我试图创建一个循环
gettx <- lapply(one,function(one) {
one$getElementText()
})
但我得到了这个错误
Error in one$getElementText : object of type 'closure' is not subsettable
我期待的是
Samsung Galaxy M30 (Gradation Blue, 4+64 GB)
Samsung Galaxy M20 (Ocean Blue, 4+64GB)
Redmi 6A (Black, 2GB RAM, 16GB Storage)
...........etc
我的意思是我需要返回所有具有相同类的元素。
任何帮助?
你可以做:
remDr$navigate("https://www.amazon.in/b/?_encoding=
UTF8&node=1389401031&ref_=sv_top_elec_mega_1")
elems <- remDr$findElements(using = "class", value="crwTitle")
lapply(elems, function(elem) {
elem$getElementText()
})
请注意,remDr$findElement()
只找到一个元素,而remDr$findElements()
找到一个元素列表。