提取短语和方括号之间的字符串 [ ... ]

问题描述 投票:0回答:0

在我使用 Rselenium 进行的个人网络抓取项目中,我解析了大量的 HTML 文本。我现在需要提取“数据:[...]”中包含的信息并将其放入列表中,我可以在其中进一步单独获取每个组件。我是如何用代码得到这个的:

remDr$findElement("xpath","/html/body/div[1]/div[1]/div/div[2]/div/div/div[2]/div[4]/div[2]/div[1]/dl/dd[3]/a")$clickElement()
textprog<-remDr$findElement("xpath","/html/body/div[1]/div[1]/div/div[2]/div/div/div[2]/div[4]/div[2]/div[2]/div[3]/div/div/script")$getElementAttribute('outerHTML')[[1]]
doc<-htmlParse(textprog)

and doc 给出了以下输出:

我需要将“data: [ 3, 9, 73, 81, 0, 95, 9, 67, 96, ]”中包含的数字放入一个列表中,我可以在其中分别提取每个值以将它们附加到另一个值上这些是我要获取的总值的小数点。 我对字符串提取不是很有信心,使用 stackoverflow 上的其他帖子也没有取得太大进展。

r stringr rselenium
© www.soinside.com 2019 - 2024. All rights reserved.