我正在使用xpath,我想从以下URL抓取:https://www.le-dictionnaire.com/definition/tout'
发生这种情况是因为您想要的文本不是<ul>
标记的直接子代,因此使用/text()
将返回直接子代(或简称为子代)文本。您需要从<ul>
标签的大子级中获取文本,这是您要抓取的文本。为此,您可以使用//text()
而不是/text
或缩小XPath表达式的范围,例如:
"//*[@class='defbox'][n]//ul/li/a/text()"