document.DocumentNode.QuerySelectorAll 不会重新运行任何内容

问题描述 投票:0回答:1

我尝试访问以下主页上的“div.prod_inner”(参见图片)进行网页抓取。 我使用 HtmlAgilityPack,代码可以在另一个主页上运行,也可以在

"div.lay_main"
返回一个元素上运行。

这是我使用的代码(C#):

var productHTMLElements = document.QuerySelectorAll("div.prod_inner);

我也尝试过

var productHTMLElements = document.DocumentNode.QuerySelectorAll("div.prod_inner");

".prod_inner"
"prod_inner"
,它也不起作用。

我希望代码用页面上找到的所有同类产品填充一个数组。但数组仍然是空的。

我对网络抓取还很陌生。我做错了什么,我该如何做才是正确的?

c# web-scraping html-agility-pack
1个回答
0
投票

您实际上并没有使用 HtmlAgilityPack,您正在使用一个名为 Hazz 的库,它扩展了 HAP。

我对此不熟悉,但使用 XPATH 应该可以。

doc.DocumentNode.SelectNodes(@"//div[contains(@class, ""prod_inner"")]");
© www.soinside.com 2019 - 2024. All rights reserved.