document.DocumentNode.QuerySelectorAll 不会重新运行任何内容

Question

我尝试访问以下主页上的“div.prod_inner”（参见图片）进行网页抓取。我使用 HtmlAgilityPack，代码可以在另一个主页上运行，也可以在

"div.lay_main"

返回一个元素上运行。

这是我使用的代码（C#）：

var productHTMLElements = document.QuerySelectorAll("div.prod_inner);

我也尝试过

var productHTMLElements = document.DocumentNode.QuerySelectorAll("div.prod_inner");

和

".prod_inner"

和

"prod_inner"

，它也不起作用。

我希望代码用页面上找到的所有同类产品填充一个数组。但数组仍然是空的。

我对网络抓取还很陌生。我做错了什么，我该如何做才是正确的？

Answer 1

您实际上并没有使用 HtmlAgilityPack，您正在使用一个名为 Hazz 的库，它扩展了 HAP。

我对此不熟悉，但使用 XPATH 应该可以。

doc.DocumentNode.SelectNodes(@"//div[contains(@class, ""prod_inner"")]");