我尝试访问以下主页上的“div.prod_inner”(参见图片)进行网页抓取。 我使用 HtmlAgilityPack,代码可以在另一个主页上运行,也可以在
"div.lay_main"
返回一个元素上运行。
这是我使用的代码(C#):
var productHTMLElements = document.QuerySelectorAll("div.prod_inner);
我也尝试过
var productHTMLElements = document.DocumentNode.QuerySelectorAll("div.prod_inner");
和
".prod_inner"
和"prod_inner"
,它也不起作用。
我希望代码用页面上找到的所有同类产品填充一个数组。但数组仍然是空的。
我对网络抓取还很陌生。我做错了什么,我该如何做才是正确的?
您实际上并没有使用 HtmlAgilityPack,您正在使用一个名为 Hazz 的库,它扩展了 HAP。
我对此不熟悉,但使用 XPATH 应该可以。
doc.DocumentNode.SelectNodes(@"//div[contains(@class, ""prod_inner"")]");