html-agility-pack 相关问题

HTML Agility Pack是一个开源HTML解析器,可构建读/写DOM并支持Linq,普通XPATH或XSLT。

HtmlAgilityPack 设置节点 InnerText

我想用其他文本替换 HTML 标签的内部文本。 我正在使用 HtmlAgilityPack 我使用这段代码来提取所有文本 HtmlDocument doc = new HtmlDocument(); doc.Load("某个路径") foreach (

回答 3 投票 0

尝试使用 HtmlAgilityPack 从 html 类获取特定元素

我正在尝试从 html 页面的一部分获取此元素。下面是网页 html 中的 html 代码片段: 我正在尝试从 html 页面的一部分获取此元素。以下是网页 html 中的 html 代码片段: <td class="datatable_cell__LJp3C datatable_cell--align-end__qgxDQ datatable_cell--up__hIuZF min-w-[77px] text-right align-middle text-sm font-normal leading-5 rtl:text-right text-positive-main" dir="ltr"> 7,646.16 </td> 我想要获取的元素是 7,646.16 这个数字。以下是我尝试做的: using (WebClient client = new WebClient()) { string html = client.DownloadString(url); HtmlDocument htmlDoc = new HtmlDocument(); htmlDoc.LoadHtml(html); try { IEnumerable<HtmlNode> nodes = htmlDoc.DocumentNode.Descendants().Where(n => n.HasClass("datatable_cell__LJp3C datatable_cell--align-end__qgxDQ datatable_cell--up__hIuZF min-w-[77px] text-right align-middle text-sm font-normal leading-5 rtl:text-right text-positive-main")); try { foreach (var node in nodes) { Console.WriteLine(node); } } catch { Console.WriteLine("Failed Process"); } } } 我想要它做的是提取该元素(7646.16)并将其显示在控制台上。 您可以使用 SelectNodes 在 HTML 树中搜索并返回与 XPath 表达式匹配的节点列表 IEnumerable<HtmlNode> nodes = htmlDoc.DocumentNode .SelectNodes("//td[@class=\"datatable_cell__LJp3C datatable_cell--align-end__qgxDQ datatable_cell--up__hIuZF min-w-[77px] text-right align-middle text-sm font-normal leading-5 rtl:text-right text-positive-main\"]"); if(nodes is not null) { foreach (var node in nodes) { Console.WriteLine(node.InnerText.Trim()); } } else { Console.WriteLine("Error: desired nodes is not found"); } 不要过度使用 try 和 catch 子句,这会影响性能和可读性,而是尝试使用上面所示的简单 if 条件来处理空引用

回答 1 投票 0

如何使用 HtmlAgilityPack 更好地解析同级内容

我需要从这个 HTML 中提取各种信息。 在完美的世界中,我会有一些可以使用的辅助属性,但由于某些原因,我坚持使用这种结构并处理混乱的情况。 &...

回答 1 投票 0

使用 HtmlAgilityPack 的 Web 查询抛出 System.Net.WebException:请求已中止:无法创建 SSL/TLS 安全通道 [重复]

从我读到的几个主题中,绝大多数与贝宝有关,还有一些与称为 ServicePointManager 的东西有关。这与其他问题没有关系...

回答 2 投票 0

HTMLAgilityPack 对于存在的页面返回“未找到”HTTP 响应代码

我正在编写自己的网络爬虫,以查找网站上的不良链接并每晚动态创建站点地图。我传入一个起始 URL,将内容拉下来,然后使用 HtmlAgilityPack 来抓取内容...

回答 1 投票 0

获取第二个具有相同类的节点

我在使用 HtmlAgilityPack 解析某些节点时遇到一些问题。 问题是这样的: 我有许多带有“test”类的节点,但我想选择第二个。 如果我做这样的事情: ...

回答 2 投票 0

htmlagilitypack 后代不会返回所有后代节点

当我在 li 节点上执行时,我只得到 7 个节点,以元素停止。我尝试过后代,但他们都没有返回文本后面的 div。有没有办法做到这一点?这是

回答 1 投票 0

使用 PowerHTML 模块从 Powershell 上的动态内容表进行网页抓取

当我尝试从脚本中描述的网页上的表格中读取内容时,出现错误。任何人都可以帮我找到解决方案来修复它。谢谢。 $wc = 新对象 System.Net.WebCl...

回答 1 投票 0

HttpClient 通过登录 c# 从网站抓取数据

我想从以下网站抓取一些数据: http://wttv.click-tt.de/cgi-bin/WebObjects/nuLigaTTDE.woa/wa/teamPortrait?teamtable=1673669&pageState=rueckrunde&championship=SK...

回答 1 投票 0

多级抓取 HTMLAgilityPack

我正在尝试抓取一些以下格式的数据:

回答 0 投票 0

vb.net 从字符串到列表框逐行

我发出了一个网络请求来获取网站的 html 代码,然后提取 想要的 htmlagilitypack 链接 像这样 : '网络请求' Dim rt As String = TextBox1.Text 昏暗的请求...

回答 4 投票 0

使用 HTMLAgilityPack 获取选择元素的所有值

这是我到目前为止所拥有的: HtmlAgilityPack.HtmlDocument ht = new HtmlAgilityPack.HtmlDocument(); TextReader 阅读器 = File.OpenText(@"C:\Users\TheGateKeeper\Desktop\新文件夹\html.txt")...

回答 2 投票 0

如何直接下载HtmlAgilityPack(ZIP或DLL,无需NuGet)?

真的,作者只是把直接下载的链接去掉了?我不明白这一点。也许微软付钱给他做 NuGet 广告?

回答 3 投票 0

HtmlAgilityPack HtmlDocument 访问头元素

我们如何访问HtmlAgilityPack中的head元素? 我们有这样的代码: var doc = new HtmlDocument(); 但是当尝试获取 head 元素时 var head = doc.DocumentNode.SelectSingleNode("//h...

回答 1 投票 0

document.DocumentNode.QuerySelectorAll 不会重新运行任何内容

我尝试访问以下主页上的“div.prod_inner”(参见图片)进行网页抓取。 我使用 HtmlAgilityPack,代码可以在另一个主页上运行,也可以在“div.lay_mai...

回答 1 投票 0

为什么我会得到 System.Data.DataRow?而不是数据表(我从 Outlook 中检索了一个表作为 html 正文,然后将其解析为数据表)

我从 Outlook 中检索了一个表格作为 html 正文,然后将其解析为数据表,但是当我运行代码时,我得到的只是 System.Data.DataRow 静态无效主(字符串[]参数) { var 邮件 =

回答 1 投票 0

如何清除大字符串中的所有空白字符? [重复]

我收到了来自 Html Agility Pack 的字符串 - 它已清理且没有标签: 字符串 cleanText = htmlDoc.DocumentNode.InnerText; 现在我的问题是:如何清除所有空白字符...

回答 2 投票 0

C# 如何压缩大字符串? [重复]

我收到了来自 Html Agility Pack 的字符串 - 它已清理且没有标签: 字符串 cleanText = htmlDoc.DocumentNode.InnerText; 现在我的问题是:如何清除所有空白字符...

回答 2 投票 0

SelectSingleNode 和 SelectNodes XPath 语法

我的问题与在 C# 中的节点内搜索的 XmlNode.SelectSingleNode 语法非常相似 我正在尝试使用 HTML Agility Pack 来提取价格/条件/运费...这是我的 URL

回答 1 投票 0

HTML Agility Pack 与属性名称开头的 xpath 不匹配

我正在尝试选择所有 HTML 节点,其中该节点包含名称以“on”开头的属性。 这就是我的 xpath: //*[@*[开始于(name(), 'on')]] 我回来了

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.