html-agility-pack 相关问题

HTML Agility Pack是一个开源HTML解析器,可构建读/写DOM并支持Linq,普通XPATH或XSLT。

HtmlAgilityPack 阅读某些网站的问题

我在使用HtmlAgilityPack读取一些网站时遇到了问题。例如https:/faranesh.com和https:/cbi.ir 问题:urlResponse return ="\r\n\r\n我试过这个代码,但它返回 ...

回答 1 投票 0

HtmlAgilityPack - 如何提取数据?

如何使用HtmlAgilityPack从下面的HTML中获取1988年的数据。年份:1988 1988 我试着用: .Descendants("span").Where(n => ...

回答 1 投票 0

如何在c#中提取特定链接?

我正在使用HtmlAgilitypack从以下网站提取一些数据。

回答 1 投票 0

C# web scraping with HtmlAgilityPack [已关闭]。

我想在WPF中创建应用程序,它将从网页中提取信息,我从顶部的文本框中读取链接到页面,我想从h6中提取公司名称,我不明白......

回答 1 投票 -2

从列表中获取HREF值时遇到困难

我在用下面的代码从网页中获取链接 HtmlNode SERP = doc.DocumentNode.SelectSingleNode("/*[@id="\"rso\"]"); if (SERP != null) { IList links = ....

回答 1 投票 0


如何使用html-agility-pack在h3中获取链接 [

我想从h3内部获取链接: [

回答 1 投票 0

我希望使用Blue Prism RPA工具中的HTML Agility dll将MS Excel中的值写入HTML报告中(附加C#代码)

string drDataRow = string.Empty; int intSerialNo = 1;字符串strStep =“ one”;字符串strColName =“ Test”;字符串strExpectedRes =“它应该工作”;字符串strActRes =“正在工作”; HtmlAgilityPack ....

回答 1 投票 0

C#和HTML敏捷包

我有多个文件,必须从中提取包含数据的表。问题是表没有ID,因此我必须根据内容(每个文件中的常数)进行搜索。有...

回答 1 投票 0

如何基于HTML敏捷包中的ID和值删除输入

下面给出的是敏捷包解析的html [[Name * ... ]]] 您没有任何问题! 看来您的代码将适用于ID为ComplaintFormReset ,ComplaintFormSubmit和txtverification,但not值为Refresh的输入。 有两个原因 您需要删除if(node.Id!="")检查,因为具有值[[Refresh的输入没有ID属性您需要为'value'属性等于“ Refresh”的节点添加支票 此代码将起作用 var document = new HtmlDocument(); document.LoadHtml(Html); var nodes = new Queue<HtmlNode>(document.DocumentNode.Descendants()); while (nodes.Count > 0) { var node = nodes.Dequeue(); var parentNode = node.ParentNode; if (node.Attributes["id"] != null && (string.Compare(node.Attributes["id"].Value, "txtverification", StringComparison.InvariantCulture) == 0 || string.Compare(node.Attributes["id"].Value, "ComplaintFormSubmit", StringComparison.InvariantCulture) == 0 || string.Compare(node.Attributes["id"].Value, "ComplaintFormReset", StringComparison.InvariantCulture) == 0) || node.Attributes["value"] != null && string.Compare(node.Attributes["value"].Value, "Refresh", StringComparison.InvariantCulture) == 0) { if (null != node.ParentNode) { parentNode.RemoveChild(node, true); } } } string dd = document.DocumentNode.InnerHtml;

回答 1 投票 2

[HtmlAgilityPack在阅读某些网站时出现的问题

我在使用HtmlAgilityPack阅读某些网站时遇到问题。例如https://faranesh.com和https://cbi.ir问题:urlResponse return =“ \ r \ n \ r \ n \ r \ n我尝试了此代码,但它返回了...

回答 1 投票 0

HtmlAgilityPack中的SelectNode始终返回null

我正在尝试从此站点获取数据:https://www.hltv.org/results,它不起作用。 SelectNodes始终返回null,我尝试使用xpath,完整xpath等,以及...

回答 1 投票 0

如何使用html敏捷性在两个特殊的html标签之间查找文本

我正在尝试使用html agility c#提取网页之间和网页中的所有文本,但我不知道xpath是什么。如何在此html标签之间查找文本:

回答 1 投票 0

是否可以在C#的HtmlAgilityPack中使用LINQ?

我学习C#,并尝试编写简单的应用程序。想问您有关如何在下面帮助我优化代码的问题。我写了两种方法,并考虑将其与yield和LINQ结合使用。想想它是否甚至...

回答 1 投票 0

如何将不可点击的纯文本URL转换为HTML源代码中的链接

我想检测URL并使它们链接为HTML代码。我已经搜索了Stack Overflow,但是许多答案都是关于检测和转换文本字符串中的链接的。当我这样做时,html代码将无效; ...

回答 1 投票 0

我如何使用HtmlAgilityPack获得同级兄弟?

我在html代码中有很多tr标记: [[[锚文本 ...] 假设raw是您的样本数据: var doc = new HtmlDocument(); doc.LoadHtml(raw); var xpath = "//div[@class='noticeTabBoxWrapper']//span[contains(.,'Text for anchor')]/following::tr[1]//span"; var result = doc.DocumentNode.SelectSingleNode(xpath); Console.WriteLine(result.InnerText) 输出:*constantly changing text*

回答 1 投票 0

将HtmlAgilityPack的引用添加到类时出错

在将其添加到班级时遇到错误,有人知道解决方案吗?使用4.5框架。无法加载文件或程序集'HtmlAgilityPack,版本= 1.4.9.0,区域性=中性,...

回答 1 投票 3


[HtmlAgilityPack在OuterHtml中生成缺少的结束标记

我正在使用HtmlAgilityPack解析和处理html文本。但是,似乎DocumentNode.OuterHtml提供了缺少的结束标记。为了找出问题,我现在不做其他任何事情,只是解析并...

回答 2 投票 1

使用HtmlAgilityPack无法显示节点的内容

我在此网址上进行数据抓取时遇到问题:http://patorjk.com/software/taag/#p=display&f=Graffiti&t=Type%20Something%20。问题是:我写了一个代码,应该......>

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.