html-agility-pack 相关问题

HTML Agility Pack是一个开源HTML解析器,可构建读/写DOM并支持Linq,普通XPATH或XSLT。

SelectSingleNode 和 SelectNodes XPath 语法

我的问题与在 C# 中的节点内搜索的 XmlNode.SelectSingleNode 语法非常相似 我正在尝试使用 HTML Agility Pack 来提取价格/条件/运费...这是我的 URL

回答 1 投票 0

HTML Agility Pack 与属性名称开头的 xpath 不匹配

我正在尝试选择所有 HTML 节点,其中该节点包含名称以“on”开头的属性。 这就是我的 xpath: //*[@*[开始于(name(), 'on')]] 我回来了

回答 1 投票 0

“É”变成“É” C#从UTF-8编码到ISO-8859-1

我在使用 htmlagilitypack 时遇到将 UTF-8 转换为 ISO-8859-1 的问题 字符串 url = "http://www.example.com"; HttpWebRequest 请求 = WebRequest.Create(url) as HttpWebRequest;

回答 2 投票 0

使用 html-agility-pack 从网站中提取和解析信息

接下来的代码从链接中提取 https://www.ncbi.nlm.nih.gov/myncbi/1dAdNxivfiO5l/bibliography/public/ 具有引用列表的网站。我的最终目标是提取该信息并...

回答 1 投票 0

如何将WebView2文档加载到HtmlAgilityPack中

我不知道如何将 WebView2 文档加载到 HTML Agility Pack 中。我正在使用 JavaScript 来获取字符串形式的 DOM。但是,当我将 DOM 字符串加载到 HtmlAgilityPack 文档中时,e...

回答 1 投票 0

为什么 HtmlAgilityPack 在某些 EPUB 文档中看不到正文

我正在尝试使用 HtmlAgilityPack 解析 EPUB 文档(用 VersOne.Epub 打开),它开始工作,但随着我测试更多,它开始在一些书中丢失正文。 正如我最初测试的那样...

回答 1 投票 0

HtmlAgilityPack - 选择后代直到具有类的元素

我在我的 C# 应用程序中使用 HtmlAgilityPack 来抓取一些 HTML 代码。但我在选择特定标签时遇到问题。 这是我的 HTML: 我在我的 C# 应用程序中使用 HtmlAgilityPack 来抓取一些 HTML 代码。但是我在选择特定标签时遇到问题。 这是我的 HTML: <div class="Post"> <img src="image.png" alt="Alt Text"> <br> <b>THIS TEXT IS WHAT I WANT</b> <div class="DesktopElements"> <br> Hello world </div> <br> Some text here. <br> <b>Title</b> <br> Some more text here. </div> 我想要做的是选择第一个“b”标签内的文本:<b>THIS TEXT IS WHAT I WANT</b>,但前提是它位于类“DesktopElements”的 div 之前。我不想在“DesktopElements”类之后选择任何内容。 如果 <b> 标签在那里,这很好用。但问题是,有时这个<b>标签不会出现。 到目前为止,我一直在尝试获取 <b> 的第一个 <div class="Post"> 后代,但正如您可能意识到的那样,如果标签不存在,它将无法工作。有时它在那里,有时它不在那里。 所以我基本上只需要检查<b>和<div class="Post">之间的<div class="DesktopElements">标签,然后选择第一个(也是唯一的)<b>。 我该怎么做? 换句话说,有时它看起来像这样: <div class="Post"> <img src="image.png" alt="Alt Text"> <br> <div class="DesktopElements"> <br> Hello world </div> <br> Some text here. <br> <b>Title</b> <br> Some more text here. </div> 如果是这样的话,我只是将“p.Title”设置为“none”。 这是我目前使用的代码: p.Title = row.SelectSingleNode(".//div[@class='Post']").Descendants("b").Select(title => title.InnerText).Where(t => !string.IsNullOrWhiteSpace(t)).ToList().First(); 这将捕获第一个 <b> 标签的 InnerText 值,但如果在 <div class="DesktopElements"> 之前没有“b”标签,它将改为选择下面的 <b> 标签,上面写着 <b>Title</b> 这不是我想要的选择。 您可以使用TakeWhile只获取<div class="DesktopElements">之前的节点,而不是只获取Descendants("b"): var node = doc.DocumentNode.SelectSingleNode(".//div[@class='Post']") .Descendants() .TakeWhile(node => !node.HasClass("DesktopElements")) .FirstOrDefault(node => node.Name == "b"); p.Title = node?.InnerText ?? "none"; 参见示例小提琴。 我假设你想要这个 XPath: //div[@class='Post']/div[@class='DesktopElements']/preceding-sibling::b 这将只选择那些b在div[@class='DesktopElements']之前成为div[@class='Post']的孩子 编辑 查看共享网址后,我注意到没有课程Post和DesktopElements。 取而代之的是课程:PostText和ForumDesktopElements 不知道这怎么可能,但如果是这样的话,您将需要这个 XPath //div[@class='PostText']/div[@class='ForumDesktopElements']/preceding-sibling::b

回答 2 投票 0

HTMLAgilityPack 加载 AJAX 内容进行抓取

我正在尝试在 C# Web 窗体项目中使用 HTMLAgilityPack 抓取网页。 我看到的所有执行此操作的解决方案都使用 WebBrowser 控件。然而,据我所知,这只是

回答 2 投票 0

htmlagilitypack 网站数据表提取数据

有,网上和stackoverflow都搜过了。我无法从网站的表格中提取数据。我可以使用下面的代码检索完整表,但需要提取选择数据: 网址 = &

回答 2 投票 0

为什么更改窗体图形属性会影响软件?

说明: 我创建了一个 VB.NET Windows 窗体应用程序 [.net6+],它使用 HtmlAgilityPack 库加载一个 HTML 文件,从中提取数据,并将其显示在列表框中。 表格包含...

回答 1 投票 0

让我的应用程序登录网页时出现问题

“*”是我登录的凭据,并设置为变量。 当我运行代码时,我的返回值是一个字符串,说明我的条件语句,else 值。 我很确定我很瘦...

回答 0 投票 0

为什么在 Android 应用程序在 Unity 项目中工作时 HtmlWeb 加载不起作用?

我制作了 Unity 应用程序,人们可以在其中查看大学小组的日程安排。 这部分代码适用于 Unity 项目,但不适用于我构建的 android 应用程序。 var doc = web.Lo ...

回答 0 投票 0

"对象引用未设置为对象的实例 "和HtmlAgility

我有个问题让我很困惑!我想从一个网页中提取一个值。我用chrome和检查器找到了xpath"/*[@id='GlobalTab0Elm']div[2]div[1]div[2]tablebodytr[7]td[2]div"...。

回答 1 投票 0

无法从XPath中获取数据

我试图用HtmlAgilityPack从一个网页中获取一些数据,它可以获取一些变量并给出一些结果。我想从这个网页中检索3个数据字段,到目前为止,我只能得到2 ...

回答 1 投票 0

HtmlAgilityPack SelectNodes InnerText返回占位符文本而非实际值

在我的应用程序中,我想在一个网页中提取我感兴趣的值。(ShopData是HtmlNodeCollection),我的C#代码是这样的: var ShopName = ShopData.SelectNodes("./div[@class='shop-...")

回答 1 投票 0

与HtmlAgilityPack、嵌套List和Linq一起工作。

列表 > table = playerDoc.DocumentNode .SelectSingleNode($"/*[@id='lg_team_user_leagues-{leagueId}']div[4]tablebody") ......。

回答 1 投票 0

WebScrapper C# + htmlagilitypack

我开始开发应用程序。我需要从网站上下载一些信息到数据库中,然后我需要处理这些信息。好吧,我没有足够的经验,是......

回答 1 投票 1

能否在原始输入中获取HtmlNode的位置& 长度?

考虑以下的HTML片段(_用于空格):... ... 我使用Html Agility Pack(HAP)来读取......

回答 3 投票 3


HtmlAgilityPack 阅读某些网站的问题

我在使用HtmlAgilityPack读取一些网站时遇到了问题。例如https:/faranesh.com和https:/cbi.ir 问题:urlResponse return ="\r\n\r\n我试过这个代码,但它返回 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.