html-parsing 相关问题

HTML解析是消耗HTML文档的序列化并产生可以以编程方式工作的表示的过程 - 例如,为了从中提取数据。 HTML规范定义了用于解析HTML的标准算法,该算法在所有主流浏览器中实现。

我如何获得srcs中的值类似于示例共享波纹管?

我的代码获取页面中的所有链接:来自bs4 import BeautifulSoup导入请求r = requests.get(“http://site-to.crawl”)data = r.text soup = BeautifulSoup(data)for soup in soup 。找到所有('...

回答 1 投票 0

在调用其成员函数之前检查DOMnode是否存在

在解析一个大的HTML文件时,我得到了这个致命错误:致命错误:未捕获错误:调用成员函数getElementsByTagName()on null当我的脚本尝试使用DOMnode时出现问题...

回答 1 投票 -1

如何使用PHP简单的html dom获取特定的表格单元格值

head1 head2 head3 head4 head5 row1 0 0 0 0 155 row2 0 0 0 0 8 row3 0 0 0 0 163现在我想得到最后一个值(163)。

回答 1 投票 -1


制作scrapy蜘蛛跟随给定起始URL的链接

我正在尝试使用scrapy构建一个简单的蜘蛛来导航从给定的start_urls开始并在页面内部链接,刮掉两个项目。目标:这是我的首页。在这里你看到一个...的列表

回答 2 投票 1

如何从破坏的关键参数中获取信息 - BS4和请求(Python)

我正在尝试使用python,Requests和BeautifulSoup从HTML页面获取一些信息。我的问题是,我无法得到关键论点(如“初始股票”和“国内......

回答 3 投票 1

通过Jsoup android在HTML页面中迭代数据

我正在开发一个功能,我获取HTML页面,从中我必须提取所需数据(产品图像,产品名称,产品价格等)并在Recylerview中显示它用于解析HTML页面我...

回答 1 投票 0

使用Python中的BeautifulSoup解析HTML

目前我的代码如下:从bs4导入BeautifulSoup导入请求main_url ='http://www.foodnetwork.com/recipes/a-z'response = requests.get(main_url)soup = BeautifulSoup(...

回答 2 投票 0

从(相对)父文件夹导入BeautifulSoup,并在其旁边导入html解析器

这是我的文件夹树:script / main.py dependencies / bs4 / ... requests / ...以下是我从main.py导入模块的方法:import dependencies ....

回答 1 投票 2

如何从html表中提取值到Python?

我有以下HTML代码结构,但我不知道如何从中提取text1和text2的值 text1 text2 ...

回答 1 投票 0

根元素后面的文档中的标记必须格式正确 - 无法事先修复网页

我正在尝试解析一个网页,我正试图从中提取一些网址。 [...] var html = UrlFetchApp.fetch('https://cse.google.com/cse?q = example&cx = 006680642033474972217%3A6zo0hx_wle8#gsc.tab = 0&...

回答 1 投票 0

如何刮一个重定向一段时间的网站

我正在尝试刮一个延迟5秒的网站,同时显示一个ddos预防页面,网站是Koinex我使用的是Python3和BeuwtifulSoup,我想我需要介绍一个...

回答 1 投票 0

如何仅使用BeautifulSoup从div中提取文本

我有一个包含DIV的HTML页面: Bla bla bla Name Ba bla bla。 Bla bla bla。 ...

回答 4 投票 1

如何使用SimpleHTMLdom解析器解析没有类和没有id的p标记内容?

这是我要解析的html部分,以便获取文本内部 : 标题 hi ...

回答 2 投票 0

将HTML表解析为CSV文件(colspan和rowspan)

我想将HTML表解析为CSV文件,但保留正确的colspan和rowpspan数。我正在使用 ”;”作为分隔符单元格。因此,当有2列的colspan时,例如,而不是......

回答 2 投票 0

加载指令时调用init函数

我有一个简单的指令来加载来自服务的注释(commentsService):'use strict'; angular.module('mean.rank')。diffire('commentList',function(CommentsService,Global){...

回答 1 投票 4

如何使用jQuery删除html字符串中的元素

我有一个Html字符串,我想解析它为HTML,然后删除任何预标签和它的孩子。我试过这个:HTMLString =“ 一个段落 第二段

回答 3 投票 0

如何用空间美丽的汤替换标签

假设我有text =“”“Hello There”“”我想用一个空格(“”)替换一个hrefs和/ a。取而代之。顺便说一句......

回答 3 投票 1

按ID获取div内容

我有一个字符串,保存整个HTML文档。我想获得具有特定ID的div内的所有内容。例如: ...

回答 3 投票 4

如何从没有尾部的lxml中的节点中删除标签?

示例:html = TextText2 BeautifullSoup代码[x.extract()for x in html.findAll(.// b)]在退出中我们有:html = Text2 Lxml代码:[bad ....

回答 2 投票 5

© www.soinside.com 2019 - 2024. All rights reserved.