web-crawler 相关问题

环境： Python 3.9.4 美丽汤4==4.12.2 代码：从 bs4 导入 BeautifulSoup test_content = '''123123... 环境： Python 3.9.4 美丽汤4==4.12.2 代码： from bs4 import BeautifulSoup test_content = '''<html><head></head><body>123123 123</body></html>''' bs = BeautifulSoup(test_content, 'html.parser') 为什么bs.find_all('p')返回所有元素，而bs.find_all('p', string=True)只返回不含 的元素？ >>> bs.find_all('p') [123, 123 123] >>> bs.find_all('p', string=True) [123] >>> import re >>> bs.find_all('p', string=re.compile('.+')) [123] 我搜索了 BeautifulSoup 的文档，但没有发现任何相关内容。我的问题是为什么添加 string=True 会使 find_all 不返回带有 br 标签的元素？如何找到所有元素（带或不带 标签）？不传递 string 参数在这里没有帮助，因为我的实际需要是查找具有某些关键字的元素，例如string=re.compile('KEYWORD') 这将为您提供中的完整字符串 for p in bs.find_all('p'): print(p.get_text()) 123 123123 不确定您是否想要将第二个字符串分成两个字符串

python python-3.x beautifulsoup web-crawler

回答 1 投票 0

如何将一个函数的输出作为另一个函数的输入[重复]

我正在为食谱网站制作网络爬虫，我想获取食谱的链接，然后使用该链接获取配料。我可以做到这一点，但只能通过手动输入链接...

python beautifulsoup web-crawler

回答 3 投票 0

如何将网站中的值放入Python中的数组中

我想将网站上的字段（文本）中的值（第一行必须被忽略）直接读取到Python中的字符数组中。作为一个新手，很难弄清楚如何做到这一点 - 那么......

python web-crawler

回答 1 投票 0

Node.js Promises 返回某些元素未定义，我做错了什么或者我可以改进什么？

我的一些承诺返回“未定义”，我看不出我做错了什么。尝试添加超时但没有解决它，我仍在学习并努力发现我的错误。看起来...

node.js web-crawler domcrawler

回答 1 投票 0

爬取数据时如何获取MathJax中的元素？

我正在抓取一个具有以下“cheerio”标签的网站，如何获取 p 标签的完整文本以及带有属性“data-mathml”的 **span * *。我正在抓取一个具有以下“cheerio”标签的网站，如何获取 p 标签的完整文本以及 **span * * 属性 “data-mathml”。 Đề bài "a. " <mn>5</mn></math>" role="presentation">5<math xmlns="http://www.w3.org/1998/Math/MathML"><mn>5</mn></math><script type="math/tex" id="MathJax-Element-1">5</script> và <mroot><mn>123</mn><mn>3</mn></mroot></math>" role="presentation">3√123<math xmlns="http://www.w3.org/1998/Math/MathML"><mroot><mn>123</mn><mn>3</mn></mroot></math> <script type="math/tex" id="MathJax-Element-2">\root 3 \of {123} </script> " ;" 在具有属性“data-mathml”的span标签中，我应该在该属性中获取文本还是获取元素以将数据返回给客户端？ const html = response.data; const $ = cheerio.load(html); const mathjaxEquations = $("span[data-mathml]"); console.log({ mathjaxEquations }); 请帮助我，非常感谢！

node.js web-crawler mathjax cheerio mathml

回答 0 投票 0

web-crawler 相关问题

最新问题