用python解析HTML+CSS时获取标签中文本大小的最佳方法是什么?

问题描述 投票:0回答:1

我正在使用 python 和 beautifulsoup4 抓取实时网站的 HTML 页面。我希望能够获取任何 html 标签的文本大小。我尝试使用 cssutils 来解析 CSS 并找到字体大小参数,但现实生活中的 CSS 非常复杂,就像这样

.some_div_class a span {font-size: 20px}

所以我可以使用 bs.select(selector) 找到与该选择器相对应的所有标签,但是尝试样式表中的每个选择器将花费太多时间。那么如何有效地找到任何标签的字体大小呢?浏览器的处理速度非常快,所以这应该不是不可能的。 我不想使用无头浏览器。

python html css beautifulsoup
1个回答
0
投票

您可以使用选择器

div[style*="font-size: 20px"]

© www.soinside.com 2019 - 2024. All rights reserved.