美丽的汤。如何获得包含特定单词的链接?

问题描述 投票:2回答:2

HTML包含div中的字符串:

  • 'div class =“ slide”''img src =“ xttps://site.com/files/r_1000,kljg894/43k5j/35h43jkl.jpg''/ div'
  • 'div class =“ slide”''img src =“ xttps://site.com/files/r_2000,kljg894/43k5j/35h43jkl.jpg''/ div'
  • 'div class =“ slide”''img src =“ xttps://site.com/files/r_3000,kljg894/43k5j/35h43jkl.jpg''/ div'

需要获得仅包含“ r_3000”的链接

此代码获取所有链接:

imglink = soup.find_all('img')
print(imglink)

我浏览并尝试了许多技巧。例如:

('img', string="*r_3000*")('img', string=re.compile('r_3000')('img', string=lambda s: 'r_3000' in s)以及许多其他功能,但所有这些都不起作用:(

[请帮我。

beautifulsoup python-2.x
2个回答
0
投票

我将首先从文档中进行选择,然后使用Python进行过滤。例如:

img_links = soup.find_all('img', src=True)
r_3000_links = [ l['src'] for l in img_links if 'r_3000' in l['src'] ]

将返回包含'r_3000'的所有链接的列表>


0
投票

许多方法可以做到。尝试使用CSS选择器。

© www.soinside.com 2019 - 2024. All rights reserved.