我正在尝试在python中创建包含某个字符串的页面中所有链接的列表。例如,我想要此页面https://www.stubhub.com/new-york-rangers-tickets/performer/2764/中所有包含“纽约游骑兵@”的链接。
感谢所有帮助-如果这是一个愚蠢的问题,但是在任何地方都找不到,对不起。
我正在尝试在python中创建包含某个字符串的页面中所有链接的列表。例如,我希望此页面上所有包含“纽约游骑兵@”的链接https://www.stubhub.com / ...
数据被嵌入在<srcipt>
标签内的页面内。您可以使用此示例来解析数据(使用re
和json
模块):
[首先,您需要获取要搜索链接的网页的内容。我强烈建议使用requests,这是一个用于Python的简单HTTP库:
使用Selenium,您将不需要beautifulsoup,并从包含文本纽约游骑兵]的页面href
创建所有链接的列表,即https://www.stubhub.com/new-york-rangers-tickets/performer/2764/属性,您需要诱导< visibility_of_all_elements_located()
的[WebDriverWait