所以我正在使用 Beautiful Soup 尝试使用标签和类从页面中获取元素。这是我的代码:
import requests
from bs4 import BeautifulSoup
# Send a GET request to the webpage
url = "https://www.hindawi.com/journals/am/2021/1623076/"
response = requests.get(url)
# Parse the HTML content of the webpage
soup = BeautifulSoup(response.text, 'html.parser')
results = soup.find_all('span', class_ = 'simpleShowMore')
print(results)
我几乎直接取自他们的例子。如果你看一下这个网站,那里有一些价值,但 BS 找不到它。该网站如下所示:
其输出为:
[]
我确信我正在做一些非常简单的错误。我相信我找到的很多例子都已经过时了。请帮忙?
谢谢
嗯...是的,这真的很简单。您要解析的是动态内容。 单击
show more
之前检查来源。这里不会有span
。
你需要做的是:
simpleShowMore
- 请注意,有多个