如何使用BeautifulSoup从Wikipedia页面获取子内容

问题描述 投票:0回答:1

[我正在尝试使用python从基于内部链接的Wikipedia页面中抓取子内容,问题是从页面中抓取了所有内容,如何仅抓取内部链接段,谢谢]]

base_link='https://ar.wikipedia.org/wiki/%D8%A7%D9%84%D8%AA%D9%87%D8%A7%D8%A8_%D8%A7%D9%84%D9%82%D8%B5%D8%A8%D8%A7%D8%AA'
sub_link="#الأسباب"
total=base_link+sub_link
r=requests.get(total)
soup = bs(r.text, 'html.parser')          
results=soup.find('p')           
print(results)

我正在尝试使用python基于内部链接从Wikipedia页面抓取子内容,问题是从页面抓取所有内容,如何仅抓取内部链接段落,...

python beautifulsoup wikipedia
1个回答
0
投票
这是因为它不是您要剪贴的子链接。这是一个锚点。
© www.soinside.com 2019 - 2024. All rights reserved.