从 myanimelist 用户页中刮取名字列表。

问题描述 投票:0回答:1

我想把这一页上所有的名字列出来。https:/myanimelist.netusers.php?lucky=1。虽然我不知道我需要使用什么路径成为现在,我只是得到['\n ', '\n ', '\n ', 等等]而不是一个用户名列表。

from lxml import html
import requests

link = 'https://myanimelist.net/users.php?lucky=1'
page = requests.get(link)
tree = html.fromstring(page.content)
names = tree.xpath('//td[@align="center"]/text()')
print(names)
python html web-scraping python-requests lxml
1个回答
1
投票

你可以试试这个。

from lxml import html
import requests

link = 'https://myanimelist.net/users.php?lucky=1'
page = requests.get(link)
tree = html.fromstring(page.content)
names = tree.xpath('//td[@align="center"]/div/a/text()')
print(names)
© www.soinside.com 2019 - 2024. All rights reserved.