我正在编写一个网络爬虫,用于从招聘网站上抓取信息。我完成了我的第一个爬虫,但还有一些问题需要解决。
对于某些公司的头衔,我得到了这个
ПАО\xa0
UTF-8
ПАО <!----> 'company's name'
这个
<!---->
我用
scrapy
您可以使用 xpath 选择器。
XPath
comment()