在Scrapy中获取所有蜘蛛类名称

问题描述 投票:1回答:1

在旧版本中,我们可以使用以下代码获取蜘蛛列表(蜘蛛名称),但在当前版本(1.4)中,我遇到了

[py.warnings] WARNING: run-all-spiders.py:17: ScrapyDeprecationWarning: CrawlerRunner.spiders attribute is renamed to CrawlerRunner.spider_loader.
for spider_name in process.spiders.list():
    # list all the available spiders in my project

使用crawler.spiders.list()

>>> for spider_name in crawler.spiders.list():
...     print(spider_name)

如何在Scrapy中获取蜘蛛列表(和等效的类名)?

python web-scraping scrapy
1个回答
6
投票

我在我的实用程序脚本中使用它来运行蜘蛛:

from scrapy import spiderloader
from scrapy.utils import project

settings = project.get_project_settings()
spider_loader = spiderloader.SpiderLoader.from_settings(settings)
spiders = spider_loader.list()
classes = [spider_loader.load(name) for name in spiders]

在你的情况下,按照警告信息的建议,将spiders重命名为spider_loader就足够了。

© www.soinside.com 2019 - 2024. All rights reserved.