Django Heroku APScheduler Scrapy

问题描述 投票:0回答:1

我有一个在Heroku上运行的基本Django Web应用程序。我想添加一个蜘蛛来基于计划任务(例如通过Scrapy)爬网一些网(例如APScheduler),以获得一些加载了收集数据的Django数据库表。

有没有人知道实现这种集成的基础的文档或示例?我觉得很难搞清楚。

python django heroku scrapy apscheduler
1个回答
2
投票

我根本没有使用Scrapy,但我实际上正在使用APScheduler,它使用起来非常简单。所以我的第一个猜测是使用BackgroundScheduler(在您的Django应用程序中)并向其添加一个定期执行可调用“蜘蛛”的作业。

这里的问题是你如何在你的Django应用程序中嵌入一个Scrapy项目,这样你就可以访问它的一个“蜘蛛”并有效地将它用作你预定工作中的一个可调用程序。

我可能没多大帮助,但我只是想给你一些kickstart方向。我很确定如果你仔细阅读Scrapy的文档,你就会成功。

最好。

© www.soinside.com 2019 - 2024. All rights reserved.