我只是将一个较旧的项目升级到Python3.6,发现有这些很酷的新异步/等待关键字。
我的项目包含一个网络爬虫,这是目前还不是很好的表现,大约需要7分钟才能完成。现在,由于已经有了django restframework来访问django应用程序的数据,所以我认为最好有一个REST端点,在那里我可以通过一个简单的POST请求从远程启动爬虫。
但是,我不希望客户端同步等待爬虫完成。我只想马上给他发送信息,说爬虫已经启动,并在后台启动爬虫。
from rest_framework import status
from rest_framework.decorators import api_vie
我有一个基于Django的web应用程序。我使用爬行网页。目前,我的目标是能够使用jQuery和AJAX请求从网页中控制爬虫。
我的理论设置如下:
在网页上我有个按钮。当我单击按钮时,爬虫将在服务器端启动。
一旦爬虫启动,我会定期使用向服务器发送AJAX请求,以了解到目前为止已经爬行了多少网页。
爬行器完成后,GET请求应该通过使用停止。
以下是我当前代码中的相关行:
$(document).ready(function() {
// This variable will hold the ID returned by setInterval
var mo