Celery是基于Python开发的一个分布式任务队列框架,支持使用任务队列的方式在分布的机器/进程/线程上执行任务调度
Celery是典型的生产生-消费者模式,主要由三部分组成:broker(消息队列)、workers(消费者:处理任务)、backend(存储结果) 1.编写任务代码task.py from celery import Celery
app = Celery('tasks',broker='amqp://guest@localhost//', backend='redis://localhost:6379/0')
@app.task def add(x, y): return x + y
当函数使用”@app.task”修饰后,即为可被Celery调度的任务 2.启动workers 命令 celery worker -A tasks --loglevel=info --concurrency=5 3.调用任务
result=add.delay(2, 5) result.ready() result.get(timeout=1)
4.配置文件 单个参数配置: app.conf.CELERY_BROKER_URL = 'amqp://guest@localhost//' app.conf.CELERY_RESULT_BACKEND = 'redis://localhost:6379/0' 多个参数配置: app.conf.update( CELERY_BROKER_URL = 'amqp://guest@localhost//', CELERY_RESULT_BACKEND = 'redis://localhost:6379/0' )
从配置文件中获取:
先把配置存入配置文件中'celeryconfig.py'
BROKER_URL='amqp://guest@localhost//' CELERY_RESULT_BACKEND='redis://localhost:6379/0'
导入到celery 对象中app.config_from_object('celeryconfig') 我们之前调用任务使用了”delay()”方法,它其实是对”apply_async()”方法的封装, 使得你只要传入任务所需的参数即可 关于序列化 Celery默认序列化方式是”json”,指定序列化 app = Celery('tasks', broker='...', task_serializer='yaml')
app.conf.update( CELERY_TASK_SERIALIZER='pickle', CELERY_RESULT_SERIALIZER='json', )
@app.task def add(x, y): ...
add.apply_async((2, 5), serializer='json')
django + celery 实现任务的异步处理 1.Django Web中从一个http请求发起,到获得响应返回html页面的流程大致如下:http请求发起 -- http handling(request解析) -- url mapping(url正则匹配找到对应的View) -- 在View中进行逻辑的处理、数据计算(包括调用Model类进行数据库的增删改查)--将数据推送到template,返回对应的template/response 同步请求:所有逻辑处理、数据计算任务在View中处理完毕后返回response。在View处理任务时用户处于等待状态,直到页面返回结果 异步请求:View中先返回response,再在后台处理任务。用户无需等待,可以继续浏览网站。当任务处理完成时,我们可以再告知用户 2.建立消息队列 消息队列可以使用RabbitMQ、Redis 等 3.安装django-celery pip install celery django-celery 4.配置settings.py import djcelery djcelery.setup_loader() BROKER_URL = 'django://' # 使用django做broker CELERYBEAT_SCHEDULER = 'djcelery.schedulers.DatabaseScheduler' # 定时任务. CELERY_RESULT_BACKEND = 'djcelery.backends.database:DatabaseBackend' # 需要跟踪任务的状态时保存结果和状态 CELERY_ENABLE_UTC = False # 不用UTC. CELERY_TIMEZONE = 'Asia/Shanghai' # 指定上海时区 CELERY_ACCEPT_CONTENT = ['pickle', 'json', 'msgpack', 'yaml'] # 允许的格式 CELERY_TASK_SERIALIZER = 'json' CELERY_RESULT_SERIALIZER = 'json' CELERY_IGNORE_RESULT = True
INSTALLED_APPS = [ 'djcelery',# 新增 'kombu.transport.django', # 新增kombu.transport.django则是基于Django的broker ]
其中,当djcelery.setup_loader()运行时,Celery便会去查看INSTALLD_APPS下包含的所有app目录中的tasks.py文件,找到标记为task的方法,将它们注册为celery task 5.在项目 mysite 下新建celery.py from future import absolute_import import os from celery import Celery os.environ.setdefault('DJANGO_SETTINGS_MODULE', 'mysite.settings') from django.conf import settings # noqa app = Celery('mysite') app.config_from_object('django.conf:settings') app.autodiscover_tasks(lambda: settings.INSTALLED_APPS)
@app.task(bind=True) def debug_task(self): print('Request: {0!r}'.format(self.request))
6.在应用celery_project下新建tasks.py
from future import absolute_import from celery import shared_task import time
@shared_task(track_started=True) def add(x, y): time.sleep(30) return x + y
在tasks.py中我们就可以编码实现我们需要执行的任务逻辑,在开始处import task,然后在要执行的任务方法开头用上装饰器@task。需要注意的是,与一般的.py中实现celery不同,tasks.py必须建在各app的根目录下,且不能随意命名 6.生产任务 在需要执行该任务的View中,通过test.delay的方式来创建任务,并送入消息队列 def produce(): a =1 b =2 r = test.delay(a,b) 7.启动work #先启动服务器 python manage.py runserver #再启动worker celery worker -A mysite -c 4 --loglevel=info