celery笔记五之消息队列的介绍

曾经终败给现在 2024-03-17 13:36 70阅读 0赞

前面我们介绍过 task 的处理方式,将 task 发送到队列 queue,然后 worker 从 queue 中一个个的获取 task 进行处理。

task 的队列 queue 可以是多个,处理 task 的 worker 也可以是多个,worker 可以处理任意 queue 的 task,也可以处理指定 queue 的 task,这个我们在介绍 queue 的时候再做介绍。

这一篇我们来介绍一下存储 task 的队列 queue。

  1. 默认队列 task_default_queue
  2. 定义队列
  3. 将 task 指定到队列 queue 消费

以下的操作都是在 Django 系统的配置中使用。

1、默认队列 task_default_queue

当我们运行一个最简单的延时任务比如 add.delay(1, 2) 时,并没有设置一个消息队列,因为如果我们没有指定,系统会为我们创建一个默认队列。

这个默认的队列被命名为 celery,值在 app.conf.task_default_queue,我们可以查看一下:

  1. from hunter.celery import app
  2. app.conf.task_default_queue
  3. # 输出为 'celery'

2、定义队列

我们可以设想一下这个场景,我们只有一个 worker 处理 task,每个 task 需要处理的时间很长,因为 worker 被占用,这样在我们的任务队列里就会积压很多的 task。

有一些需要即时处理的任务则会被推迟处理,这样的情况下,我们理想的设计是设置多个 worker,多个 worker 分别处理指定队列的 task。

关于 worker 的设置,比如添加多个 worker,给 worker 消费指定队列的 task,我们在 worker 的笔记中再介绍,这里我们介绍一下如何定义队列。

任务队列的定义如下:

  1. # hunter/celery.py
  2. from kombu import Queue
  3. app.conf.task_queues = (
  4. Queue('blog_tasks', ),
  5. )

当我们定义了任务队列之后,我们可以将 task 指定输出到对应的 queue,假设 blog/tasks.py 下有这样一个 task:

  1. # blog/tasks.py
  2. from celery import shared_task
  3. @shared_task
  4. def add(x, y):
  5. return x + y

接下来我们调用这个 task 的时候,需要指定队列:

  1. from blog.tasks import add
  2. add.apply_async((1, 2), queue='blog_tasks')

如果我们就这样配置 celery,这个时候如果我们直接再调用 delay() 函数,也就是不指定 queue 的话,会发现我们发出的 task 是不能被 worker 处理的。

也就是说,下面的操作是不起作用的:

  1. from blog.tasks import add
  2. add.delay(1, 2) # 此时,我们的调用不会被队列接收到

如果需要在调用 task 的时候不指定队列,使用系统默认的队列,这个时候我们需要额外来指定一个 task_default_queue,celery 的配置如下:

  1. # hunter/celery.py
  2. app.conf.task_queues = (
  3. Queue('blog_tasks'),
  4. Queue('default_queue'),
  5. )
  6. app.conf.task_default_queue = 'default_queue'

这样,我们在使用延时任务的时候,就不需要指定 queue 参数了,都会走我们的默认 task 队列:

  1. from blog.tasks import add
  2. add.delay(1, 2) # 队列会被 default_queue 接收到

而如果我们想实现 add 的延时任务走的是 blog_tasks 这个队列,但是我们在调用的时候不想那么麻烦每次都指定 queue 参数,这个就需要用到 task_routes 配置项了。

3、将 task 指定到队列 queue 消费

如果我们想某些函数使用指定的 queue,我们可以使用 task_routes 配置项来操作。

现在我们有两个 application,blog 和 polls,这两个 application 下都有各自的 tasks,文件的内容如下:

  1. # blog/tasks.py
  2. from celery import shared_task
  3. @shared_task
  4. def add(x, y):
  5. return x + y
  6. @shared_task
  7. def minus(x, y):
  8. return x - y
  9. # polls/tasks.py
  10. from celery import shared_task
  11. @shared_task
  12. def multi(x, y):
  13. return x * y

我们想要实现的最终的目的是在调用延时任务的时候,可以直接使用 delay() 的方式,不需要使用 apply_async(queue=’xx’)。

我们想要实现的功能是,polls/tasks.py 下的所有的延时任务以及 blog/tasks.py 下的 add() 函数进入 queue_1 队列

blog 下的 minus() 函数进入 queue_2 队列

其他所有的 task 都走默认的队列,default_queue。

我们可以如下配置:

  1. app.conf.task_queues = (
  2. Queue('queue_1'),
  3. Queue('queue_2'),
  4. Queue('default_queue'),
  5. )
  6. app.conf.task_routes = {
  7. 'polls.tasks.*': {
  8. 'queue': 'queue_1',
  9. },
  10. 'blog.tasks.add': {
  11. 'queue': 'queue_1',
  12. },
  13. 'blog.tasks.minus': {
  14. 'queue': 'queue_2',
  15. },
  16. }
  17. app.conf.task_default_queue = 'default_queue'

发表评论

表情:
评论列表 (有 0 条评论,70人围观)

还没有评论,来说两句吧...

相关阅读

    相关 消息介绍

    1.什么时候会用到消息队列? 公司本身业务小,可以做单体的,但是后面业务体量不断扩大,采用[微服务][Link 1]的设计思想,分布式的部署方式,所以拆分了很多的服务,随

    相关 1--介绍

    1.队列是限定在一端进行播入.另一端进行删除的特殊线性表. 就像养队买东西.排在前面的人买完东西后离开队伍(删除),而后来的人总是排在队伍末尾(插入) 常把队列

    相关 消息使用场景

        个人认为消息队列的主要特点是异步处理,主要目的是减少请求响应时间和解耦。所以主要的使用场景就是将比较耗时而且不需要即时(同步)返回结果的操作作为消息放入消息队列。同时由