APScheduler定时任务使用以及在flask中的调用
任务需求:在flask中每天自动同步大众点评数据到数据库,这里选择了Flask-APScheduler
APScheduler简介
APScheduler基于Quartz的一个Python定时任务框架,实现了Quartz的所有功能,使用起来十分方便。提供了基于日期、固定时间间隔以及crontab类型的任务,并且可以持久化任务。基于这些功能,我们可以很方便的实现一个python定时任务系统。
组成部分
APScheduler有四种组成部分:
- 触发器(trigger)包含调度逻辑,每一个作业有它自己的触发器,用于决定接下来哪一个作业会运行。除了他们自己初始配置意外,触发器完全是无状态的。
- 作业存储(jobstore)存储被调度的作业,默认的作业存储是简单地把作业保存在内存中,其他的作业存储是将作业保存在数据库中。一个作业的数据讲在保存在持久化作业存储时被序列化,并在加载时被反序列化。调度器不能分享同一个作业存储。
- 执行器(executor)处理作业的运行,他们通常通过在作业中提交制定的可调用对象到一个线程或者进城池来进行。当作业完成时,执行器将会通知调度器。
- 调度器(scheduler)是其他的组成部分。你通常在应用只有一个调度器,应用的开发者通常不会直接处理作业存储、调度器和触发器,相反,调度器提供了处理这些的合适的接口。配置作业存储和执行器可以在调度器中完成,例如添加、修改和移除作业。
调度器
APScheduler提供了多种调度器,可以根据具体需求来选择合适的调度器,常用的调度器有:
-
BlockingScheduler:适合于只在进程中运行单个任务的情况,通常在调度器是你唯一要运行的东西时使用。
-
BackgroundScheduler: 适合于要求任何在程序后台运行的情况,当希望调度器在应用后台执行时使用。
-
AsyncIOScheduler:适合于使用asyncio框架的情况
-
GeventScheduler: 适合于使用gevent框架的情况
-
TornadoScheduler: 适合于使用Tornado框架的应用
-
TwistedScheduler: 适合使用Twisted框架的应用
-
QtScheduler: 适合使用QT的情况
安装
普通使用安装
pip install apscheduler
结合flask使用安装
pip install Flask-APScheduler
使用
添加job
- work1使用add_job()方法添加,表示每隔5秒执行一次,第一次执行是程序运行5秒后
- work2使用装饰器添加
import time
from apscheduler.schedulers.blocking import BlockingScheduler
sched = BlockingScheduler()
def work1():
print(time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(time.time())))
@sched.scheduled_job('interval', seconds=2)
def work2():
print('work2222')
sched.add_job(work1, 'interval', seconds=5)
sched.start()
add_job参数详解
id
# id代表该job唯一标识,不可重复,之后可以用id查找job
sched.add_job(work1, 'interval', seconds=5, id='my_work1')
trigger
它管理着作业的调度方式。它可以为date, interval或者cron。对于不同的trigger,对应的参数也不同。
interval 间隔时间(每隔一段时间执行)
后面可以写的参数:
- weeks (int) – number of weeks to wait
- days (int) – number of days to wait
- hours (int) – number of hours to wait
- minutes (int) – number of minutes to wait
- seconds (int) – number of seconds to wait
- start_date (datetime|str) – starting point for the interval
calculation
- end_date (datetime|str) – latest possible date/time to trigger on
- timezone (datetime.tzinfo|str) – time zone to use for the date/time
calculations
#表示每隔3天17时19分07秒执行一次任务
sched