因为以前遇到过生产环境出现错误,然后没有捕获到,就会导致一些定时器异常退出。(就是文档中的那个 64000错误码。。)
然后现在想写一个脚本,来定时检测当前定时器是否正常运行&&是否有异常退出(64000状态),想问下有没有现成的工具?或者有好的解决方案
另外目前已经实现和想到的办法是: 已实现: 通过日志中记录的定时器编号,来匹配当前有多少个定时器在运行,如果有缺失的话,会报警。 其他: 通过php start_timer.php status 中用正则匹配 exit_status 是 6400的 exit_count 下的值。然后通知是否有因为业务或者其他状态码异常退出的定时器发生次数 ,然后报警。。 但是感觉这种的有点麻烦。。 。。
定时器里业务逻辑最外层加个try Catch 捕捉下异常,发生异常就出发告警。
现在是想找一个不用重复服务的办法。
另外目前已经实现和想到的办法是:
已实现: 通过日志中记录的定时器编号,来匹配当前有多少个定时器在运行,如果有缺失的话,会报警。
其他: 通过php start_timer.php status 中用正则匹配 exit_status 是 6400的 exit_count 下的值。然后通知是否有因为业务或者其他状态码异常退出的定时器发生次数 ,然后报警。。 但是感觉这种的有点麻烦。。 。。
定时器里业务逻辑最外层加个try Catch 捕捉下异常,发生异常就出发告警。
现在是想找一个不用重复服务的办法。