使用 GatewayClient 里面的 Gateway::getClientIdCountByGroup 获取在线人数,绝大多数时间都很平稳,但是有时候突然会锐减一半左右,重新获取又慢慢恢复正常,随机时间段出现,明显有异常,请问这种情况大概会是什么情况下产生的?
服务器自己有连接数监控没,如果有的话看下连接数降了没,没准真的是降了。
后台服务器看板其他数值参考没有异常,业务比较平稳,比如mysql redis 的qps都正常。
估计你gateway进程有退出重启的情况。
@1469:如果有会有日志的,gateway没有重启日志
问题找到了,wss的域名使用了腾讯的“Web 应用防火墙”,虽然设置里面开启了WebSocket,但是极不稳定,换正常域名解决了。
还是没有彻底解决,换域名后不会强制大量掉线了,但是不同分组还是有部分情况出现小幅度统一下跌,是不是框架有个机制统一把一些没心跳包的用户踢下线?
看曲线是真的下线了。框架有心跳机制,没心跳的是否踢掉看具体心跳配置,你可以看下他们文档
@1469:已经解决了,归根到底还是 Web 应用防火墙造成的,他们会在指定时间统一踢用户下线。
服务器自己有连接数监控没,如果有的话看下连接数降了没,没准真的是降了。
后台服务器看板其他数值参考没有异常,业务比较平稳,比如mysql redis 的qps都正常。
估计你gateway进程有退出重启的情况。
@1469:如果有会有日志的,gateway没有重启日志
问题找到了,wss的域名使用了腾讯的“Web 应用防火墙”,虽然设置里面开启了WebSocket,但是极不稳定,换正常域名解决了。
还是没有彻底解决,换域名后不会强制大量掉线了,但是不同分组还是有部分情况出现小幅度统一下跌,是不是框架有个机制统一把一些没心跳包的用户踢下线?
看曲线是真的下线了。框架有心跳机制,没心跳的是否踢掉看具体心跳配置,你可以看下他们文档
@1469:已经解决了,归根到底还是 Web 应用防火墙造成的,他们会在指定时间统一踢用户下线。