两台部署的gatewayworker服务,硬件配置为16核32G,最近半个月经常出现一台机器上的几个gateway进程cpu跑满100%,导致业务无法正常转发。
故障时status信息如下: worker进程显示不出来
通过strace -ttp 异常进程,得到的信息如下
另外开启了框架调试日志,输出的结果如下172.17.201.188是本机内网ip:
conection refused 可能是那时候 172.17.201.188 上的gateway没启动或者29xx端口没监听。 也有可能是系统资源达到上限,无法连接172.17.201.188,需要按照手册优化下linux内核,iptables关闭试下。 无法展示worker进程问题,通过ps auxf命令找到worker进程,sttace 看下。
另外workerman版本3.4太老了
conection refused 可能是那时候 172.17.201.188 上的gateway没启动或者29xx端口没监听。
也有可能是系统资源达到上限,无法连接172.17.201.188,需要按照手册优化下linux内核,iptables关闭试下。
无法展示worker进程问题,通过ps auxf命令找到worker进程,sttace 看下。
另外workerman版本3.4太老了