官方还有维护的人吗?帮忙看一个PR能不能合进去

https://github.com/NetEase/pomelo-admin/pull/13

修复与master的重连bug

修复两个bug:
1,如果启动本服务器的时候master服务器还没有启动,每隔5s重试
2,如果启动后master服务器挂掉,重连次数设置为999999999999999而不是只尝试20次

机房断电重启后发现部分pomelo进程工作不正常,有部分服务器一直不重连master服务器。
测试了一下发现两个bug:
1,如果业务进程启动的时候master进程没有先启动,那么这个业务进程就永远不会再去连master
2,如果正常工作状态下,突然master挂了,又长时间没有恢复,那么业务进程也不会再连master了,因为超过20次重连。

ps:pomelo进程组是用pm2管理的

标签: bug 反馈
roytan 在 2016-3-24 16:48发布 分享到 weibo
2 回复
#1 roytan 2016-3-24 16:55 回复

其实这个bug还是来自于坑爹的socket.io 0.9.16
它源代码里面都写了初始重连这块有bug:

/* FIXME: reopen delay causing a infinit loop
this.reopenTimeout = setTimeout(function () {
  self.open();
}, this.socket.options['reopen delay']);*/

都注释掉了。我打开它也没用,后来只能在pomelo-admin里面去手动加了一个第一次重连timer。

也尝试改成socket.io 1.4.5但是发现接口调用参数什么的改动太大了,pomelo-admin要改的地方也就多了,暂时用简单改法。

#2 a447450190 2016-3-25 11:14 回复

现在node 用那个版本?

回到顶部