某天,zabbix收到告警,某服务不断重启,查看监控项数据记录,发现监控项都是双份出现的,也就是同一时间会有2分数据上报,数据一份正常,一份不正常,一开始以为是agent或者proxy的问题,经过排查日志,未发现重复探测问题。

开始排查,提供主机上的agent和proxy,发现依然又数据上报,只不过只有一份502的数据

此时就基本确认还有其他agent使用了重复的agent名称进行数据上报,而他探测的结果是502,带着疑问,问了之前的同事,该项目因为之前云服务器到期,确实进行过服务器迁移,但是不记得原服务器信息了,此时就有点头大。此时突然想起来抓包,也幸亏我们server用的是非https链接,通过在zabbix server上进行了一分钟的抓包。打开抓包软件ctrl+f搜索有问题的主机名称,直接就出来了相关信息,进而锁定了服务器,如下图。

通过排查,确认为该服务器后来又被续费了,agent和proxy自动启动了,造成此次乌龙。
疑问:2个服务器的ip是不一样的,server上配置配置的agent接口地址是新服务器的地址,为什么还能接受老agent上报的数据?
zabbix 7.x 版本 web检测诡异问题排查
https://blog.coolsre.com/archives/zabbix-7.x-ban-ben-webjian-ce-gui-yi-wen-ti-pai-cha
评论