记一次奇怪的服务器“事故”
最后编辑于: 2017-03-31游戏名目
2017.03.30 一大早Request timeout for icmp_seq
100% 丢包错误
记录过程
- 2017.03.30 晨
所有远程服务熄灭, ping 服务器 100% 丢包, 判定为服务器离线, ; - 网络中心重启
仍然不能访问, 但是重启过程中出现了短暂了连线状态, 有几个包通信成功, 但是随即又进入, ; - 到机房可物理登录主机
但 root 账户无法登录, 开始怀疑外部因素, ; - 登录了具有 sudo 权限的账号
使用, who
查看已登录用户 使用, last
查看登录记录 使用, journalctl
查看 ssh 服务器守护进程日志 均未发现异常, ; ip addr
,ip route
查看网络配置信息 网络中心给的固定 IP 在列, 但是有一个 192.168 开头的地址和对应的网关出现在了配置中, ; - flush 掉所有的网络配置
重新配置静态 IP 之后恢复访问, 2017.03.30 下午( ) ; - 短暂时间后服务器再次离线
再次 flush 所有网络配置后, 服务器短暂恢复访问, 网络中心下班, 为了保险, 卸载了 openssh 服务, 以防被外部远程登入, ; - 实验室网站 Nginx 服务运行正常
; - 网站服务器再次熄灭
2017.03.30 傍晚( 感到有点恐慌) , 难道真的是被攻击了, ? - 2017.03.31 晨尝试了几次更新网络配置
均未修复, ; - 开始拷贝数据
以防万一出现数据丢失, ; - 在拷贝数据的时候
再次查看网络配置信息, 终于发现了端倪, ! ip addr
输出ip route
这个 192.168.1.1 网关和 192.168.1.200 的地址
本能地 ping 网关, 全中, 所以服务器当前一定是在另外一个子网当中
并且被分配了一个有效的子网 IP 地址! 这个地址要不是被手动指定的, 就是子网路由自动分配 DHCP 的, 打开 Arch Wiki - Network Configuration 查看所有可配置 DHCP 的方法。 最后定位到, dhcpcd.service
! 原来有一个
dhcpcd
守护进程给服务器分配了子网地址 暴躁卸载掉! dhcpcd
重启, 服务器正常上线, !
故事开始
所以这个故事是这样的
小半年前dhcpcd
来自动从实验室路由器获取
后来
时间过得很快
2017.03.30 晨dhcpcd
守护进程自动从路由器获取了一个子网
日常甩锅
这个事情
所以为什么采用固定
还有那个 root 账户无法登录的问题