今天有两客户来求助,一家是H3C服务器无法安装Centos系统,另外一家是网络故障,不能上网。
盼着H3C服务器早上送到,下午就能跑现场解决网络故障了。
可是,服务器到了11点半才到,赶紧开机看看什么情况,一是报内存错误,提示可能无法被操作系统识别;二是提示磁盘阵列配置错误。
拔下内存条,金手指擦干净,插在我们的服务器上,经测试,没毛病,能进系统,插回去,没再报错,重新配置RAID,顺利安装系统,收钱交差。
慌忙赶往另外一个同行的客户,检查网络问题。
跑步进机房,却发现笔记本电脑没电,晕,插电,开机。
网线接入思科核心交换机,端口正常亮灯,笔记本电脑能够获取IP地址。
Ping百度,不通,不通就对了,看状态,无法解析域名,那不就是DNS Server问题了嘛?盲猜DNS服务器挂了起不来,客户也说,停电过后,就不能上网了。
根据DHCP信息得知,DNS服务器IP为10.20.2.10,ping 10.20.2.10,能通,说明服务器在线,只是DNS Server没能起来,看来我的猜测是正确的。
机房有3台戴尔服务器,KVM切换了一轮,只能显示两台服务器的画面,却没有找到10.20.2.10这台服务器,却顺便发现其中两服务器,各有一个电源坏了,灯都不亮,重新插拔无效。
显示器直接插剩下的那台服务器,竟然显示无法支持输入,看来是分辨率不够啊,换一台显示器,倒是能显示画面了,但是太大了,放不进机柜,汗。
输入管理员账号密码,提示账号被锁了,我……
等了15分钟,账号解锁,登录后发现,这台服务器也不是10.20.2.10,尴尬。
客户说,可能是在第一台服务器里面的虚拟机。
好吧,重新连接显示器和KVM,画面切换到第一台服务器上,打开hyper-v,确实发现两台虚拟机不能启动,看名称,的确是DC和DNS Server,但是,问题来了,我明明可以ping通10.20.2.10,所以这两台虚拟服务器,肯定不是10.20.2.10,果断放弃这两台虚拟服务器,应该与本次故障无关。
直接远程桌面连接10.20.2.10,好在账号解锁后,可以登录。
终于打开DNS服务管理器,好显眼的红叉,重启DNS服务,当然没用,报一堆错,再看系统日志,不仅是DNS各种报错,还有DC故障。
Dcdiag检查DC,发现问题、解决问题,并重启活动目录相关服务。
再次打开DNS服务管理器,红叉没了,服务器状态看上去正常,右键,属性,监视,发现简单查询通过,递归查询失败,也就是说DNS服务器本身无法连接外网。
Ping网关地址,不通,这……
等下,好像网关IP不同啊,拿起我的笔记本电脑来看,果然,DNS服务器上面配置的网关地址是10.20.2.7,而笔记本电脑自动获取的网关IP是10.20.2.254。
把服务器上的网关IP改为10.20.2.254,再次测试,简单查询和递归查询都是秒过,网络通了。
通知客户检查电脑,满怀信心地开始连接戴尔服务器的idrac接口,准备检查服务器故障,谁知客户进来说,只恢复了一部分电脑。
奇怪,难道有客户无法获取IP,又或者是自己手动设置有错误?
跟着客户跑下楼查看,发现根本不是IP的问题,而是提示网络电缆未连接,看了两台都这样,毫无疑问,应该是交换机没上电。
又回到机房,交换机电源灯都亮,但是其中两台思科交换机,没有一个端口亮灯,十有八九有问题。
插上console线,按回车键,一片空白,啥都没有。
重启交换机,终端软件显示booting system,然后就提示mainboard hardware authentication failed–主板硬件身份验证失败,然后就没有然后了。
客户自觉地说:报价吧,申请采购。
还没等到采购批准,却又接到客户来电,说是ERP系统无法登录,使用teamviewer远程,根据IP地址,猜测ERP服务顺在国外,既然无法登录,那就先tracert一下吧,结果被告之,cmd是被管控的。
那么思科的防火墙和核心交换机的管理员密码呢?也没有,这可让我怎么排查?各位看官,且看我下回再叙吧。