电脑技术学习

登陆难 交换机故障现象综合说明

dn001

  除了一些常见的故障之外,在遇到问题的时候,我们应该去找一些专业的人员去修理,这里我们分析了登陆慢的交换机故障现象,一个局域网无论其组网规模多么合理,无论其选用的网络设备性能多么良好,它都有可能发生网络故障,就象一个人那样,无论他身体多么棒,偶尔也会有一些小病小痛的;我们平时能做的就是对网络加强管理,做到防范于未然,以便让局域网尽可能少地出现交换机故障现象。

  当然,在实际管理网络的过程中,一些细节因素往往并不是我们所能控制的,由一些不起眼的因素引起的网络故障,排查起来自然也就不那么顺利了。这不,本文下面的一则故障就是由于设备通风效果不好,造成交换机严重“发烧,最终引起登录服务器狂慢故障;由于这种因素很少会出现,在排查过程中网络管理员忽视了它,导致其故障排查过程异常曲折,现在本文将它共享出来,与大家进行交流!

  登录速度狂慢

  某大楼局域网组网结构很简单,100台左右的计算机分布在六层楼上,每个楼层上的计算机都通过实达品牌的24口交换机,与单位局域网的QUIDWAY S3050主交换机进行连接,其中单位的Web服务器、打印服务器以及一些重要的计算机,全部单独连接到一个实达交换机上,这些实达交换机都通过100M双绞线与主交换机进行级联。

  平时,局域网中的所有普通计算机都能互相共享访问,而且它们也能正常地访问单位的Web服务器、打印服务器等重要主机。可是,最近单位在局域网的Web服务器中发布了一则通知消息,要求各位员工上网浏览时,员工纷纷反应,说登录Web服务器的速度非常缓慢,完全没有以往一气呵成的感觉。

  故障就是命令,接到登录速度狂慢的电话后,笔者立即打开自己的笔记本电脑,使用ping命令测试Web服务器的IP地址,从测试操作返回的结果来看,Web服务器的IP地址一会儿能ping通,一会儿不能ping通,而且在ping通的情况下,服务器响应时间也是比较长,这与平时响应时间小于1ms的时间相比,简直是相差太大,看来局域网中真的存在网络故障。

  分析寻找原因

  既然局域网中多数员工不能正常登录单位的Web服务器,那会不会是该服务器工作状态出现了意外呢?大家知道,Web服务器持续工作的时间一长,特别容易发生反应迟钝现象,毕竟该服务器平时处理的各种请求比较多,要是在同一时间段内处理的访问请求数量超过一定标准的话,那么服务器系统资源可能会迅速消耗殆尽,如此一来Web服务器服务器系统自然就不能正常运行了。想到这一点,笔者立即远程启动了该服务器系统,待启动成功后,笔者再次ping了一下该服务器的IP地址,发现ping命令的响应时间还是不正常;尝试进行登录访问时,笔者看到访问速度还是慢吞吞的。为了确认登录狂慢的交换机故障现象与Web服务器的工作状态无关,笔者又测试了打印服务器以及其他一些重要计算机的IP地址,发现这些重要的计算机IP地址也不能被正常ping通,这说明问题的确不在Web服务器身上。

  在排除Web服务器自身状态不正常因素后,笔者开始怀疑局域网网络中有病毒存在,造成了整个网络传输通道发生了堵塞现象。由于局域网中包含的计算机数量比较多,单纯依靠杀毒软件进行逐一查杀,那工作量将是非常的巨大,而且也不利于高效解决网络故障,为此笔者打算测试一下局域网中计算机相互之间的通信速度是否正常。想到做到,笔者先是ping了其中一台计算机的IP地址,发现此次ping命令操作的响应时间很快;但是笔者还是有点不放心,于是又尝试着与这台计算机进行文件共享交流,结果发现几兆大小的文件,一眨眼工夫就传输完成了,这说明局域网工作站相互传输文件的速度是正常的;后来,笔者又与其他计算机进行了共享文件传输操作,发现文件传输速度也很正常,这就证明了局域网的网络传输通道并没有发生堵塞现象,那样一来,局域网中的计算机即使感染了网络病毒,也不会对登录服务器操作产生实质性影响,为此笔者判断该交换机故障现象与网络病毒或广播风暴现象也没有关系。

  由于笔者先前已经对Web服务器、打印服务器等重要主机的IP地址,依次进行了ping通测试,发现它们的响应速度都不正常,而这些重要主机都是单独连接到另外一台交换机上的,会不会是这个交换机工作状态不正常呢?笔者打算使用telnet命令远程登录进该交换机后台系统,不过在尝试远程登录操作时,笔者发现登录速度也是异常的缓慢;再尝试登录局域网中的其他几台普通交换机时,发现登录速度都很正常,看来那个连接重要计算机的交换机工作状态有问题。于是笔者立即赶到那台故障交换机现场,发现该交换机与Web服务器的主机全部放置在机柜里面,只是交换机没有固定在机架上面,而是直接水平放置在Web服务器的主机上面,两者之间紧密接触,没有任何缝隙;仔细观察交换机的信号灯状态时,笔者也没有看到什么异常现象。考虑到交换机工作时间长了之后,很容易出现一些“软性故障,这些故障很有可能导致其工作状态不稳定,而解决这种“软性故障最好的办法,就是重新启动一次交换机系统,不过当笔者尝试这样的操作时,发现登录服务器速度缓慢的交换机故障现象仍然存在。

  有没有可能是故障交换机与核心交换机之间的连接不正常呢?为了排除这方面因素,笔者登录进入核心交换机后台系统,进入对应故障交换机连接端口的视图模式状态,使用“display interface命令,查看该连接端口的状态信息时,笔者看到故障交换机的连接端口处于“up状态,如此说来核心交换机与故障交换机之间的网络连接应该是正常的;此外,笔者发现该交换端口的输入数据包、输出数据包的大小也是正常的,而且输出广播包的大小也一直处于稳定状态,这说明故障交换机下面不存在广播风暴或网络环路现象。

  惊现发烧现象

  现在局域网中的普通计算机相互访问一切正常,偏偏访问连接到这台交换机上的重要主机时,速度明显不正常,会不会是该交换机的连接不牢靠,或者是该交换机的自身性能不稳定呢?想到这一点,笔者打算使用其他的普通交换机来替代这台故障交换机。就在笔者切断故障交换机电源,准备用手将其取出来进行替换时,笔者惊讶地发现该设备的表面十分烫手,而且Web服务器主机表面的温度也很高,将手靠近这些设备的附近时,也能明显感觉到空气中的热流,看来交换机正处于严重“发烧状态,会不会是交换机的“发烧,造成了其他计算机无法正常访问到连接到该交换机上的重要主机呢?为了验证自己的猜想,笔者将严重“发烧的交换机以及Web服务器主机的电源都切断了,同时将交换机与Web服务器主机之间的距离拉开了,确保它们在工作的时候都能通风良好;此外,为了让这些“发烧的设备尽快地冷却下来,笔者还特意找来了电风扇,持续对着它们吹了半个小时,待感觉到它们外壳表面的温度恢复正常后,重新接通了它们的电源。这时候奇迹出现了,笔者再次从自己的计算机上ping了Web服务器主机的IP地址,此次返回的测试结果一切正常;当笔者打开IE浏览器,试着访问单位发布在Web服务器上的通知信息时,浏览速度竟然很快,看来造成登录服务器速度缓慢的交换机故障现象,就是由于交换机以及Web服务器主机的严重“发烧引起的。

  追查幕后黑手

  虽然交换机故障现象已经被成功排除了,但是让笔者感到纳闷的是,交换机以及Web服务器主机为什么会“发烧得这么厉害呢?经过对故障现场的仔细勘察,笔者发现交换机以及Web服务器主机所在的机柜,顶上安装了四个风扇,平时机柜四面都是封闭的,只有通过四个风扇进行散热;可是,现在不知道什么原因,这四个风扇都不能正常工作了,那样一来交换机以及Web服务器主机持续工作时散发出来的大量热量,就不能及时从机柜中排除出来,再加上交换机与Web服务器主机之间接触紧密,它们散发出来的热量又会互相影响,最终造成了它们的工作性能严重下降。为了彻底解决交换机故障现象,笔者后来请了专业技术人员,维修好了机柜里面的风扇,同时将交换机以及Web服务器主机隔离了开来,这样一来交换机以及Web服务器主机再次“发烧的机率就大大下降了