|
在广域网日常维护工作中,最令网管员头痛的就是广域网线路发生时通时断故障。由于广域网线路涉及本端用户、本端线路运营商、对端线路运营商和对端用户四个环节,中间经过的网络通信设备较多,引起线路时通时断故障的原因也较多,有线路运营商方面的原因,也有用户方面的原因,有硬件设备方面的原因,也有病毒方面的原因,这些都要一一进行排查,往往耗费大量的时间。前不久,笔者就遇到并迅速解决了一起到下级单位的广域网线路时通时断故障。现将解决步骤和方法介绍如下,希望能对大家有所帮助。
<P> <STRONG>一、快速判断故障原因</STRONG> </P>
<P> 当一条广域网线路发生时通时断故障时,作为一名管理员,首先要快速判断出是线路运营商方面的原因,还是用户方面的原因,以便分清责任,尽快加以解决,防止用户和线路运营商之间出现扯皮现象。如果广域网线路是通过路由器实现的,可以登录到路由器,使用扩展Ping命令,向对端路由器广域口地址发送大量数据包进行测试。如果广域网线路是通过三层路由交换机实现的,可以在线路的两端分别直接接一台计算机,并将IP地址分别设为本端三层路由交换机的广域接口地址,使用“Ping 对端计算机地址 –t”命令进行测试。如果上述测试没有发生丢包现象,则说明线路运营商提供的线路是好的,引起故障的原因在于用户自身,需要进一步查找。如果上述测试也发生丢包现象,则说明故障是由线路供应商提供的线路引起的,需要与线路供应商联系尽快解决。 </P>
<P> <STRONG>二、快速判断故障位置 </STRONG></P>
<P> 当确定引起线路时通时断故障的原因是用户方面的原因时,需要进一步判断到底是广域网线路哪一端用户的原因。可以使用“Ping 本地网关 –t”命令,检查本端计算机到本端网关的连通性。如果此测试发生丢包现象,则说明故障是由本端引起的,需要进一步查找。否则说明故障是由对端引起的,需要对端用户进一步查找。 </P>
<P> <STRONG>三、准确定位故障位置</STRONG> </P>
<P> 在确认故障是由线路的某一端引起之后,可以采取以下两种方法快速准确地定位引起故障的具体位置所在。一是采用“设备替换”法,利用一台新的路由器、交换机等网络设备替换现有的网络设备,如果线路恢复正常,则说明是该网络设备发生故障。否则需要继续查找。二是采用“网线插拔”法,利用一台运行正常的计算机,输入“ping 对方计算机 –t”命令,同时逐一插拔交换机上的每一根网线。如果看到在断开某一根网线后整个线路恢复正常,则说明故障和这个端口有直接关系。再将这根网线插到交换机上的其它端口进行测试,如果线路恢复正常,则说明是交换机上的这个端口发生故障。否则说明连接这个端口的计算机或网线发生故障,需要继续查找。</P>
<P> <STRONG>四、准确查明故障原因</STRONG> </P>
<P> 在将故障定位到交换机上的具体某个端口以后,首先检查与该端口相连接的计算机运行是否正常。可以双击网卡,查看该网卡的发送包和接收包的数量,如果发现网卡的发包数在快速增加,则说明这台计算机感染了蠕虫病毒,应立即切断该计算机与网络的连接,进行病毒的查杀处理。否则说明该计算机的网卡或网线发生故障,需要更换新的网卡或网线。 </P>
<P> <STRONG>五、体会</STRONG> </P>
<P> 作为一名广域网络管理员,在遇到线路发生时通时断故障时,一定不要惊慌,要冷静分析故障发生当时的现象,熟练综合运用“二分法”、“排除法”、“设备替换法”和“网线插拔法”等多种方法,一步一步地进行故障排除,快速定位故障的具体位置,迅速查找出引起故障的原因,及时采取相应措施加以解决。目前,计算机病毒对广域网线路造成的危害越来越大,笔者遇到的95%以上的广域网线路时通时断故障都是由计算机病毒引起的,尤以“蠕虫王”病毒引起的此类故障居多。因此,建议在全网配备防病毒系统,购置IDS入侵检测系统、网络流量监测工具等,以加强对计算机病毒的防治工作,加强对广域网线路运行状态的监控,及时发现和处理网络上的异常流量和病毒攻击等问题,并制定一系列计算机安全管理制度,确保广域网线路的正常运行。 </P> |
|