网上冲浪 2016-11-25
笔者筹建过某公司的网络中心,该中心以负责全市各家分公司间信息的交换,实现各分公司间资源的共享。各分公司都通过DDN专线经路由器用TCP/IP协议与主机连接。
网络中心的以太网分为两个网段:192.168.1.x和 192.168 2.x,以下简称网段 1和网段2。其中有用于处理备分公司信息的生产机及开发机各一台,另有二台与各分公司进行远程通信的路由器。另外还有一些用于开发和监控的计算机。网段2中有多台计算机,进行客一端的开发调试。开发机和一台计算机同时连在两个网段上。
某天,网络发现各分公司的数据传输不正常,而旦是采用TCP/IP协议与中心连接的分公司的数据不正常。隔一段时间就发现这些分公司的数据通信室都不能进行,经过几天努力还是无法解决,但是公司正常运转必须借助网络,于是向笔者求助。
诊断过程
笔者赶到现场,仔细观察故障现象,基本上可以判断是通信问题造成的因为无论是在网段1 还是在网段2 上 计算机与生产机的连接都出现了时断时续的现象。而与生产机直接相连(不通过以太网)的主控台与主机的连接则没问题。从主控台上看,无论是内存占用还是CPU利用率等各方面都没有发现异常。而且生产机上的所有进程也都没有发现异常。看来问题出现在以太网上。
既然两个网段与主机的连接都有问题,是不是两个网段都有问题呢?用TCP/IP协议中最基本的测试方法Ping命令测试,结果发现网段2中的各台计算机之间的连接都没有问题,而网段1 中,不只是各台计算机与生产机之间Ping时断时通,而且其他各台计算机之间互Ping也是时断时通。问题肯定出在网段1上。网段2 到生产机的通信有问题,是因为从网段2到生产机必须经过网段1。
究竟是什么地方出了问题呢?网段1 中各台计算机既然都是通过一台HUB连在一起的,那么HUB出问题的概率很大,所以首先要查一下HUB。经检查,H U B的工作状态正常,但是插在某个端口中的双绞线的指示灯状态却不正常;是闪烁的红灯(与正常运行的计算机连接时,各端口的指示灯应为绿色)。拔下此端口中的双绞线,网段1 中各台计算机间的通信恢复正常。
这就比较好办了,笔者 “顺藤摸瓜”沿着这条线排查下去,出问题的这条线连接的计算机正是接在网段1 上的。经查证,使用该计算机的用户想起出现问题时他恰好打开计算机。
会不会是这台计算机的问题呢?这台计算机设置好之后很久没有更改了,问题不应出在软件上。是网卡出了问题吗?笔者用另一块好的网卡替换下计算机里原来的网卡,问题仍然存在,说明问题不是出在网卡上。笔者拿来另一台计算机接在这根网线上,还是不能正常连上网络,看来问题多半就在于网线。根据以往的经验,网线的问题多出现在水晶头上,水晶头如果压得不好,拔插的次数一多就容易出问题。笔者干脆把线两边原来的水晶头切下来重新做。出乎意料的是问题仍然存在。如此看来,问题只能是出在线中间了。笔者从一头顺着双绞线检查,终于找到了问题的根源,原来是线被一条机柜压住了。由于机柜很重,压的时间比较长,以至于把双绞线的外皮压破,造成双绞线混线。更换新的双绞线后 故障解决。
排除心得
由于以HUB连接的局域网采用CSMA/CD(即带有冲突检测的载波侦听多路存取)技术进行信息传输,所以当网线发生混线后,信号不能正常传输并产生错误信号,以至网段内充满错误信号,使得正常信号不能顺利传输,导致网络通信的时断时续。从本例中我们可以得到一些经验 :在以太网中,尤其是以HUB连接的共享以太网中,网络中任何一点产生的问题,都可能造成整个网络的不正常以至瘫痪。网线虽然是连在HUB和单个计算机之间,但若是出了问题却可能影响整个网络。