摘要:
nfs server可以看作是一个file server,它可以让你的pc通过网络将远端得nfs server共享出来的档案mount到自己的系统中,在client看来使用nfs的远端文件就象是在使用本地文件一样。 nfs协议从诞生到现在为止,已经有多个版本,如nfs v2(rfc1094),nfs v3(rfc1813)(最新的版本是v4(rfc3010)。 二、各nfs协议版本的主要区别 v3相对v2的主要区别: 1、文件尺寸 v2最大只支持32......
摘要:
怎样在vi中去掉响铃的警报?
tsgx 回复于:2003-10-15 13:56:45
不知道能不能去掉,我也想知道。
加菲猫 回复于:2003-10-15 14:04:44
好像不行
labrun 回复于:2003-10-15 14:44:51
set noerrorbells好像不怎么管用。
哪位清楚呢?
herogl 回复于:2003-10-15 14:52:26
set bell-style none
......
网络医院的故事《转贴》
该文件里有几十例网络故障例子。希望对大家有帮助。
【相关文章:
如何恢复grub?】 【扩展阅读:
实用技巧:sys 请求——内核严重错误?】
【扩展信息:
Linux学习和提高优秀书籍下载(第二辑】 网络医院的故事
时间:2003/04/24 10:03am 来源:sliuy0 整理人:蓝天 (qq:12015152)
[引言]网络正以空前的速度走进我们每个人的生活。网络的规模越来越大,结构越来越复杂,新的设备越来越多。一个正常工作的网络给人们带来方便与快捷是不言而喻的,但一个带病工作的网络也常常给人带来无穷的烦恼甚至是巨大的损失。网络世界中最忙乱、心里最感底气不足的人恐怕要数网络管理人员与运行维护人员了。他们时时刻刻都在为他们的网络担心,病毒、黑客、速度变慢、网络崩溃....
[小康档案]:三年前负责管理coneill公司,一家快速成长的公司的网络,曾自认为是nt与novell、unix等平台以及oracle方面的专家,擅长协议分析与网管软件的使用,每天忙于安装设置不断加入网络的设备与系统,应付不断增加的各种意外事件、报警与陷井,处理网络设备经常性的增加、删除、更改与系统设置、连接等方面的故障与问题。至于如何提高网络的运行效率、如何合理调整网络流量并配置网络设备、如何防止网络问题的发生、如何采用宽带网络设备组网及应用等则基本上无暇顾及。一年前,小康从网络健康学院毕业后到网络医院就职,负责网络的体检(测试)与故障诊断,专门为哪些网络发生严重问题的“病人”提供帮助。现在他已经是一位经验丰富的网络健康维护的医生,巡诊故事多多。
第一部:网络经脉篇
[故事之一]三类线仿冒5类线,加上网卡出错,升级后比升级前速度反而慢
[症状]今天是我第一次巡诊,病人抱怨他的大多数站点上网连接速度比系统升级前还慢,有的站点时断时续,有的则根本不能上网。原来用的是10m以太网,工作非常稳定,性能优良。升级后全部更换为100m系统,出现上述症状。用户总数未有增加,也没有启用大型软件或多媒体应用软件。重装系统软件、应用软件,重新设置服务器与网站,查杀病毒,reset所有联网设备均不奏效。其中,有两台机器换到另一地点后能基本正常工作。用笔记本连接到这两个不正常链路的集线器端口上网,也能正常工作。更换这两根网线后现象依旧。将机器还原到原位置,更换网卡(原卡商标为3com卡)后恢复正常,不知何故。由于以太网大多数用户不能工作,只好暂时退回到10m以太网系统。
[诊断过程]从10m系统的网管上观察,网络的平均流量为3%,低于40%,由于未运行大型软件与多媒体软件,应该不会感到任何速度上的“折扣”。将fluke的f683网络测试仪接入hub端口,测试网络流量为35%。碰撞率为23%,远远高于5%的健康标准。报告的错误类型有:延迟碰撞、fcs帧错误、少量本地错误。基本可以断定是布线系统的严重问题。遂对线缆进行测试,结果显示除了测试点的两根电缆线外,其余所有布线链路的衰减与近端串扰均不合格,用3类标准测试这些电缆则显示全部合格。查看线缆外包装上印有lucent cat5的字样,可以断定是仿冒产品。测试
两台工作站的链路长度分别为78米与86米,测试其网卡端口,显示网卡发射能力(信号幅度)不足,并且仪器上没有内置的3com厂商标记显示。
[诊断点评]用3类线外覆5类线产品标记在假冒伪劣产品中为数不少。用户在10m以太网环境中不会出现应用上的问题,一旦升级到100m环境在只有少数短链路能勉强使用。对于两台更换地点后能正常工作的网站,查明链路长度只有3米,且为标准的5类线(平时此站点用于临时测试)。原地点测试长度为45米与37米,由于网卡发射能力弱,信号在100m系统衰减大,造成上网困难。改在3米链路连接时,衰减的影响小,故可以正常上网。网卡测试显示为仿冒卡。
[后记]一个月后,“病人”打电话告述我,重新布线后网络工作完全正常,即使跑一些多媒体软件也丝毫没有停顿的感觉。不好的消息是,原来的系统集成商已不知去向,无法索赔了。
wangla 回复于:2003-10-20 14:05:55
[故事之十七]六类线工艺要求高,一次验收合格率仅80%
[症状]某著名布线工程商及系统集成商,采用六类线为某市新建的电信大厦布线,点数虽然不多,只有共1,800点,很快就完工,但在验收测试时遇到一些小麻烦:合格率一次性测试通过值只有80%,其余的20%近360条链路不合格。布线商采用的都是某电缆生产商的正规产品,包括全套的电缆与连接模块,其质量在施工前进行过验收,抽查过其中三卷产品,均合格。承担施工的队伍也是有近四年工程经验的下属布线工程公司,曾经有10万条链路的成功施工经验。此次工程项目为第一个六类线试点工程,对公司的布线施工队伍也是一次考验,结果却不尽人意。如果360条链路全部返工,计算下来也是一笔不小的损失。因此公司决定先对剩余的六类线再行进行抽查,以确定是否是产品的问题;然后再安排如何更换或修复这些不合格链路。
抽测结果如下,抽测的10卷产品,每卷产品截下90米,按90米六类线“basic link”基本链路连接后进行现场认证测试,结果有7卷产品不合格。由于该工程商同时也是厂商的产品代理尚,厂商的销售代表也无法解释测试结果。接着再进行了第二次抽查,结果10卷产品的90米模拟链路仍有6卷不合格,遂请“网络医院”帮助确认原因。
[诊断过程]到达现场后计划部分测试不合格的链路,共抽测了20条,结果全部不合格。打开电缆测试仪dsp4000中保存的参数,查看主要不合格的参数有回波损耗“rl”,“psacr”综合衰减串绕比等,比例占80%,其次是“pselfext”综合等效远端串扰、“psnext”综合近端串扰等。对工程商原来抽测过的链路进行复检,结果与上述结果基本一致。
仅靠生产商提供的产品证明与合格证书似乎已不足以证明其产品是否满足工程施工现场认证测试的要求。为了确认是否是厂家电缆产品与接插件、连接模块等本身的问题,我们建议布线工程商将他们代理的另外一家电缆生产商供应的产品拿来与本项工程采用的电缆进行对比。对比方法如下:同样制作10条链路,测试条件与上述抽查时的测试条件相同,然后统计测试结果,与前面的测试结果进行对比,以便验证是否是产品本身的问题。
一小时后,工程商依此建议制作了两组共20条用另外两家电缆生产商提供的电缆产品“加工”成的90米基本链路,每家10条链路。我们分别对这些链路进行测试,结果如下:
链路合格率为a产品80%,b产品70%;且各有20%合格的参数比较靠近测试标准的边缘,一般只有0.5~1.3左右的参数富余量。
由此看来,各电缆生产商提供的产品都有相近的合格率,这岂不等于说各电缆生产商提供的产品都有问题?根据逻辑分析只能有以下几种可能:一是产品质量确实有问题,但有问题的比例为何如此一致呢?似乎可能性不大;二是测试仪器或测试环境有问题,比如仪器误差偏差或损坏,测试环境有大量电磁干扰源或干扰信号,但施工现场与试验测试地相距达400米,电磁环境相异甚多,且周围没有其它使用特殊电磁设备的邻居与大型用电设备、强功率辐射源等,这条原因似乎也不象;三是施工方法、施工工具与测试的方法有问题,但工程商承担施工人员的都是有至少一年施工经历的员工,且为试验链路打线的人员已经为该公司工作了两年半,技术上应该没有问题。打线工具经过目测检验没有问题,并且工程施工中的打线工具不是刚才试验链路制作时的同一个工具。
我们暂时假定产品没有问题,采用另一台自身携带的dsp4000电缆测试仪与工程商自备的同一型号的电缆测试仪进行对比测试,各测试结果一致性相当好,说明测试仪没有问题。为了定位故障位置,使用dsp4000电缆测试仪中的“hdtdx”高精度时域串扰分析功能与“hdtdr”高精度时域反射分析功能进行故障图谱分析,结果发现不合格参数的“突出位置”都在接插件与连接模块的位置,这说明要么接插件与连接模块有质量问题,要么就是施工工艺存在问题。接下来将不合格链路中的接插件与连接模块重新更换一遍以后进行测试,结果三家产品各自10条链路中有一家全部合格,两家只有一条不合格。将不合格的链路再“回炉”一次,进行第三次测试,结果全部通过测试。再对20%参数靠近边沿的链路认真“回炉”进行测试,结果全部合格。
这说明,接插件与连接模块的施工工艺可能是链路认证测试不合格的重要原因。
下一步,为了验证是否是电磁干扰等可能原因,回到工程现场,选取20条原来测试不合格的链路也如法炮制,重新“回炉”,将接插件与连接模块重新“认认真真”制作一遍,结果一次重新测试就全部通过!!
[诊断评点]综合布线的施工工艺看似简单实则要求不低。在三类线的施工过程中,大量的布线商采用临时性的施工人员,经过两小时培训后就上岗工作,工程验收合格率仍比较高。在五类线与超五类的施工过程中,工艺问题开始被工程商重视,但一般不足以形成如此大面积高达20%的链路不合格的严重后果。而在六类线的施工过程中,施工工艺问题被推到了非常重要的位置,在打线与安装时稍有不慎就会使整条链路认证测试不合格,这是工程商始料不及的。其实,诊断具体的故障位置方法很简单,使用电缆测试仪的高精度时域串扰分析技术“hdtdx”与高精度时域反射分析技术“hdtdr”两项故障诊断功能就可以非常方便地显示出故障的实际位置。施工人员可以据此立即采取修复措施,而不会等到认证测试与验收时“去丢人现眼”“出洋相”了。
六类电缆频带由100mhz增加到250mhz,对特性阻抗机器连续性的要求提高了很多,另外对近端串扰、等效远端串扰、衰减串绕比等参数的要求随着频率增加的平方数成正比。上述参数的power sum (功率与)参数也被提高到非常严格的程度,表现在施工工艺中比较突出问题就是接插件
与连接模块的制作工艺对整条链路的影响变得非常突出。所以严格的施工工艺要求需要引起布线工程商的高度重视,只有这样才能避免造成影响工期的大面积返工与资源的浪费。否则,一次性验收测试一般会停留在80%左右。
[诊断建议]将不合格的360条链路重新严格制作一遍,并对参数靠近边沿2db以内的的360条链路也采取同样改进措施,以确保工程品质。另外,施工队伍的严格培训与强调施工工艺的严格性也必须认真对待之。
[后记]一周后,工程商告知,经过“回炉”后,1800个链路全部验收合格。除了重新处理不合格的360条链路外,对边沿值的360条链路也进行了重新制作,参数测试富余量全部都在2db以上,他们准备把这项工程作为该公司的样板工程。
wangla 回复于:2003-10-20 14:15:51
[故事之一]网络黑客程序激活,内部服务器攻击路由器,封闭网络
[症状]某大型连锁超市集团计算机中心中心it经理钟小姐,今天上午向网络医院报告网络出现严重故障。其中心网络的局域网速度很慢,与各地连锁店管理中心的资金结算与物流调配速度更慢。故障开始出现于两周前,先是感觉网络运行速度有明显下降,而后病情一天天加重,直至今天基本上处于近似瘫痪状态。内部数据调用需要3分钟(以前只需要3秒钟),与其它连锁管理中心之间每笔业务结算与物流配送出入栈登记都要花费差不多2分钟时间(以前只需要最多5秒钟)。造成大量货物配送无法履行相关手续,部分连锁店被迫采用手工记帐接受货物配送,大多数连锁店则大大减慢了货物配送的进程,超市货架已有不少断档供应,人手紧张。
钟小姐介绍,由于货物配送出入栈登记与结算中心设在中心网络,所以他们的网络维护人员最先对中心网络执行紧急抢修程序。ping测试所有重要的服务器、路由器、外地路由器、外地服务器,结果都在15ms以内。说明联通性还基本良好。关闭中心网络系统,暂时停止业务,再重新启动运行。刚开始速度还比较快,但很快就在10分钟内迅速下降至病态水平。全部启动5台备用服务器,顶替原服务器当中的5台投入运行,网络速度有明显提高。不过好景不长,约2小时后,从网管系统观察,服务器流量比平常高,路由器流量基本满负荷。关闭一半的服务器与站点,网络速度有所提高,似乎网络流量与站点数量有关联,所以无法定位网络故障的准确地点。于是怀疑是否是有“病毒”在做崇,将所有站点与服务器用多种查杀毒软件杀毒,启动系统后故障依然如故。
[诊断过程]故障地点可能就在中心网络,但也不排除受其它远程网络影响的可能。所以从网络医院出来我们决定先前往该超市集团总部的计算机中心网络所在地。30分钟后我们抵达了目的地。我们将f68x网络测试仪接入中心网络交换机进行观察,逐个观察核心交换机与工作组交换机每个端口的mib代理,发现除了端口流量偏高外,网络一切正常。不过,也发现一个奇怪的现象,那就是各端口的流量都基本相同,为50%~60%左右;询问钟小姐有无以前的基准测试记录与近期的网络健康测试记录,回答是没有。本网络自半年前建成以来一直工作优良,偶尔出点小毛病网管人员很快就能解决,所以除了机器档案与网络结构拓扑图外,再没有其它网络维护的文档。
可以肯定的是,如此高的网络流量必定意味着某种故障的存在。我们此时需要确认2点:一是网络平时主要的工作协议是哪些,二是这些流量是否是正常工作所需的流量。而这些数据都是该网络现在无法提供的。为此我们将f69x流量分析仪接入全部8个服务器与交换机之间,观察网络主干流量的应用流量分布。结果如下:各服务器均接受大约50%流量的cc:mail数据包,其它按服务器编号依次是oracle应用占3%,http应用占2%,ms-sql server应用占1%,dns应用占1%,oracle
应用占0.5%,informix应用占0.1%,ftp应用占0.7%。可见影响网络流量的主要是cc:mail应用。
观察cc:mail数据包的对话情况,基本上中心网络内的站点与服务器都有记录,并且有通过路由向外发送的数据包,这也就是说,中心网络的每个成员都在向该局域网内的所有成员发送邮件数据包cc:mail !问题是,这些邮件数据包是如何进入各服务器与工作站的。我们同网管人员一起了
一下回顾病情发作过程,今天是1月13日,故障是2周前出现的,也就是2000年元旦前几天开始发病的。我们请大家一起帮助回忆是否在网络上运行过非法软件,包括贺卡之类电子的邮件。钟小姐回忆当时曾发现网管人员互相传阅过一个很有趣的电子圣诞卡,钟小姐本人也很喜欢这张贺卡,但出于职责与管理制度的规定还是制止了。会不会是这张卡在“作怪”呢?
我们选择3台主服务器与10台站点作格式化硬盘并重新安装系统,将备份数据还原到服务器中,此时只允许远程连锁管理中心与计算机中心的3台服务器进行业务数据传递与计算。其它服务器与工作站则暂时关机。启动系统进行正常操作,同时监测交换机相应端口的流量,均小于4%。网络一直工作正常。这说明格式化以后的服务器不再运行cc:mail应用程序。坚持到晚上22:00所有连锁店打佯,启动未曾格式化的服务器与工作站,并请下辖11个远程连锁管理中心网管人员配合模拟进行网络业务操作,约10分钟后,端口流量开始迅速上升。从流量分析仪上观察到的现象是:非法的cc:mail应用流量首先从6号服务器,然后紧接着从17号、42号、31号工作站与其它服务器陆续出现。在出现cc:mail应用流量以前均有ftp协议应用流量出现。检查这几台机器均安装运行过贺卡程序“my world is in favor”。
现在,我们可以得出初步的诊断结论了:首先,非法的网络应用可能从贺卡开始,然后在数据交换的时候“favor”程序自行展开成为黑客程序,对准所有有过数据交换的站点发送cc:mail应用数据。由于该程序具有传染性,很快局域网内的所有站点都会感染上此黑客程序并依次发作。由于应用流量设计不是很高,所以发作过程相对较长,每个交换机端口通过的流量也基本对等,表现为50%左右。将捕获的数据包进行解码分析,邮件为单向传输,无回应。内容循环显示为:
“my world is in favor ,i love you”
停止网络运行,将所有网络设备断电(包括路由器),并将所有服务器与工作站格式化,将人员分组,重新安装系统与应用程序,恢复备份数据,经过近4小时的紧张工作,于次日7时重新启动网络运行。至中午12:00监测的数据流量端口小于5%,服务器小于4%。
[诊断评点]网络应用中的危险因素很多,为了净化网络环境,最起码的要求是不允许在专用网络上运行任何非法程序与盗版软件。本故障由于网管人员私自运行了携带黑客程序的软件,导致网络遭受高流量冲击,几乎近于瘫痪。本黑客程序的发作机理比较隐蔽,先逐个感染局域网内的服务器或工作站,然后逐渐在有数据应用时展开程序进行流量争用,使得网络流量逐渐增高。路由器采用的是ddn与部分isdn链路,因瓶颈效应的存在更容易被堵塞。所以网络速度表现为局域网速度变慢而广域链路则更慢。由于网络流量分布比较均衡,所以当网管流量报警门限设置比较宽松时,网管系统将不会出现报警信号(该网管没有进行报警门限设置)。而此时网络的总体流量负荷却已经接近于极限值,路由通道更是拥挤不堪。
[诊断建议]基准测试是网络定期测试的项目之一,坚持基准测试可以帮助网络维护与管理人员掌握网络的变化趋势与故障出现的方向与规律。比如,基准测试数据显示网络平时的平均流量小于6%,网络工作协议共有15种,那么当流量出现超过6%时就能引起网管人员的注意并即时监测其变化,核对工作协议以确定是否有非法协议运行。以“此案”为例,网络合法的工作协议中并没有cc:mail协议,而此时出现了这种协议,网管人员就必须立即对其进行清理。比照网络基准测试的文档备案资料,本故障本可以立即得到纠正;另外,流量管理是网络管理进行到高级阶段时必须实施的监测与管理手段,对于监测网络应用、跟踪黑客、净化网络协议、查找网络疑难故障、介绍网络运行费用、优化网络结构等都有着非常大的帮助。最后,从预防网络故障的角度出发,加强内部管理,加强用户教育的工作要始终认真坚持并严格执行。
[后记]钟小姐第二天来电告知,网络一直工作正常,从流量测试仪上观察,非法协议应用一直没有出现,还将继续监测一段时间。他们现在正在对网络进行文档备案与基准测试,从今天起开始长期监测并分析网络的健康指标,实施“网络健康维护战略”。
wangla 回复于:2003-10-20 13:50:48
[故事之二]ups电源滤波质量下降,接地通路故障,谐波大量涌入系统,导致网络变慢、数据出错
[症状]今天的病人是一家著名的证券公司。上午9:45,用户来电请求紧急救援,说大户室中的一群声称遭受巨额无端损失的愤怒的股民们正聚集在营业部计算中心的机房门前,质问为什么实时交易的动态信息显示屏幕出现大片空白,数据刷新与交易的速度都极慢,且经常中断,根本无法进行交易。扬言如果不立即恢复交易,将砸掉证券交易所的计算机。交易大厅的散户门也开始向机房云集,如果不及时处理,情绪激动的股民们很可能真的会将营业部计算中心的网络设备砸个希巴烂。放下电话直立即直奔该营业部,途中继续用移动电话了解得知,该网络为10m以太网,用户数为230个。从卫星接收广播的行情数据,并回传交易信息。由于从卫星接收机监测口观察接收数据完全正常,故网管人员初步判定是网络系统的问题。两个月前就开始有传输数据错误的现象出现,有时数据更新出现空白,数据更新速度偶尔变慢,有时出现断续。虽用网管与协议分析仪检查过,但因这种“症状”并不连续出现,且对网络的速度与股民的交易基本没有影响,故一直心存侥幸,没有彻底查找真正的故障根源。前天参加“第二轮证券系统y2k统一认证测试”,顺利通过。利用剩余时间对硬件设备进行了检测与维护,之后进行联网检查,网络表现正常。不料今天开市就出现严重问题。
[诊断过程]用f683网络测试仪监测网络30秒,观察网络流量为81%(但网管报告为0.2%),错误帧97.6%。错误类型为ghosts(占93%)、fcs错误(又称crc错误)与jabber,即幻象干扰、帧校验错误与超长帧,这表明网络中有大量的非法数据包存在。此类症状一般以电磁干扰与接地回路方面的问题居多。为了确定干扰源的准确位置,将大部分与工作站相连的集线器组电源关断,服务器继续工作,观察错误率降为87%,仍然很高。重新打开集线器组电源,用f43电源谐波测试仪观察,发现谐波含量严重超标(最高970mv)。该网络用一台大型ups电源给所有网络设备供电,测试ups输入电源谐波,约为输出电源谐波含量的30%,明显低于输出端的指标,断定为内谐波含量超标。启动小型备用ups后,网络恢复正常工作(为减少负荷,网络设备分批轮换接入),但网络测试仪显示仍有错误存在,错误率(幻象干扰)下降为1.3%。再次关断集线器组的电源,类型为ghosts的幻象干扰错误率下降为0.8%,证实仍存在由接地回路串入的幻象干扰,且应该是从主通道进入。摇动卫星接收机的数据输出电缆,幻象干扰时有时无,拔下电缆则干扰消失。网管人员回忆前日维护机器时曾动过该电缆。由此造成连接不良。为使股民能继续交易,稳定情绪,在更换电缆后又将原ups启动继续工作提供服务。收市后再更换大型ups,故障彻底排除。
[诊断点评]故障原因有二,一是ups对电源的净化能力下降,网络外谐波容易从电源系统串入网络系统,为重大故障的发生提供了基础,但只是累积的内谐波超标还不足以引发致命问题。二是接地回路问题,给大量的内谐波串入网络提供了通道。内谐波是指从电源净化设备的输出端比如ups的输出端测得的谐波功率,由各种用电设备产生(网络设备绝大多数都采用开关电源,本身就是一个较大的谐波源)。本案中,大量的内谐波功率叠加后从卫星接收机数据输出电缆串入交易网络,一方面以幻象干扰的形式侵蚀网络带宽(此时网络测试仪监测到的错误类型即为ghosts),当以太网的网络总流量高于80%时,会导致绝大多数的网络瘫痪;另一方面,串入的内谐波将干扰正常数据传输(与正常的卫星广播数据叠加,表现为fcs帧错误与少量长帧),使卫星接收机接收到的数据出错,显示屏出现大片空白或不能实时更新数据。本故障为累积故障,两个月前因ups性能下降就开始出现少量干扰超标,不过这没有引起网管人员的足够重视。前天维护设备后又增加了电缆接地回路的干扰问题。但因当时未将卫星接收机连入网络,网管人员仅检查了网络部分的工作状况,所以此时的网络表现肯定是正常的。直到今天临近股市开市,当接通卫星广播数据的输入通道时,问题才爆发出来。此时内谐波干扰信号大举入侵网络,几乎造成网络瘫痪。
关断集线器组电源,内谐波总功率下降,干扰信号强度减弱,错误率自然有所下降。更换ups电源后,错误率大幅下降(理论上应降为零)。但因接地回路问题使50hz电源及其高次谐波感应信号仍能进入网络形成较小数量的错误帧。需要注意的一点是,一般人在更换ups后看到网络恢复正常工作即认为故障已经排除,因此很容易忽视仪器监测指示仍存在的少量错误(1.3%),这可能使“接地回路问题”这一重大故障隐患得以长期存在下去。
此故障的诊断网管系统基本上无能为力。
[建议]电源谐波功率含量与网络错误率要定期测试,当发现错误帧时一定不要掉以轻心。另外,一路电源能带动的工作站建议不要超过30台,否则应象划分网段那样重新划定供电区域。以免内谐波功率累积过大,超过设备的容许范围。如果您的网络可靠性要求很高,或者您的网络对您来说非常重要,那么建议您将主要的网络设备如服务器、路由器等,在网络规划设计时就选择由单独的ups供电。
wangla 回复于:2003-10-20 13:51:25
[故事之三]光纤链路造侵蚀损坏
[症状]周末,要下班了,我正在计划如何安排假期,接某银行来电,报告该行某支行下辖的西区营业部网络瘫痪,营业部所管理的33台atm取款机也全部不能提供取款服务,用户反响强烈。已经两天了,解决都没有问题,要求网络医院立即派人帮助排除。
西区营业部与支行在同一个大院的两幢大楼内,之间用一对90米的光纤将营业部的网络与支行的网络连接起来,路由器、服务器等都设在支行计算中心(100baset以太网)。营业部的网络结构为10baset以太网,五天前发现网络速度变慢,用户抱怨atm取款机等待时间太长。由于营业部没有配备任何网络测试与维护的工具,为了定位故障,请支行计算中心的网管人员协助检查。从支行一端的网络监测显示,一切正常。从计算中心打开营业部交换器的mib,观察流量正常,为5%,发现只有很少量crc/fcs错误,没有发现严重异常,用协议分析仪捕捉数据包观察,也未发现严重的问题,遂怀疑是病毒侵害营业部子网。昨日夜间进行了查杀病毒,重装系统,恢复数据等工作,症状大大减轻。但未能经受住昨夜暴风雨的考验(本周天气除昨天下午间晴外,连续降雨),最终于今晨“死网”。
为便于观察,支行网管人员在计算中心将连接营业部的交换机用集线器暂时取代,结果导致支行网络速度也变慢。检查营业部内的交换数据无障碍,断定是传输通道的问题。拔下光纤,支行速度恢复正常,插上光纤则上述现象重新出现。进一部测试光纤链路,连接与衰减均符合要求。故障排除工作陷于停顿。
[诊断过程]据网管人员介绍的上述情况,光纤与交换机已经过了网管人员初步检测,基本正常。可以初步判定问题出在链路通道上。将f683网络测试仪接入营业部交换机,观察网络基本正常。进行通道测试,检测营业部到支行的icmp ping测试结果,成功率约0.8%,路由追踪支行服务
器,成功率约0.5%。从支行集线器上观察,流量18%,属正常范围,但发现大量“幻象干扰”错误“gosts”(16%),拔除光纤,则错误为0%,至此可以肯定错误与营业部网络及其通道有关。将营业部与支行连接的交换机接口串入一个4端口的集线器,用f683网络测试仪观察网络,流量5%,发现大量幻象干扰(97%),拔除光纤,错误消失。寻找光纤接线箱,发现支行一侧的接线箱外包装已被撞击变形、破损(据说是半年前安装空调时被吊车臂碰坏),雨水已将3号接头完全浸蚀(3号接头用于连接营业部)。清洁接线箱内的所有光纤接头,用电吹风加热干燥光纤的插头插座,重新更换并密封接线箱,故障彻底消失。
[诊断评点]光纤链路经常被忽视。...
下一页 摘要:
samba是一个功能强大的软件工具,它可以让基于unix操作系统的计算机系统和基于windows的
计算机系统相互合作,之所以能做到这一点,是因为samba能够理解微软公司使用的联网协议smb(
session message block,任务消息块).从系统管理员的观点看,这意味着不需要在网络中所有的
windows客户机上都安装nfs服务就可以使用一个基于unix操作系统的服务器,而客户机则可以使用
自己原来的方式与服务器进行通信,这样减少了用户......