前言:中文期刊网精心挑选了网络故障处理方案范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
网络故障处理方案范文1
【关键词】 网络故障;处理;实践
1引言
随着各疗养院信息化建设的不断深入,疗养院信息管理系统、实验室信息系统(LIS)、图像传输与控制系统(PACS)、全成本核算系统、健康体检系统等在各疗养院的应用,有效地提升了医疗工作的质量和效率,同时对网络稳定性的要求也越来越高。本文结合自身实践,阐述系统化处理网络故障的方法。
2网络故障的系统化处理流程
2.1故障诊断在网络中,单一故障的表现可能是用户不能访问网络驱动器、无法发送电子邮件或者无法使用网络打印机等,引起这些故障的原因很多,可能是网卡、网线、集线器或交换机、路由器、服务器等发生故障,也可能是不正确的客户端软件配置、用户权限不够等原因。当网络出现问题时,应把用户的出错信息记下来,仔细分析可能产生故障的原因;当网络出现故障后,首先应引导用户详细描述故障现象和相关信息,利用这些信息辨别问题的具体症状,如果是用户操作问题,则可以当场解决。网络故障系统化处理流程(图1)。
2.2限定故障的范围故障范围可以区分为单个用户(或工作站)的问题、一个网段的问题、整个网络的问题。限定故障范围可以排除其他诱因和对网络中其他问题的关注。比如:当疗养科室的某个医生说自己的工作站登录不了疗养院信息管理系统,首先要判断是不是同科室的其他人也登录不了,或者是其他科室也登录不了。如果只是一个医生,同科室的没有出现类似的故障,则问题可能出在客户的权限不够,或者是该工作站的软件配置存在问题;如果是同科室的所有人都无法登录,则问题可能出现在科室交换机软硬件配置及科室交换机到核心交换机连接上;如果是其他科室也登录不了,则可能是核心交换机或数据库服务器的问题。
2.3验证网络物理连接的完整性根据经验,限定故障范围后,应该检查网络连接中最直接的潜在缺陷――物理连接。物理连接包括:从工作站到接入交换机的网线[1],从接入交换机到核心交换机的光电转换模块及光纤线路,检查交换机的接口指示灯显示连接是否正常,一个静态的绿灯通常都表示网卡成功的连接到网络,当网卡寻找或发现连接时LED灯会闪烁,一个静态的橙色灯通常表示网卡不能实现连接。从受到影响的节点开始,向主干网络延伸。如果网络连接正常,只是传输速率慢,应用网络分析仪详细检查网络传输速率、是否有丢包等问题。
2.4验证逻辑连接如果物理连接正常,则要检查网络的逻辑连接[2]。我们在工作中常见逻辑连接问题有:系统资源与网卡的配置冲突,网卡的IP地址没有正确配置,不同工作站发生IP地址冲突,Oracle数据库的客户端未正确配置。
2.5考虑到最近的网络变更开始排错时,应该清楚网络最近经历了什么样的变动,比如添加了一台交换机,重新划分了虚拟局域网,服务器更改了服务配置等,了解网络变动有助于快速解决网络故障。
2.6建立文档如果方案解决了故障,要把收集到的症状、故障、解决方案的细节记录下来,这样有利于经验总结,同时有利于故障解决方案的规范化[3]。
3结束语
为了更好地排除网络故障,信息科网络工程师不仅要充分了解自己所管理和维护的网络,而且要对网络协议和技术有着深入的理解,在此基础上,要建立一个系统化的故障处理流程并合理应用于实际中,以将一个复杂的问题隔离、分解或缩减排错范围,从而及时修复网络故障,确保网络稳定运行。
参考文献:
[1]廖绮丽.计算机网络故障分析及维护[J].医疗卫生装备,2005,26(7):74-75.
[2]李江,戴金萍,彭婷.浅谈医院网络常见故障的分类诊断[J].中国管理信息化,2010,13(7):74-76.
网络故障处理方案范文2
关键词:计算机;网络故障;故障分析;维护策略
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2016)10-0066-03
在日常生活学习当中,计算机的运行可能会受到多种因素的影响,诸如违规操作、病毒入侵、黑客攻击等等都会造成计算机网络故障的事故发生,影响计算机网络的正常运行。通畅,计算机网络故障主要包括硬件故障和软件故障这两大方面,根据不同类型的故障以及表现形式,采取相应的措施进行处理和改进。
1 计算机网络故障类型
1.1 软件故障
软件故障又被称为逻辑故障,破坏配置通信协议或者是网络设备配置就很容易引发计算机软件故障的发生,严重阻碍计算的正常工作和运行。包括主机、路由器、端口、计算机重要进程等设备在内,都是可能引起软件故障的设备,当这些设备受到不同程度的影响和干扰的时候,会直接阻碍计算机的正常运行。路由器故障多数情况下是由错误的参数配置、不合理的路由器配置所引发的,其验收和检查工序被忽视了,使路由器无法正常发挥其功效。中央处理器的过度利用以及计算机过小的内存,也会在一定程度上引发路由器故障。错误的路由器配置无法找到正确的远端网址,计算机与网络无法有效的链接起来,客户获取信息的渠道被切断。计算机重要进程如果被错误的删除了,那么就会出现系统故障的情况,计算机因关闭网络而与外界无法取得联系,影响计算机的正常使用。计算机与完结的联系主要是通过网络端口来实现的,因此常常会因受到病毒攻击而出现故障。计算机主机的正常运行与否直接联系到网卡驱动程序、网络配置通讯协议、计算机网络服务的使用功能。
1.2 硬件故障
硬件故障又被称为物理故障,通常来讲造成这种故障主要是因为网络设备引起的,如破损的线路或网线等等。硬件设施中所包含的任何一个环节遭到破坏,都会严重影响网络的正常使用,引发硬件故障,网络信号不好或者是网络断开都是常见的问题。当然,硬件故障也会在一定程度上受到人为因素的影响,例如错误的线路连接方式,没有采取维护方法等。最常见的故障类型就是线路故障,插口问题多数是由于接口故障引起的,厂家对产品的质量控制不到位。导致网络信号不稳定的物理故障多种多样,例如,不能正常运行的网卡,出现松动情况的网络,遭到破坏的主机等等,这就需要立即采取有效地措施进行处理和完善。
2 处理计算机网络故障的策略
2.1 网络故障排查
出现网络故障首先要进行排查工作,确认网线是否已连接,确认是否配置好网络IP地址。具体步骤如下:
第一步,点击无线网络链接的属性。如图1。
第二步,点击Internet协议(TCP/IP)。如图2。
这里需要注意的是,如果是宽带链接,应该手动填写DNS服务器地址和IP地址;如果是无线链接,就选择自动获取IP地址即可。
上述步骤都没有问题,就可以进行接下来的检查步骤,即检查网关设置。
第一步,打开开始菜单,点击运行。如图3。
第二步,将cmd输入到对话框中。如图4。
第三步,输入空格+网关地址,点击enter。见图5
第四步,查看回复,证明有无问题。见图6
2.2 掌握正确处理故障的方法
发生计算机网络故障可能是由多种多样的原因造成的,需要在第一时间内采取有效地方法进行处理。例如,利用相关工具对网络配置、网络协议和网络服务进行检查,查看其是否正确;利用专门的检测软件来检测应用程序的参数是否正常,这是比较常见的计算机网络故障的处理方法。又例如,当发生计算机网络故障的时候,可以根据相关经验进行分析总结,这样采取措施处理故障才更加有针对性,这种方法比较合适排除交换机和路由器检测的故障。除此之外,还可以对客户机组成、网络链接和服务器用网络链接结构分析法进行检测工作,包括计算机软件、计算机硬件、计算机病毒、计算机应用程序和驱动程度等等,及时的发现故障根源,并采取相应的措施进行修复。
2.3 严格遵循计算机网络故障的处理步骤
计算机的网络程序是一个比较系统、比较复杂的程序,在日常的学习和生活中可能会有诸多的因素来影响它的正常运行,因此,在对计算机网络故障进行处理的过程中,一定要遵循故障处理的步骤,避免因为人为的原因造成计算机网络的二次损害。计算机的管理者和使用者收集故障数据和信息,进行分析,找到其形成的根本原因,在最短的时间内制定切合实际的解决方案和对策。与此同时,计算机的网络检查工作务必要重视起来,重视确保计算机正常运作及其综合性能良好发挥的关键所在,尽可能的第一时间快递、有效的解决故障问题。发现计算机网络故障到分析研究到制定解决方案再到具体落实,这一系列的过程要做好记录工作,可以从中总结经验,吸取教训,为之后遇到类似计算机网络故障的时候可以提供数据支撑和参考依据。
网络故障处理方案范文3
1系统化排错策略
网络故障排除是一门综合性技术,涉及到网络技术的方方面面,所以当听到“网络瘫痪了”,对于网络管理员来说,首先应该是镇定,其次开始第一步,分析网络故障时,首先要清楚故障现象,应该详细说明故障的现象和潜在的原因,然后确定造成这种故障现象的原因的类型。例如,主机不响应客户请求服务。可能的故障原因是主机配置问题、接口卡故障或路由器配置命令丢失等。论文百事通第二步,收集需要用于帮助隔离可能故障原因的信息,如向用户、网络管理员、管理者和其他关键人物提一些和故障有关的问题。广泛的从网络管理系统、协议分析跟踪、路由器诊断命令的输出报告或软件说明书中收集有用的信息。第三步,根据收集到的情况考虑可能的故障原因。可以根据有关情况排除某些故障原因。例如,根据某些资料可以排除硬件故障,把注意力放软件原因上。对于任何机会都应该设法减少可能的故障原因,以至于尽快的策划出有效的故障诊断计划。第四步,根据最后的可能的故障原因,建立一个诊断计划,开始仅用一个最可能的故障原因进行诊断活动,这样可以容易恢复到故障的原始状态。如果一次同时考虑一个以上的故障原因,试图返回故障原始状态就困难的多了。第五步,执行诊断计划,认真做好每一步测试和观察,直到故障症状消失。第六步,每改变一个参数都要确认其结果。分析结果确定问题是否解决,如果没有解决,继续下去,直到解决。网络故障的发生时很常见的事情,而对于网络管理员来说,就是去解决这种网络故障,恢复网络运行,改善和优化网络的性能。因此部署一种能够排除不同可能性并一步一步朝网络问题的真实原因前进的技术方案是非常关键的步骤,一个较好的故障排查方案图如下:
2分层排错
网络的故障到底出在什么地方?这对于很多初级网络管理者来说是一件麻烦的事情,但是对于网络来说,为了降低设计的复杂性,增强通用性和兼容性,计算机网络都设计成层次结构。这种分层体系使多种不同硬件系统和软件系统能够方便地连接到网络。管理员在分析和排查网络故障时,应充分利用网络这种分层的特点,即根据OSI七层结构的定义和功能逐一的分析和排查这是最好最快的方法。OSI的层次结构为管理员分析和排查故障提供了非常好的组织方式,由于各层相对独立,按层排查能够有效地发现和隔离故障,因而一般使用逐层分析和排查的方法。在应用分层思想的可以有不同的思路,可以采用自下而上的方法,也可以采用自上而下的方法,自下而上是指从物理层开始检查直到应用层;自上而下是指从应用协议中捕捉数据,分析数组统计数据和流量统计信息以获得有价值的信息。OSI把网络分成了七层,从下至上(1层到7层)分别为物理层、数据链路层、网络层、传输层、会话层、表示层、应用层,这七层模型描述了信息如何通过网络介质从一台计算机的软件应用传输给另一台计算机的软件应用,这七个层次相对独立,完成相应的网络功能。OSI的上层(5至7层)处理应用问题,并且通常只实现在软件中。应用层最靠近终端用户。OSI的下层(1至4层)处理数据传输问题。物理层和数据链路层实现在硬件和软件中。网络层和传输层一般只实现在软件中。①在查看物理层时,此时应该做的第一件事情就是检查网络线路。计算机后面的网卡绿色指示灯是否亮?很多情况下,你会发现这仅仅是线路存在问题。你可能也遇到过比较罕见的情况,由于线路接口比较松,加上用户的经验不足,所以看上去是插着的,但实际上并没有接触。因此应注意连接电缆是否正确,Modem、CSU/DSU等设备的配置及操作是否正确,确定路由器、交换机、防火墙等设备接口是否完好的主要通过showinterface命令,检查每个端口是否UP,查看传输模式、传输速度、协议建立状态等。②在确保物理层完好的情况下,应特别注意数据链路层,因为所有网络层及网络层以上的应用都建立在数据链路层的正常工作。数据链路层主要关注于相连设备的互连参数,比如封装协议、信令格式等。③网络层是计算机通信的关键层,因此网络层检查时要注意利用Ping命令和Traceroute命令检查网络的连通性。网络层提供建立、保持和释放网络层连接的手段,包括路由选择、流量控制、传输确认、中断、差错及故障恢复等。排除网络层故障的基本方法是:沿着从源到目标的路径,查看路由器路由表,同时检查路由器接口的IP地址。如果路由没有在路由表中出现,应该通过检查来确定是否已经输入适当的静态路由、默认路由或者动态路由。然后手工配置一些丢失的路由,或者排除一些动态路由选择过程的故障,包括RIP或者IGRP路由协议出现的故障。④在协议层的高层涉及到协议故障比较多,故障处理起来越来越困难,因此管理员需要懂得协议之间如何工作。首先管理员应清楚有那些程序可用,可以利用Telnet终端模拟应用程序,它可以提供对大型主机、UNIX系统、路由器、交换机等的应用程序和相关配置的命令行访问方式。同时可以使用端口扫描器判断哪些端口正在使用,以及借助协议分析仪(如微软提供的网络监视器)捕捉相应的RIP信息和UDP报头,大多数传输层错误主要表现在ACL和NAT上面。另外日志对于网络安全来说非常重要,记录了系统每天发生的各种各样的事情,你可以通过日志来检查错误发生的原因,或者受到攻击时攻击者留下的痕迹。路由器的一些重要信息可以通过syslog机制在内部网络的Unix主机上作日志。在路由器运行过程中,路由器会向日志主机发送包括链路建立失败信息、包过滤信息等等日志信息,通过登录到日志主机,网络管理员可以了解日志事件,对日志文件进行分析,可以帮助管理员进行故障定位、故障排除和网络安全管理。当网络故障排除后,管理员应及时做好记录,以便日后查看和使用。⑤而对于应用层来说,可以使用程序本身进行调试和排错。
网络故障处理方案范文4
【关键词】网络维护网络故障;解决办法;技术;效率
1.计算机网络维护主要包括以下几个方面
首先,对硬件的维护。确定联网计算机硬件能够达到联网的基本要求要定时检测联网电脑网卡、网线、集线器、交换机、路由器等故障、计算机硬盘、内存、显示器等是否能够正常运行,对临近损坏的计算机硬件要及时进行更换。同时要查看网卡是否进行了正确的安装与配置以及计算机配置的硬件是否与上网软件发生冲突而导致不能正常联网。
其次,对软件的维护。软件维护是计算机网络维护的主要方面,具体来说主要包括:第一,计算机网络设置的检查。第二,对集线器、交换器和路由器等网络设备的检查。第三,对网络安全性的检测。第四,网络通畅性检测。
2.常见计算机网络故障分类及处理方法
2.1故障分类
根据网络故障的性质可把网络故障分为物理故障与逻辑故障,也可以根据网络故障的对象把网络故障分为线路故障、路由故障和主机故障。
2.1.1按照网络故障的不同性质划分
(1)物理故障。
物理故障指的是设备或线路损坏、插头松动、线路受到严重电磁干扰等情况。
(2)逻辑故障。
逻辑故障中最常见的情况就是配置错误,就是指因为网络设备的设置原因而导致的网络异常故障。配置错误可能是路由器端口参数设定有误,或路由器路由配置错误以导致路由循环或找不到远端地址,或者是掩码设置错误等。
2.1.2根据故障的不同对象划分
(1)线路故障。
线路故障最常见的情况就是线路不通,诊断这种情况首先检查该线路上流量是否还存在,然后用ping检查线路远端的路由器端口能否响应,用traceroute检查路由器配置是否正确,找出问题逐个加以解决。
(2)路由器故障。
事实上,线路故障中很多情况都涉及路由器,因此也可以把一些线路故障归结为路由器故障。
(3)主机故障。
主机故障常见的现象就是主机的配置不当,象主机配置的IP地址与其它主机冲突,或IP地址根本就不在子网范围内,由此导致主机无法连通。
2.2 网络故障处理步骤
在着手处理故障之前,最好先准备笔和记事本,然后,将故障现象认真仔细记录下来。在观察和记录时一定要注意细节,解决大型网络故障也是如此,因为有时正是一些最小的细节会使整个解决过程变得明朗化。
2.2.1 故障处理过程
(1)识别故障现象。
识别故障现象时,应该询问:当被记录的故障现象发生时,正在运行什么进程。这个进程以前运行过没有?以前这个进程的运行是不是可以成功?这个进程最后一次成功运行是什么时候?从最后一次成功运行起,哪些进程发生了改变?
(2)对故障现象进行描述。
当处理其他人报告的问题时,对故障现象的详细描述显得尤为重要。如果仅凭一面之词,有时还很难下结论,这就需要你亲自操作一下刚才出错的程序,并注意出错信息。
(3)列举可能导致错误的原因。
应当考虑导致无法查看信息的原因可能有哪些,是网卡硬件故障,还是网络连接故障、网络设备(如集线器、交换机)故障,还是TCP/IP协议设置不当等。
(4)缩小搜索的范围。
对自己所有列出可能导致错误的原因进行逐一检查,不要根据一次测试,就断定某一区域的网络是运行正常还是异常。另外,也不要在自己确定了的第一个错误上就停下来,应该把自己所列出可能导致出错的原因全部检查过一遍为止。
(5)隔离查找出来的错误。
经过排查后,这时已经基本知道了故障的部位,对于电脑的错误,可以开始检查该电脑网卡是否安装好、TCP/IP协议是否安装并设置正确、Web浏览器的连接设置是否得当等等一切与已知故障现象有关的内容。然后剩下的事情就是排除故障了。
(6)分析故障。
处理完问题后,还必须搞清楚故障是如何发生的,是何原因导致了故障的发生,以后如何避免类似故障的发生。
2.2.2 故障原因
虽然故障原因多种多样、各不相同,但总体来说不外乎就是硬件和软件问题,说得确切一些,这些问题就是网络连接性问题、网络协议问题和配置文件选项问题。
(1)网络的连接性。
网络的连接性是故障发生后首先应当考虑的。连通性的问题通常涉及网卡、跳线、信息插座、网线、HUB、MODEN等设备及通信介质。
(2)配置文件和选项。
服务器、电脑都会有配置选项,配置文件及配置选项设置不当,同样会导致网络故障。如服务器权限设置不当,会导致资源无法共享的故障。电脑网卡设置不当,会导致无法连接的故障。当网络内所有服务都无法实现时,应当检查HUB。
(3)网络协议。
最后看看网络协议的配置,若没有网络协议,网络设备和电脑之间是无法通信的,是不能实现资源共享MODEN上网的。
2.3 硬件故障
硬件故障主要有网卡自身故障、网卡未正确安装、网卡故障、集线器故障等。
我们先大致从网卡外表观察一下:
(1)RJ45接头的问题。
RJ45接头容易出故障,例如,双绞线的头没顶到RJ45接头顶端,绞线未按照标准脚位压入接头,甚至接头规格不符或者是内部的绞线断了。
(2)接线故障或接触不良。
一般可观察下列几个地方:双绞线颜色和RJ-45接头的脚位是否相符;线头是否顶到RJ-45接头顶端,若没有,该线的接触会较差.需再重新压按一次;观察RJ-45侧面。金属片是否已刺入绞线之中?若没有,极可能造成线路不通;观察双绞线外皮去掉的地方,是否使用剥线工具时切断了绞线(绞线内铜导线已断,但皮未断)。
2.4软件故障
如果网卡的信号传输指示灯不亮,这一般是由网络的软件故障引起的。
(1)检查网卡设置。
普通网卡的驱动程序磁盘大多附有测试和设置网卡参数的程序。分别查验网卡设置的接头类型、IRQ、I/O端口地址等参数,若有冲突.只要重新设置,一般都能使网络恢复正常。
(2)检查网络协议。
在网络出现故障时,我们经常使用DOS命令行进行检查,交替使用ping、ipconfig、tracert、netstat等命令查找故障。
3.提高网络维护效率措施分析
(1)保存网络维护日志的良好习惯,尤其是有一些发生概率低但危害大的故障和一些概率高的故障,对每台机器都要作完备的维护文档,以有利于以后故障的排查。
(2)提高网络安全防范意识,提高口令的可靠性,并为主机加装最新的操作系统的补丁程序和防火墙、防黑客程序等来防止可能出现的漏洞。很多计算机系统常用口令来控制对系统资源的访问,这是防病毒进程中,最容易和最经济的方法之一。
(3)网络安装简单化便于网络集中管理,软件的安装和管理方式是十分关键的,它不仅关系到网络维护管理的效率和质量,而且涉及到网络的安全性。
(4)提高警觉性,设置多部防御。计算机网络是一个开放的系统,它是同时运行多程序、多数据流向和各种数据业务的服务。所以网络防毒一定要以网为本,从网络系统和角度重新设计防毒解决方案,只有这样才能有效地查杀网络上的计算机病毒。常见的防御技术有:包过滤路由器、双宿网关、过滤主机网关、过滤子网网关。 [科]
网络故障处理方案范文5
关键词:网络管理;故障定位;SNMP管理协议;事件关联策略
计算机及网络技术的飞速发展为大中型企业带来了许许多便利之处,随着大型企业开发了与之业务相对应的管理系统,越来越多的业务将通过网络的方式进行,人们的衣、食、住、行都离不开网络[1]。计算机技术的飞速发展导致基于计算机的大型企业管理系统复杂度显著上升,与之相关的计算机网络的复杂度也随之提高。越来越复杂的网络环境为计算机网络管理带来了不小的挑战,需要网络管理者在保证海量网络集群能够正常工作的基础上,通过各种手段保证在运行过程中网络故障带来的影响和损失最小化,是计算机网络故障管理面临的主要问题。到目前为止,对于复杂度较高的大型网络系统都采用集中式管理方式,该方式将信息的管理和转发过程集中至一起,然后通过主要管理者进行分发和维护,系统的性能取决于中心管理者的管理能力。集中式管理方式面对大面积的计算机集群出现问题的时候,难以进行有效的处理,系统智能度较低,且中心管理者面对的管理任务较多,对于故障的传播无能为力,对于故障发生区域的定位也较为困难。集中式中心网络管理方式存在以下两类缺陷[2]:(1)计算机网络中心管理服务器需要面对成千上万待处理数据,这些数据冗余性大,数据处理时限要求高,仅仅通过中心管理服务器难以一一完成处理。集中式处理方式对中心管理服务器的性能要求较高,若中心管理服务器发生部分故障将会对整个网络系统的故障处理过程造成全方位影响。(2)计算机网络中心管理服务器面对巨大的计算机网络数据的吞吐量,在处理过程中,根据木桶原理,网络的整体性能受限于中心服务器处理数据的能力,中心管理服务器成为了整个网络系统的瓶颈。
1.基于SNMP协议的网络故障定位
在计算机网络管理中,与故障相关的管理包括故障发现、故障诊断和故障修复三个阶段。正常的逻辑是首先寻找并定位到故障发生的地方,才能针对不同的故障来进行分析和诊断,进而根据诊断结果将故障进行修复[3]。目前,在网络故障管理的三个阶段中,故障诊断和故障修复过程都有成熟完善的算法支持,而在故障定位过程中,由于故障的发生源可能范围较广,故障发生后会随着网络系统的运行而不断发展,且随着网络系统的复杂度提高,故障的传播越来越迅速、隐蔽,对于故障定位的相关算法目前还不完善具有较大的研究空间,所以研究并改进在大型网络系统中的故障定位算法是一项有意义的工作。
1.1SNMP协议故障定位与处理模型
SNMP协议用于计算机网络管理,是TCP/IP协议簇中最常用的应用层管理协议之一。该协议通过不断发出监听包到网络系统中各个设备上,通过设备的反馈包来检测对应设备是否发生网络异常。若某些网络设备发生异常并引起故障,一般情况下,在规定时间内SNMP无法接受到该设备的反馈包,这时候该协议即可初步定为出异常发生区域,并采取相应措施。基于SNMP网络管理协议的网络管理模型以网络管理系统NMS为中心,通过NMS与其他待管理的网络元设备节点构成了整个网络系统,SNMP协议运行在NMS之上,当网络系统运行过程中,某些被管理的网络元设备发生故障时,SNMP检测到该故障并发出警告信息,警告信息通过网络传播到其他网络元设备中,经过一定的时间,SNMP将警告信息传播到整个网络中,NMS对发生故障设备进行相应的处理。通过NMS的统筹管理,将会很快的定位出网络故障的具置并进行分析和解决。
1.2SNMP协议网络故障定位算法
由于计算机网络的复杂度不断提高,网络管理系统NMS无时无刻不在接收着来自多方节点的警报和征兆,在实际网络运行过程中,网络管理系统将会面对大量的警告信息,面对如此多的冗余信息,非智能的网络管理系统将会很难通过分析找出发生故障的真正节点设备,以至于大型网络很难对故障做出有效的处理。在网络管理运行过程中,网络中心管理服务器与各个被管理网络设备元之间相互依赖且各个被管理网络设备元之间存在物理上和逻辑上的相关性,所以每当一个设备元出现故障的时候,不仅自己要发出警告,而且所有感知到该设备元出现故障的设备都会发出警告,大量冗余的警告在网络中传播最终导致一个设备元发生故障产生大量的征兆,这些征兆都是相互关联在一起的,不能只针对一个征兆进行处理。在传统的SNMP协议中,检测到的网络设备故障征兆都是被单独传送给中心管理服务器的,这使得大量冗余的征兆信息干扰对网络故障的定位。事件关联策略在此背景应运而生,建立在基于SNMP协议上的网络故障定位新算法。在网络管理中,故障指的是网络中心管理服务器接受到的一个警告。事件关联策略定义了被管理的网络设备元在语义上的相关性,对被警告事件分别在空间上和时间上进行相关处理,通过提取各个事件中的相关联部分构成单一的警报概念事件,生成的单一警报概念事件能够过滤不必要的或者无关的事件,减少传送到网络中心管理服务器的冗余信息,中心管理服务器能够更好的计算并分析出网络故障的源泉。网络管理系统NMS面对诸多的警报和征兆,为了解决警报信息量大,信息冗余程度强的方法是在SNMP协议上采用事件关联策略,通过定义事件的方式来将警报编码成事件,再通过检测事件的相关联部分,丢弃无意义的冗余信息,仅仅通过“核心部分”的警报即可定位出故障源的真正区域,并给出故障解决方案。
2.基于SNMP协议和事件关联策略的网络故障定位实例分析
2.1网络拓扑图及初始化设计
本文通过模拟网络拓扑结构以及故障发生的环境,目的是呈现一种基于网络拓扑关联的网络故障定位技术,然后通过基于SNMP协议和事件关联策略来分析网络故障定位。本文通过建立一个网络拓扑结构来进行网络故障定位技术,寻找故障发生的源点,并根据该网络拓扑结构产生相应的节点表,关系表,和关联表。为了更加形象的表示网络的拓扑结构关系,本文需要给相应的拓扑结构节点添加虚拟的IP地址和该节点的属性。这些属性对后续实验的结果有重要意义,通过对网络设备的实际意义定性分析,就能够很好的完成对网络故障源点的定位和追踪,然后进行相应的网络故障分析和维护。
2.2基于SNMP协议软件关于该案例的实验结果
本文采用在SNMP协议上运行事件关联策略来定位故障源点,该策略主要是在主控模块中进行模拟的故障定位。在进入主控模块前,该策略还有模拟的发现网络拓扑结构模块和由拓扑结构创建连接关系的模块,接下来是通过连接关系创建关联关系的模块,该模块创建的关联关系是通过关联关系算法创建的,然后进入主控模块,在主控模块里连接着模拟输入故障数据模块,故障定位模块,以及故障源展示模块和故障事例显示模块。
3.总结
本文针对大型复杂的网络中难以定位故障的问题,分析了现有SNMP管理协议的各个方面,并详细分析了基于SNMP管理协议,使用关联关系进行故障定位算法的研究。在实际试验环境中,本文通过使用基于SNMP的管理协议来进行模拟网络拓扑结构的故障定位过程,实验结果表明,使用SNMP管理协议进行的网络故障源精确度高,分析速度快,适合日渐复杂的网络系统。
作者:崔玉礼 单位:烟台职业学院
参考文献:
[1]韩莉莉.网络管理系统中数据库的设计与实现[J].无线互联科技,2014,(8):24-24.
[2]李建国.电信网络安全隐患与对策探析[J].科技视界,2014,(32):57-57,103.
网络故障处理方案范文6
关键词:TDCS;维护;故障;方案
中图分类号:U262文献标识码: A
引言
铁路列车高度指挥系统(Train operation Dispatching Command System,简称TDCS)原名为铁路运输调度指挥管理信息系统(Dispatch Management Information System,简称DMIS)。TDCS是实现铁路各级运输调度对列车运行实行透明指挥、实时调整、集中控制的现代化信息系统,是集信号、计算机、通信和网络为一体的产物。TDCS是一个覆盖全国既有线铁路的大型网络系统,由铁道部调度指挥中心、铁路局调度指挥中心、车站信息采集系统3层体系组成。随着铁路提速,行车密度不断增大,TDCS系统在生产运输中的作用越来越突出,一旦发生故障将严重干扰行车秩序,因此必须做好TDCS的日常维护工作。
1、TDCS设备的日常维护
1.1TDCS设备的维护管理可采用故障修与状态修相结合的办法,对双机热备的计算机设备实行故障修并定期进行整治;对接入设备采用故障修结合巡视来保证设备的正常使用。
1.2通过巡视各种设备的表示灯状态可以及时发现设备隐患。巡视内容可归纳为:服务器、工作站、网络设备、网络运行情况、观察UPS电源是否正常工作;检查光带、车次号、运行图等信息是否正确。
1.3定期进行数据库数据的物理备份,为保证数据库系统的正常高效运行,在历史数据已备份的前提下,应定期以自动或人工方式删除较早的数据,并进行数据的优化存储,定期测试备份数据库服务器工作状态。
1.4加强与通信工区的联系。信号人员由于所学专业不同,对通信知识知之甚少,测试和维护经验缺乏,而且使用数字通道,路由器、Modem等都可能造成通道故障。在出现故障时,要及时通知通信的专业人员协助解决现场一些实际问题。同时,定期召开一些培训和专题会议,学习专业知识和维护经验。
1.5常见故障的处理如:工作站的启动、鼠标、键盘的更换,打印机、显示器的更换,(打印机驱动安装、地址分配等调试项目应该由维护中心解决)信号工区可上报后处理,遇到疑难故障,维护中心应立即派人指导处理,信号工区配合。碰到通道故障,应积极联系通信工区,协同处理,包括现场信号工区可做一些简单的处理,如重启路由器、Modem等设备。
2、TDCS设备日常维护标准作业程序
TDCS设备日常维护标准作业程序如图1所示。
图1 TDCS设备日常维护标准作业程序
3、TDCS设备的故障处理
TDCS的故障处理也是复杂多变的,现针对现场出现的一些故障做简单的概括,并提一些建议:
3.1 网络故障
⑴检查局域网,可以使用测试仪查看电源线、网线、接头、路由器等是否正常或插接不牢固。
⑵依次检查通道、Modem、Modem转换电缆、Modem和路由器的连接电缆、路由器等硬件的状态。
⑶查看路由器、采集机、主板和采集板工作是否正常。
案例:通信故障,从站场画面观察,不能看到任何信息。
处理:用Ping命令查看路由器是否与网络连通,若判断为设备问题时检查路由器是否正常及网线插头是否松动,重启工作站后恢复。
3.2系统故障
案例:某站PC机及TDCS中心的多个工作站发现计算机病毒。TDCS中心维护机上发现IP地址为10.102.21.1的计算机,每隔2秒钟,便向中心机发送病毒。被感染的车站计算机内存显示不足,然后屏幕显示黑屏后计算机死机,重新启动后故障再次出现,致使与该站相邻车站的PC机被迫离网关机。
分析:此种现象,遭受攻击最严重的是安装Windows2000操作系统的计算机,由于使用以来从未打过系统补丁,而且均未安装防火墙和杀毒软件,日常维护基本没有开展防毒工作,因此网络根本没有抵抗病毒能力。
这类故障出现的情况很少,主要是系统遭受病毒的袭击,病毒侵袭主要通过以下途径:
⑴大部分TDCS维护人员经常使用移动硬盘或U盘维护,移动硬盘或U盘在拷贝数据和使用过程中极易感染病毒,在调试或修改程序时病毒便由此进入TDCS网络。
⑵在站机维修时, 为了便于维修, 维修人员会将站机接入互联网或其他网络中下载软件进行检修,这样也容易从其它系统传染病毒。
⑶遭受恶意攻击等其他非正常途径。
3.3 硬件故障
⑴服务器故障。由于设置了二套双机系统,所以一般不会影响行车。有报警时,维修人员很容易发现,将服务器重启或更换后即可。
⑵采集机故障。监测机监测不到数据,全站红光带或显示不正常。重新启动后如果还没有恢复正常,则很有可能是主板、采集板故障,可根据情况判断和更换出现故障的板子。
⑶Modem故障。可能是电源接触不良或短路等,这时候 Modem的电源灯是不亮的。如果电源正常,确定通道和连接网线,重启Modem,如果仍然无效,建议更换Modem。
案例:车站工作站两个显示器都没有显示。
分析:此类故障要从电源线上、观察插接是否有松动等着手处理。
处理:电务值班员检查切换开关上的转接口的接头是否脱落;车站值班员按压切换开关的切换按钮,看故障是否解决(检查电源是否都送到显示器上)。通过以上的排查,一般可以恢复正常。
4、TDCS网络安全的改进建议
4.1应定期对TDCS系统做渗透测试,滤出安全漏洞。
4.2TDCS中心应增设网络安全服务器,安装防火墙,对连接在网络中的任何一台机器,实行统一管理,工作站安装网络版杀毒软件和防火墙。
4.3完善各级TDCS维护中心、工作站、故障处理体系。TDCS中心应设专职网络安全管理人员,电务段应成立信息设备维护站,负责本段范围内信息设备安全养护和故障处理。
4.4实现专网专用,减少外界干扰。尽量避免远程登录,登陆密码过于简单应, 缺少远程登录身份验证是现有TDCS 网络中计算机的一大严重隐患。应加强管理, 使密码设置达到安全要求, 确因工作需要远程登录时, 要对登录方调试用计算机采取杀毒措施和身份验证后, 方可进入网内开展远程诊断、处理等工作。
4.5封堵车站工作站主机上的I/O接口,如光驱、软驱、USB插口等,并在主板BIOS里修改相应项屏蔽各端口,杜绝在车站工作站及网内计算机上进行与业务无关的作业内容。
4.6科学处理补丁和系统的矛盾。有些补丁可能与正在运行的操作发生冲突,影响系统的稳定工作,应安排专职技术人员,定期从指定的网站或服务器上下载防病毒升级软件和操作系统补丁,并结合年度TDCS设备集中检查指导计划开展相应的维护工作,确保各站TDCS设备正常运行。系统维护用的光盘、软盘、U盘必须专用, 需要外用的存储设备时必须在一立自治的专用查毒计算机上查杀病毒之后才可介入TDCS网络上的客户端。
4.7做好系统软件的备份,包括每个车站的系统和数据,采取光盘刻录或移动硬盘备份。
5、结束语
TDCS是我国调度指挥系统的核心,为确保行车安全和网路运行安全,TDCS必须做到自成体系、安全运行,资源共享、优势互补,以满足TDCS设备高安全、高稳定、高可靠的要求。,随着TDCS系统的不断完善,维护难度也将不断加大。只要我们认真总结经验,不断提高维护水平,就能将TDCS设备维护好、管理好。 为铁路运输生产的安全有序、高效可控提供优质服务贡献一份心意。
参考文献: