前言:中文期刊网精心挑选了网络运维管理方案范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
网络运维管理方案范文1
1.1总体建设目标
针对数据中心机房运维存在的潜在风险和安全隐患,为了满足数据中心机房设备的集中化管理要求,按照集中方式建设机房,即建立完备的通信机房集中管理方案,保障维护人员能够安全、可靠地登录到IT设备上进行操作。总体建设目标为:建设一套具有内容审计功能的带外管理平台,实现对服务器和网络设备进行管理维护;建设一套带内审计系统,实现对通过Telnet、SSH等网络协议登录服务器及网络设备所做操作的行为审计[2]。
1.2带外管理系统建设目标
通过建设带外管理系统,可以避免现有管理方式的不足,实现对服务器和整个网络的关键设备进行可审计的管理和维护,确保公司业务系统的稳定运行和快速排除故障。同时,对机房内所有设备的监控和操作都在操作室内进行,不允许人员随意进出机房,对机房进行完全封闭管理,减轻人员对机房环境的影响。
1.3带内审计系统建设目标
通过建设带内审计系统,可以采取实时监控审计操作行为,控制业务运行的异常风险,加强公司远程管理规范,通过对被授权人员和系统的网络行为进行记录、回放、分析,做到事后合规报告、事故追踪回放,加强内、外部网络行为监管(服务器、网络设备等),保护用户信息和数据不被泄漏和篡改,保障业务系统的正常运营,防止安全事件的发生,减少设备故障处理的时间,减轻维护压力,降低人力成本,提高工作效率,控制运维风险,提升公司安全管理水平与安全控制能力。
2系统建设技术路线
2.1带外管理系统技术路线
(1)在内蒙古电力公司数据中心机房建设一套带外管理平台,带外管理的受管设备包括路由器、交换机、防火墙及各种服务器。(2)在列头柜上可以实现对本列机柜中所有设备的本地管理。(3)维护人员在监控室内能够实现对所管理设备的监控和维护。(4)通过账号和统一界面可以实现录屏和审计功能。(5)二级单位(仅管理网络设备)共11个,进行带外设备安装,实现网络设备的远程管理。(6)数据中心安装32口KVM交换机,实现8路并发,各二级单位安装16口串换机(内置有Modem),分局安装8口串换机(内置有Modem)。(7)根据现有服务器规划新建系统所需服务器数量,在每列列头柜中安装32口KVM交换机。(8)带外管理系统单独建网,不接入现有的生产网络。(9)带外管理可以连接到小型机的HMC或直接连接到小型机上,既可启动图形界面,也可启动字符界面。
2.2带内审计系统技术路线
(1)能对内蒙古电力数据中心运维人员的日常监控、维护工作和托管用户的远程操作与维护进行监管。(2)能对目前常用的远程维护访问方式(涉及Telnet/ftp/SSH/VNC/RDP)进行控制,记录并实时上报所有违规访问行为,从而实现对非授权用户的非法访问控制。(3)能对目前常用的远程维护访问方式(涉及Telnet/ftp/SSH/VNC/RDP)进行审计,记录运维人员的全部操作,可跟踪追溯,从而对内部合法运维人员实现有效监管。(4)设备部署控制方式要灵活,既可以提供模式,也可以采用旁路侦听的方式实现访问控制,从而满足不同的业务需求。(5)能迅速定位设备故障,并及时响应,可提供远程执行开启、关闭和重启操作,减轻运维人员的维护压力。(6)必须提供对运维人员的集中管理,设置访问权限与管理范围。(7)系统提供的审计信息要直观易懂,报警要及时快捷,报表数据要准确完善。(8)系统要提供自审计功能,包含所有运维管理人员的操作记录以及系统的运行日志。(9)系统网络架构简单灵活,不影响目前业务系统的正常运行,不占用网络带宽。(10)系统能够实现单点登录,运维管理人员不需要记录和查看设备密码,提升密码的安全性。
3系统整体建设方案分析
3.1带外管理系统建设方案
根据带外管理系统建设目标与技术路线,进行了带外管理系统方案设计,内蒙古电力公司带外管理系统的总体方案架构如图4所示。在数据中心服务器区部署数字KVM交换机连接小型机和PC服务器;在网络设备区部署数字串换机连接网络设备;在二级单位及所辖基层单位部署数字串换机连接网络设备;所有数字KVM交换机和数字串换机上联至网管网,由放置在数据中心机房的带外管理平台统一管理;在数据中心机房部署带外审计设备,审计用户通过带外管理平台对机房内的小型机、HMC、PC服务器和网络设备等各种类型、各种平台的硬件设备所做操作内容;在数据中心操作室部署带外管理操作终端,管理员非特殊情况均在此通过带外管理系统进行设备管理和维护[3]。
3.1.1数据中心的带外管理系统部署方案(1)在内蒙古电力公司数据中心机房部署一套带外管理平台,由2台硬件设备组成,以主备方式运行,连接至网管网。数据中心的带外管理系统部署方案如图5所示。(2)数据中心机房服务器区每列机柜内,服务器或HMC通过服务器接口转换线上联至柜顶配线架,在列头柜通过柜内配线架连接到部署在列头柜内的2台32口8路并发的数字KVM交换机,并且在列头柜内部署2套显示器套件,实现本列服务器机房内本地管理;数字KVM交换机通过网络端口上联到网管网,实现本列服务器远程管理。(3)数据中心机房网络区每列机柜内,网络设备通过串口转换线上联至柜顶配线架,在列头柜通过柜内配线架连接到部署在列头柜内的1台32口数字串换机1上,并且在列头柜内部署显示器套件,实现本列网络设备机房内本地管理;数字串换机1通过网络端口上连到网管网,实现本列网络设备远程管理。(4)在数据中心机房内部署1台具有带外管理平台审计功能模块功能的硬件设备,该审计模块审计用户通过带外管理平台对小型机、HMC、PC服务器和网络设备等各种类型、各种平台的硬件设备所做操作内容;对通过KVM交换机操作所管理的硬件设备,进行录屏;对通过串换机操作所管理的网络设备,进行字符串的记录;且具有能够基于用户名称、管理类型、访问时间等进行检索,支持关键字排序,可以根据周期性时间检索。该审核系统必须有相应的授权认证才能查看内容,能够实现与带外管理平台无缝连接,能够存储较大数据量的审计内容。(5)在数据中心操作室部署8台带外管理操作终端,并接入网管网,实现通过带外管理系统对数据中心机房内的服务器及网络设备和各二级单位及所辖基层单位机房内的部分网络设备进行远程访问、管理和维护。
3.1.2二级单位及所辖基层单位机房内的网络设备带外管理系统部署方案二级单位及所辖基层单位机房内的网络设备仅管理部分路由器、交换机和防火墙。在二级单位机房内部署具有远程拨号管理功能的16口的数字串换机2,通过串口转换线连接所管网络设备;在每个二级单位所辖基层单位的机房内部署具有远程拨号管理功能的8口的数字串换机3,通过串口转换线连接所管网络设备;所有数字串换机2和数字串换机3通过网络端口上连至网管网。数据中心机房的管理员可以通过广域网和拨号网络2条链路来管理各二级单位和基层单位的主要网络设备。具体带外管理系统部署方案如图6。当广域网链路出现中断时,通过拨号网络使用PSTN网建立拨号连接,通过128位的SSH加密通道传输字符,在保证安全前提下及时连接至远端机房的串换机,实现对被管设备的远程管理维护。
3.2带内审计系统建设方案
在内蒙古电力公司数据中心部署1台安全审计服务器,通过网络安全控制只允许其对服务器和网络设备具有Telnet、SSH等网络协议的访问权限。在特定情况下管理员需通过网络协议对服务器和网络设备进行访问时,管理员需先登录到带内审计系统,通过其使用SSH、Telnet、RDP、IE管理工具等,对所管理设备进行操作。带内审计系统记录管理员管理服务器Windows系统、Linux和UNIX等界面和管理路由器、交换机、防火墙等网络设备的字符界面的操作内容。带内审计部署方案如图7所示。带内审计系统记录所有带内的操作过程,为了符合法规章程,审计内容需离线保存。一期工程采用过渡性方案,将审计数据保存在设备本地,二期工程建设中将把审计数据备份到其他介质。
4系统应用效果
4.1带外管理系统
4.1.1提高突发故障处理能力带外管理能够使运维管理人员通过专用管理网络对机房网络设备、服务器设备、电源系统进行集中管理和远程维护。即使在数据网络发生故障或者设备宕机情况下,运维管理人员仍可通过带外网管系统到达故障设备进行远程管理和维护,提高网络系统的延续性和可用性,大大提高企业IT网络突发故障的应急处理能力[4]。
4.1.2实现运维审计功能运维管理人员通过统一的管理界面对分布式网络系统IT设备进行集中管理和维护,对全部管理维护数据进行集中记录,记录内容包括管理员身份信息、登录时间、操作内容、退出时间等。
4.1.3精细化运维管理带外管理系统具有权限分级管理、端口分组管理和设备分组管理功能,通过上述功能对运维管理人员身份、管理权限、管理范围进行严格界定,不同级别管理员登录系统后只能看到有管理权限和监控权限的设备列表,分工精细,责任明确。
4.1.4互助运维,责任明确带外管理支持多进程(6个并发)访问功能,各级别运维管理人员通过多进程访问功能实现互助式协作运维。高级别运维管理人员可以对低级别运维管理人员管理过程进行全程监控,必要时可以强制接管运维管理进程。
4.1.5支持强健的安全特性(1)带外管理系统支持128-bit、SSHv2、SSLv3数据加密技术,运维管理人员的管理控制信息都将以加密方式传送至被管理设备,确保管理数据安全。(2)带外管理系统支持LDAP、SecurID、TACACS+、NIS、Kerberos、RADIUS等身份认证系统,通过以上身份认证系统对运维管理人员的身份、管理权限、管理范围进行界定,防止未经授权用户非法访问。(3)IP地址过滤技术可自由定义允许访问或不允许访问的IP地址列表,根据访问控制IP地址列表进行过滤或拦截用户访问。
网络运维管理方案范文2
目前,在激烈的电信业市场竞争环境下,传统电信业务正步入新的融合时代。电信、信息、数字媒体、消费电子等产业将走向更全面深入的融合与互通。这就促使运营商寻求新的运营模式,力争在产业变革的潮流中取得新商业成功。
IP技术已经成为下一代电信业务的承载技术。但众所周知,IP技术融开放性与复杂性于一体。目前,在基于该技术体系的新运营模式下的运维管理领域,普遍存在以下三方面的问题:
第一,多业务承载涉及网络环节增多,网络的高度灵活,路由自动计算,故障很难人工发现,从而导致故障定位效率低下,进而用户满意度持续降低;第二,对于共享式网络,难于获取实时精确的网络与业务性能数据,无法掌握网络性能KPI指标与业务的性能瓶颈,只有通过用户感受才能知道,以至于用户黏度持续降低;第三,缺乏科学实际的网络规划方法与工具,无法支撑构建科学的网络,难以保证网络与业务的健壮性。
因此,必须有“医护专家”式的运维管理解决方案解决上述问题,从而达到“精准诊断、高效治疗、提前预防”的良性循环。华为从以下三个方面提供高效、整合的解决方案服务于运营商的成功转型。
快速故障诊断提升用户满意度
华为医护专家解决方案通过业务层与网络层的联动实现了高度智能化与自动化的独特解决方案,从而实现快速故障定位,提高运维效率。具有华为特色的逐跳式端到端故障定位、逐层式联动故障定位形成矩阵化的故障定位模型,将业务与网络进行精准联动,提高了故障定位的准确性与效率。
逐跳式端到端故障定位是通过从网络的接入到汇聚再到核心的端到端逐点跟踪定位技术实现故障位置的精确定位,可定位到具体设备或路径。
逐层式联动故障定位是通过丰富的OAM工具实现从接口、路径、管道、业务到应用的逐层联动诊断,精确判定IP语音、视频、数据等业务故障点,定位故障位置;再结合丰富的专家经验库,实现精准自动化的故障诊断,给出故障原因、危害等级与恢复措施。
在部署方面,提供内置软件探针和附加硬件探针两种更加灵活的部署形式。内置软件探针在成本方面有显著优势,而华为率先提出的附加硬件探针方案在多厂商设备复杂组网情况下具备领先优势。
这样就形成了矩阵式、灵活、全方位的故障诊断解决方案,通过该解决方案,一方面将运营商从枯燥繁重的故障诊断工作中解脱出来;另一方面快速与准确的故障定位,帮助运营商保证业务质量,提升用户满意度。
实时性能管理防患于未然
直观、层次化的性能数据统计与分析协助运营商对当前的业务与网络进行精确的评估,并为未来的业务与网络规划提供决策支持。华为医护专家解决方案提供网络、业务与用户的全方位实时监控,可以提前感知、发现网络的运行隐患,把脉网络运营状况,防患于未然:
首先,华为医护专家解决方案通过对网络与业务的实时性能KPI指标(网络时延、抖动、丢包、连通性)数据的挖掘分析,适时调整相关网络与业务的配置参数,改善其KPI指标,从而便捷地向用户提供满足特殊需要、差异化的服务;
其次,华为医护专家解决方案提供了完善的SLA管理,使得运营商可以根据不同的用户类型、业务类型设定层次化的服务质量保证策略,实时监控网络与业务KPI指标同设定指标的对比差异,第一时间发现用户应用体验质量的下降,发出SLA质量劣化预警,及时采取质量恢复措施并安抚客户,从而协助运营商加固客户关系,提升用户体验与忠诚度;
再次,借助网络与业务的历史性能趋势分析,提前感知网络与业务性能瓶颈,精确定位导致瓶颈的相关因素,及时制定预防措施(如升级、扩容规划等),防止重大故障的发生。
科学网络规划增强网络健壮性
人们在面对疾病时,不仅仅需要一剂良药,还需要一个完善的医护建议。同样,面对网络与业务的高效运维要求,运营商不再仅仅需要一个软件产品,还需要一个完善的解决方案,涵盖规划、仿真、实施、维护的全生命周期;并且运营商不仅关注具体的网络管理内容,而且更加关注面向生命周期和业务应用场景的管理模式。比如运营商在关注网络拓扑结构的同时,对业务是如何快速高效地在该网络环境下进行发放、运行与维护给予的关注也越来越多。
华为医护专家解决方案通过与业界领先的网络规划专家WANDL的深度合作,提供全面整合、面向全生命周期的网络规划解决方案,从网络前期的规划到后面的部署,帮助运营商构建科学的网络,增强网络健壮性,使得网络的效率和效益达到最高。
网络运维管理方案范文3
管道:如何赚数据的钱
3G给运营商带来了很多新问题,首当其冲的便是如何让现有的管道资源满足用户的需要,并且赚到钱。但是,过去基于语音业务模式的资源分配原则正在面临数据业务带来的严峻挑战。据预测,移动宽带的流量在未来十个月到一年的时间里有可能增加一倍。随着移动宽带流量的快速增长,运营商网络的成本正在逐渐增加。目前3G还没有为运营商带来实际的收益,除了收取基本的移动宽带接入费之外,三大运营商当前均没能通过传送大量的数据而获得额外的收入。
几年前,爱立信就抛出了“智能管道”的概念。但今年,运营商用户对“智能管道”的热情显然远高于以往。
爱立信智能管道方案部经理李明告诉记者:“一个普通的iPhone现在只要到苹果应用商店里下载一个客户端,终端的持有者就能开始使用应用。然而,下载这样一个应用却会占用大量的运营商管道资源。如今,苹果和谷歌的用户在大量使用移动数据业务,互联网搜索引擎也总在使用运营商的网络,但是在管道资源被大量占用的同时,很多运营商却没能收到相应的服务费。当各种关于应用的创新由互联网应用提供商和终端设备供应商主导后,今天提供互联网访问管道的运营商却被排挤在整个产业价值链之外。”
据预测,移动宽带的流量在未来十个月到一年的时间里有可能增加一倍。随着移动宽带流量的快速增长,运营商网络的成本正在逐渐增加。李明指出,对于数据业务,运营商当前的定价模式必须进行调整。国外的很多运营商也曾经历过相同的问题,但是现在他们都从“智能管道”中找到了答案。
智能管道的价值在于能够帮助运营商从管道管理和管道运营中开发出更丰厚的业务价值。
“借助智能管道,运营商可以为不同的用户和应用提供差异化的通道,并由此提供差异化的服务,最终为传统的内容集成商提供价值,为终端用户提供价值。”在李明看来,智能管道迟早会成为国内运营商的必然选择。
管理:网络运维如何取舍
让运营商放弃对自主网络的运维并不容易,但是爱立信如今已经让美国、英国等众多国家的电信运营商转变了传统观念,通过爱立信的外包服务来实现网络运维。而且,每年爱立信都能为这些运营商节省15%~20%的运维成本。在本届通信展上,爱立信正在向中国的运营商推介这样的服务――电信管理服务。
网络运维管理方案范文4
本次与华为的合作将帮助Versatel将这些网络集中到统一的全IP承载网上。
根据双方达成的协议,华为OpitX波分系列产品将为Versatel建设新一代高速波分链路,全网采用可调OTU;同时,华为QuidwayNetEngine系列高端路由器产品也将服务该网络,支持多业务的系列产品将有效提升网络性能,并降低网络综合成本。
据Versatel公司COO程海介绍,Versatel与华为公司早在2001年起就开始了合作,近两年华为在技术研发上的表现和在德国市场支撑体系的完善,最终让Versatel选择和华为结为战略合作伙伴关系。
迄今为止,华为已经承建了45万公里的波分网络,光网络产品全球市场份额排名第二,全球有超过47万套华为OptiX光网络产品在网稳定运行;累计70万台路由器和185万台以太网交换机设备在93个国家和地区得到广泛应用,承建了包括英国、俄罗斯在内的49个国家骨干IP网络。华为成为BT、KPN、Vodafone等全球领先运营商的合作伙伴,为其提供承载网解决方案。
爱立信家用HSPA方案亮相――2007年投放市场
通信产业报讯日前,爱立信宣布推出家用3G接入点产品,为家庭和小型办公环境提供具备全面HSPA性能的本地室内网络覆盖。HSPA可支持高达14.4Mbps的下行速率和5.8Mbps的上行速率。在安装了家用3G接入点后,终端用户在进入家门时,其移动电话或支持3G/HSPA的PC电脑即可从一般室外无线网络切换到室内无线基站。
这一新的解决方案可兼容任何WCDMA/HSPA终端设备,而且可确保安全地接入无线网络和回程链路。这意味着所有的流量都经过安全加密,并可通过SIM卡为普通手机提供的一般安全功能进行验证。SIM卡验证机制还可用来支持安全的付费方案。据悉,该家用3G接入点将于2007年起通过特定移动和固网运营商投放市场。
又讯近日,爱立信与泰国运营商AIS签署了价值1.1亿美元的合同,为其扩容覆盖曼谷的现有GSM/EDGE网络。通过此次扩容,AIS将能够扩大其网络覆盖率,并增加网络容量。
根据协议,爱立信将全权负责网络搭建,提供网络设计,部署和集成服务,其中包括核心网和无线网。同时,爱立信还将提供配件管理服务,以帮助降低AIS的运营成本。随着网络容量和覆盖率的扩大,AIS的用户将享受到出众的服务质量和网络性能。(信文)
朗讯运维支撑转型
通信产业报讯日前,朗讯科技公司参加了由中国通信企业协会通信网络运维专业委员会在北京举行的“第三届中国通信网络运维年会”。
会上,朗讯科技全球服务中国销售部副总裁刘宏和软件与软件支撑总监滕文分别作题目为“市场机遇与运维变革”和“面向新型业务的运维支撑服务”的主题演讲和专题演讲。刘宏从运营商在电信业务新形势下面临的机遇和挑战,以及网络演进带来运维变革两个方面宏观地阐述通信网络运维的未来发展趋势,并同与会来宾分享朗讯科技在管理服务、单点联系集中维保,以及运维支撑系统等方面帮助运营商成功转型的实践经验。滕文就电信转型时期运维支撑体系从“垂直型”网管向“融合型”网管转变进行深入的分析,并详细介绍朗讯科技从设备管理、网络管理到业务管理的一整套运维支撑系统解决方案。(讯文)
西门子再获印尼3G大单
通信产业报讯西门子通信集团近日赢得了印尼第一大移动运营商Telkomsel公司的3G订单。双方签订了一个为期三年的框架协议,据此协议,西门子将为Telkomsel公司的全国大部分地区提供3G无线接入网、无线中继设备以及全套的网络部署及运营服务。该合同是西门子在该亚洲岛国赢得的第二个3G合同。Telkomsel公司的目标是在印尼全国推出3G服务。印尼正在经历着高速经济增长的东部地区将大大受益于西门子提供的移动通信高技术。
西门子以提供和安装设备以及运营3G无线接入网的方式来帮助Telkomsel这个拥有3000万用户的运营商。西门子提供的设备包括基站和无线网络控制器。为支持广域传输,西门子还将提供基于SDH和PDH标准的无线中继技术。
该订单加强了西门子在印尼乃至整个亚太地区的市场地位。它同时标志着西门子和Telkomsel自2G网络建立以来形成的长期战略合作伙伴关系在持续和发展:1993年12月,西门子和Telkomsel合作建立了印尼第一个GSM网络,1997年推出了第一个基于智能网的预付费移动通信服务。(西文)
NEC完成乌兹别克斯坦通信广播扩建
通信产业报讯近日,NEC公司宣布,依托从日本资本市场上筹措的大量日元贷款,顺利完成了乌兹别克斯坦的通信广播扩建项目二期工程,有效改善和扩展了乌兹别克斯坦的通信广播系统网络。
这个价值约100亿日元的通信广播扩建项目工程涵盖了3487千米长的光纤系统网络的铺设工程,和覆盖乌兹别克斯坦全国的41个局/89个站的电视转播网络。
又讯日前,NEC信息系统(中国)有限公司在京举行了“NEC信息系统(中国)有限公司成立10周年庆典”活动。NEC信息系统(中国)有限公司总裁木户协雅生在庆典仪式上回顾了过去10年的发展历程,并阐述了公司的主要业务以及今后发展方向。(日文)
欧洲委员会批准诺西合并
通信产业报讯日前,欧洲委员会宣布批准了计划中的诺基亚网络事业部和西门子运营商相关业务部门的合并,新公司被命名为诺基亚西门子网络。根据欧洲委员会的评估,这一合并将不会阻碍相关移动和固定电信网络和服务市场上的有效竞争。
诺基亚西门子网络侯任首席执行官白伟贤对欧洲委员会的决定表示欢迎,他认为欧洲委员会的决定对于合并交易最终获得全面的批准具有重要意义。白伟贤表示:“我们相信欧洲委员会的这一决定对于合并交易获得所有的相关批准具有里程碑式的意义。尽管合并交易在一些国家仍未公布,但根据欧洲委员会的这个决定,我们有理由对合并能够按照双方预期的时间表完成持乐观态度。”
白伟贤表示:“诺基亚西门子网络将具有规模优势并能通过提供更加丰富的产品组合应对全球竞争并为股东创造价值。我们所处的优势地位将帮助客户应对降低成本和增加收入的挑战,并把握技术融合所带来的机会。”(诺文)
摩托罗拉UMTS手机采用高通芯片
网络运维管理方案范文5
关键词:电力广域网;安全防护;技术实验
作者简介:王建宇(1974-),女,山东泰安人,泰安供电公司,高级工程师;张甫东(1972-),男,江苏邳州人,国家电网技术学院信息中心,高级实习指导教师。(山东 泰安 271000)
中图分类号:TM7 文献标识码:A 文章编号:1007-0079(2013)08-0184-02
进入“十二五”以来,国家电网公司根据自身业务的发展,作出了全面建设坚强智能电网、加快构建“三集五大”科学管理体系的决策部署。“三集五大”管理体系是以信息化为前提,推动信息化与核心业务流程、核心业务流程与核心资源的深度融合,充分发挥信息资源的价值。
电力广域网是公司“三集五大”体系建设的重要支撑和保障。目前,国家电网公司各项业务已与信息化深度融合,“三集五大”体系核心业务数据、典型业务流程、关键业务环节高度依赖于信息化在线处理。加强通信基础设施建设,加快推进电力广域网建设和覆盖,提升电力广域网可靠性,是“五大”体系尤其是“大运行”体系推广建设创造基本条件。本文对电力广域网可靠性需求进行了分析,介绍了影响网络可靠性的技术,通过对广域网建设和运维的五个方面进行探讨分析,提出了在不同层面提高电力广域网可靠性的措施。
一、网络可靠性的定义
根据国家标准GB-6583的规定,产品的可靠性是指:设备在规定的条件下、在规定的时间内完成规定功能的能力。对于网络系统的可靠性,除了耐久性外,还有容错性和可维护性方面的内容。
耐久性是指设备运行的无故障性或寿命,也称为平均无故障时间(Mean Time Between Failure,MTBF),它是描述整个系统可靠性的重要指标。对于一个网络系统来说,MTBF是指整个网络的各组件(链路、节点)不间断无故障连续运行的平均时间。
容错性也称为系统平均恢复时间(Mean Time to Repair,MTTR),是描述整个系统容错能力的指标。对于一个网络系统来说,MTTR是指当网络中的组件出现故障时,网络从故障状态恢复到正常状态所需的平均时间。
可维护性。在系统发生故障后,能够很快地定位问题并通过维护排除故障,这属于事后维护;根据系统告警提前发现问题(如CPU使用率过高,端口流量异常等),通过更换设备或调整网络结构来规避可能出现的故障,这属于预防维护。可维护性需要管理人员来实施,体现了管理的水平,也反映了系统可靠性的高低。
可描述系统可靠性的公式为:MTBF / ( MTBF + MTTR ) * 100%。从公式或以看出,提高MTBF或降低MTTR都可以提高网络可靠性。造成网络不可用的因素包括:设备软硬件故障、设备间链路故障、用户误操作、网络拥塞等。针对这些因素采取措施,使网络尽量不出故障,提高网络MTBF指标,从而提升整网的可靠性水平。
二、提高电力广域网可靠性的技术
构建具有高可靠性的广域网,是一个复杂的系统工程,一方面,广域网的建设贯穿网络规划、设计、部署实施、维护等各个阶段;另一方面,广域网要求提供设备、链路、服务、应用等各种级别的可靠性特性。
从整个网络角度看,广域网的可靠性设计在企业网络基础设施规划中占据更重要的位置。在当前应用大集中的背景下,因地域跨度大、链路质量不可控、多业务承载带来的应用复杂提升以及网络虚拟化等因素,对路由器的高可靠性提出了新的要求。比如,由于网络规模越来越大,同一个AS域里路由器设备数量越来越多,对路由的快速收敛能力要求越来越高;网络接入资源的虚拟化趋势导致可靠性设计从物理链路向虚拟化隧道转化;网络多出口导致对用户具体应用质量影响的分析与判断等等都是当前广域网可靠性规划设计的新课题。
提高广域网可靠性技术可分为以下几个层面:设备级高可靠性技术,采用全分布式架构设计、主控冗余、交换网冗余、电源风扇冗余等;链路高可靠性技术,采用链路捆绑、环网等技术;协议高可靠性技术,采用动态路由快速收敛(如快速hello,ospf的增量spf技术),快速重路由(IP/MPLS/VPN快速重路由),不间断转发(NSF/GR/NSR),快速故障检测等技术;面向应用的高可靠性技术,采用基于应用质量的链路探测技术NQA、动态负载分担等技术;机房基础设施的高可靠性保障技术;机房电气高可靠性技术(采用机房多接地措施,使用气体灭火装置,冗余专用空调系统等);一体化调度保障技术,建立多级运维监控体系,建立快速应急处理机制等;新设备、新方案的测试试验技术,在专用测试环境对新设备、新方案及优化技术进行检测和验证。
三、增强广域网可靠性的设计及应用
电力广域网承载的业务主要是生产管理大区和信息管理大区的各项应用系统业务,主要有电力调度MIS、ERP系统、办公系统、电子邮件系统、远程教学系统等,不仅承载数据业务,同时承载语音业务和视频业务。为建设具备电信级广域网,可在以下几方面采取相关技术提高网络的可靠性。
1.业务局域网层
业务局域网层一般指承载具体网络业务的局域网,可以是一个地市公司的生产调度网络,也可以是一个地市公司的信息数据网络,这个网络下联设备一般为用户电脑或专用生产数据采集终端。按照通用网络设计原则,业务局域网通常设计成多层星型结构,网络分为接入层网络,汇聚层网络和核心层网络。
在接入层网络中,由于设备直接下联网络终端,并且设备放置环境可能比较恶劣,因此需要采用以下技术提高接入可靠性。设备配备冗余电源;设备做好接地连接;设备工作电压宽泛,输入电压能够满足90V~260V,48HZ~63HZ的变化范围;国内北方地区和南方地区尽量采用宽温型号的设备;设备支持802.1X及基于端口带宽的广播风暴抑制技术,能够支持安全接入管控;设备支持链路汇聚,能够利用链路汇聚提高上行带宽。
在汇聚层网络中,设备汇集了多个接入层的各种流量,保护核心设备不受接入层的影响,该层设备承上启下,可以采用如下技术提高可靠性:设备配备双引擎、双电源,提高设备自身可靠性;将网络终端网关配置到汇聚设备上,隔离二层网络风暴,保护核心网络不受局部故障的干扰;双设备配置,为接入设备提供双归属上行链路,通过VRRP等协议实现网关的冗余备份和流量的负载分担。
核心层网络中,设备下联汇聚设备,上联安全设备,通过安全设备连接系统广域网的骨干接入路由器。核心层设备是业务局域网的数据中转核心,需要能提供快速的数据交换和极高的永续性。可以采用如下设计提高可靠性:单个设备配备双引擎,双电源,双交换网,双业务板,提高设备自身可靠性;采用双核心设备或多核心设备,提供数据链路可靠性;尽量在核心使用冗余的点到点三层互联,因为这种设计可产生最快速、最确定的收敛结果。将核心设计为只使用硬件加速业务的三层交换环境要优于二层的设计,因为在链路或节点故障时能提供更快的收敛速度,通过减少路由邻接关系和网络拓扑提高可扩展性,通过等价多路径提高带宽利用率。
2.安全防护层
安全防护层由局域网核心和广域网接入设备之间的安全防护设备组成,主要功能是提供网络行为审计,流量控制,入侵防护和网络访问控制。组成的设备一般是防火墙,上网行为审计系统,网络流量控制系统,IPS等。该层设备均为串联接入,并且会对数据包进行分析记录,可以采用如下设计提供安全防护层的可靠性:单台设备配备冗余电源提高设备自身供电可靠性;安全设备均需支持双机热备功能;IPS设备具备软硬件bypass功能,反应时间在微秒级;根据网络业务谨慎配置安全设备的策略,并进行全面测试,安全策略的设计会直接影响数据通过安全层的可靠性,因此每个安全设备的安全策略需要进行精心的设计并不断优化,达到既满足安全管理要求,又不会对网络数据产生过大的影响;安全层设备根据局域网核心和广域网接入路由器的配备设计网络拓扑,采用双机热备方式部署可大大提高安全层可靠性。
3.骨干网络层
骨干网络层包括接入路由器和核心路由器,是各类数据快速转发的核心,可以采用以下技术提高可靠性:单个设备配备双引擎,多电源风扇冗余,支持单板热插拔和热补丁技术;支持IGP快速收敛、协议GR/NSR、IP及MPLS快速重路由技术、BFD快速检测技术等;采用双平面结构、多核心的方式组网。
4.新技术和方案的测试试验
提高网络可靠性不仅要细致分析应用需求和业务模式,根据实际业务需求对影响网络可用性影响的关键节点和链路进行合理规划。而且要对关键节点和链路做充分的冗余设计并采用合适的技术手段,同时还要对即将采用的设备和方案进行测试和验证。测试和验证工作需要在一个模拟环境中进行。
以山东省电力学校信息网络技术实验室为例,该实验室建设面积200平方米,配备cisco和H3C实训设备路由器、交换机、防火墙等设备60余台。实训室能够模拟包括一个省中心,5个市公司和1个县公司的系统广域网和局域网环境。实验室配备综合配线系统,能够搭建各种网络拓扑结构。使用模拟网络环境可以进行网络规划设计的技术检测和方案验证,能够进行新设备兼容性测试。为电力广域网的设计、扩容和迁移等业务提供可靠性的检验手段,为在运网络提供可靠性技术支持。
5.一体化运维保障体系
由于电力广域网承载的业务在纵向、横向耦合程度日益加深,总部与网省之间、各个部门之间的相互联系日益增强,电力系统信息化水平已跨入大网络、大系统、大集中、高可靠性和高安全性的“三大两高”时代。
为了标准化信息运维工作,提升信息运维工作的水平,提高信息网络的可靠性,信息系统运行维护工作应坚持“运行与安全”、“建设与应用”并重的原则,通过对信息系统运行维护工作内容进行运维等级划分,确定运维等级划分原则,明确运维工作内容与工作要求,使运维工作要求与运维工作内容等级保持一致。信息运维标准化体系应包括运维体系、费用标准、工作规范、流程标准、运维规程、装备标准、管理制度和考核标准。
通过管理手段实现信息运维标准化的执行与落实,通过技术手段实现信息运维标准化的固化与优化,两者共同促进信息运维标准化的提升,保障信息网络稳定可靠运行。
四、结束语
提高电力广域网可靠性设计的内容非常多,需要从网络分层、模块化、冗余设计、设备选型、特性部署、检测试验、运维保障等多方面统一考虑。随着SG-ERP的推广应用、数据中心化处理不断的发展、云计算普及推广,业务应用会越来越丰富和规范,作为业务承载体的基础网络将被赋予更高可靠性的要求。
参考文献:
[1]于开年.山东国税系统广域网络的可靠性设计[J].济南大学学报(自然科学版),2001,15(4).
[2]刘智勇.电信级以太网的可靠性及实现[J].烽火科技报,2007,(6).
[3]杨静.田生林.贺俊杰.等.华北电力调度数据网网络设计与实施[J].电力科学与工程,2008,(1).
网络运维管理方案范文6
虽然IP技术占据了电信业务的主要业务领域,但是,IP技术也是一把双刃剑,在为电信业务带来便利的同时,该技术也极具复杂性。目前,在基于该技术体系的新运营模 式下的运维管理领域,普遍存在以下三个缺陷:
第一,发生网络故障后很难被快速定位,降低了解决故障的速率,使得在用户反映的满意程度上有很大的难度去突破常规的满意度降低局面,导致这一现象发生的主要原因是网络极具灵活性,网络环节多而且路由的自动计算;
第二,无法掌握网络性能KPI指标与业务的性能瓶颈,只有一条渠道,即是回访客户使用的感受,以至于用户黏度持续降低,导致这一现象发生的原因是由于网络模式为共享,导致得到及时精准的网络与性能数据变得十分困难;
第三,网络规划的方法和工具还不够科学,导致还没有能力构建更加科学实际的网络系统,难以保证网络与业务的健壮性。
综合以上三个方面,更加凸显了“医护专家”运维系统必要性。这样才能快速的定位故障发生在哪个环节并采取相应的措施来解决,并构建科学的网络规划,预见可能发生的故障并准备好应对措施。而华为则从下面几个方面提供了更好的运营方案促进了运营商的转型成功。
1 迅速定位网络故障并进行解决从而提高用户的满意程度
华为医护专家可以迅速定位故障地点的要点是将业务层与网络层相互联动,这种联动使得系统更加智能、科学。逐跳式端到端故障定位、逐层式联动故障定位形成了华为独有的矩阵化的故障定位模型,这种模式使得业务与网络之间可以相互精准的联动,可以更加精准快速的找到网络故障环节并进行排除,提高了运维效率。
这里讲的逐跳式端到端故障定位是指通过从网络的接入到汇聚再到核心的端到端逐点跟踪定位技术实现故障位置的精确定位,可定位到具体设备或路径。逐层式联动故障定位是通过丰富的OAM工具实现从接口、路径、管道、业务到应用的逐层联动诊断,精确判定IP语音、视频、数据等业务故障点,定位故障位置;再结合丰富的专家经验库,实现精准自动化的故障诊断,给出故障原因、危害等级与恢复措施。
部署方面,提供内置软件探针和附加硬件探针两种更加灵活的部署形式。华为不仅利用了内置软件针的成本廉价的优势,还突破常规,第一个提出在多厂商设备复杂组织网内加入附加硬件探针,使得华为在各种运营商的竞争中更具技术优势。
以上种种构建了 “矩阵式、灵活、全方位”故障诊断解决方案,该方案一方面使得运营商的故障诊断工作不再繁冗复杂而变得简易;另一方面大大提高了故障定位的速率和运营商保证业务质量,提升了用户满意度。
2 全方位实时监控预防网路隐患
众所周知,性能数据的统计与分析直接关系到对当前业务和网络的评估结果,更为层次化的数据可以为未来的业务和网络规划提供决策支持。而华为医护专家解决方案提供网络、业务与用户的全方位实时监控,可以预知网络运行中的安全隐患,防患于未然:
首先,华为医护专家通过对网络与业务的实时性能KPI指标数据的分析,适时修改参数,改善其KPI指标,从而更加便捷的满足客户需求;
其次,华为医护专家提供了完善的SLA管理,可以使运营商的服务更加多元化,实时监控网络与业务KPI指标同设定指标的对比差异,第一时间发现用户应用体验质量的下降,发出SLA质量劣化预警,及时采取质量恢复措施并安抚客户,从而帮助运营商维护与客户之间的关系;
再次,提前感知网络与业务性能瓶颈,精确定位导致瓶颈的相关因素,及时制定预防措施,防患于未然。
3 构建更为科学实际的网络规划
举个例子,通常人们生病后,医生在开具可以抵抗病人体内病毒的药剂的同时还会给予一个相应的医护建议。在这里,一套更加科学实际的网络规划便是那个“相应的医护建议”,它满足了运营商在需求软件之后的更深一步的要求,这个网络规划要涵盖仿真、实施、维护的全生命周期;要将侧重点放在面向生命周期和业务应用场景的管理模式上。
华为医护专家提供全面整合、面向全生命周期的网络规划解决方案,从网络前期的规划到后面的部署,帮助运营商构建科学的网络,增强网络健壮性,使得网络的效率和效益达到最高。
考虑到多场景的业务开发和运营支撑的网络规划才可以称其规划具有科学性。华为医护专家解决方案针对多场景的业务管理,在建设的前期进行科学的规划,可以预见并避免事故的发生,从而提高运维管理效率和运营商的核心竞争力;在网络建成后,网络优化成为首要任务,华为医护专家解决方案提供了灵活易用的网络优化工具,能够科学的分析网络业务的运行情况,利用该工具可以采集真实运营数据进行精确建模,支撑对系统参数和网络设备做出合情合理的调整,从而帮助网络运行达到最佳状态。
在各种力量的推动下,运维管理行业的前景更加趋向于层次多并且面向全生命周期的综合解决方案。华为IP网络运维医护专家可以迅速进行网络故障的定位与排除,全方位实时监控,更加科学实际的网络规划方面为运营商提供高效、整合的解决方案与服务,并已经成功协助CMCC、BT、Telefonica、SingTel、Vodafone等业界领先的运营商建立了独特的竞争优势,并将持续协助运营商在ALLIP的战略转型中取得新的商业成功。
参考文献
[1] 万彭.找准3G业务网络规划与营销的平衡点[N]. 人民邮电. 2009.