著录项信息
专利名称 | 一种减少网元上报告警数量的方法及系统 |
申请号 | CN200710163445.1 | 申请日期 | 2007-10-25 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2008-03-19 | 公开/公告号 | CN101145969 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | H04L12/24 | IPC分类号 | H;0;4;L;1;2;/;2;4;;;H;0;4;L;1;2;/;2;6;;;H;0;4;L;2;9;/;0;6查看分类表>
|
申请人 | 中兴通讯股份有限公司 | 申请人地址 | 广东省深圳市南山区高新技术产业园科技南路中兴通讯大厦法务部
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 中兴通讯股份有限公司 | 当前权利人 | 中兴通讯股份有限公司 |
发明人 | 常煜芬 |
代理机构 | 信息产业部电子专利中心 | 代理人 | 梁军 |
摘要
本发明公开了一种减少网元上报告警数量的方法及系统。所述方法首先将告警相关性规则和优先级规则配置到设备代理;设备代理按照告警相关性规则和优先级规则记录处理收到的告警信息,以过滤出最高优先级告警事件;再按照只上报最高优先级告警事件的原则处理本次告警上报。所述网络管理系统设置有设备代理层告警过滤功能使能开关,便于用户选择启用或者禁用设备代理层告警过滤功能。采用本发明方法,网络管理系统既能够把告警实时传递到用户面前,又能够防止通讯通道被堵塞,从而保证在告警大负载情况下网络管理系统的可靠性,还有助于用户从海量的告警中分辩出高优先级的和根源性的告警,方便用户及时发现和解决故障问题。
1.一种减少网元上报告警数量的方法,其特征在于,包括以下步骤:
第一步,将告警相关性规则和优先级规则配置到设备代理;
第二步,设备代理为上报告警事件的设备单板建立告警优先级链表,每个设备单板类型对应一个告警优先级链表,该链表用于按照告警优先级顺序记录当前发生在该单板类型上的所有告警信息,以过滤出最高优先级告警事件;
第三步,根据第二步过滤出的结果,设备代理按照只上报最高优先级告警事件的原则处理本次告警上报。
2.根据权利要求1所述的减少网元上报告警数量的方法,其特征在于,所述告警信息包括设备地址、设备单板类型、端口号、告警编号、告警优先级和告警产生时间。
3.根据权利要求1或2所述的减少网元上报告警数量的方法,其特征在于,所述第二步中,
设备代理收到告警信息后,首先确认告警消息类别:如果是告警产生消息,设备代理根据告警信息中的设备单板类型、端口号、告警编号信息对比告警优先级表,将告警事件插入到对应告警优先级链表的相应位置;如果是告警消失消息,设备代理从对应告警优先级链表中删除相应的告警事件,若删除的告警事件是链表上的最后一个告警事件,则同时删除该链表。
4.根据权利要求1或2所述的减少网元上报告警数量的方法,其特征在于,所述第三步中,如果设备代理收到的是告警产生消息,在经过第二步过滤之后,若相应告警优先级链表中出现了新的最高优先级告警事件,则设备代理向网络管理系统上报该告警事件,对于此前该告警优先级链表有告警事件的,同时上报原最高优先级告警隐藏;在经过第二步过滤之后,若相应告警优先级链表中最高优先级告警事件不变,则设备代理不向网络管理系统上报本次收到的告警事件;
如果设备代理收到的是告警消失消息,在经过第二步过滤之后,若消失的是最高优先级告警事件,则设备代理将该告警消失消息上报给网络管理系统,同时上报对应告警优先级链表中的当前最高优先级告警事件,除非该告警优先级链表中已不存在告警事件;在经过第二步过滤之后,若消失的不是最高优先级告警事件,则设备代理不向网络管理系统上报本次收到的告警事件。
5.根据权利要求3所述的减少网元上报告警数量的方法,其特征在于,所述第三步中,如果设备代理收到的是告警产生消息,在经过第二步过滤之后,若相应告警优先级链表中出现了新的最高优先级告警事件,则设备代理向网络管理系统上报该告警事件,对于此前该告警优先级链表有告警事件的,同时上报原最高优先级告警隐藏;在经过第二步过滤之后,若相应告警优先级链表中最高优先级告警事件不变,则设备代理不向网络管理系统上报本次收到的告警事件;
如果设备代理收到的是告警消失消息,在经过第二步过滤之后,若消失的是最高优先级告警事件,则设备代理将该告警消失消息上报给网络管理系统,同时上报对应告警优先级链表中的当前最高优先级告警事件,除非该告警优先级链表中已不存在告警事件;在经过第二步过滤之后,若消失的不是最高优先级告警事件,则设备代理不向网络管理系统上报本次收到的告警事件。
6.根据权利要求1或2所述的减少网元上报告警数量的方法,其特征在于,第一步中所述告警相关性规则和优先级规则由网络管理系统默认提供,并且网络管理系统允许用户根据实际需要编辑修改告警优先级规则。
7.根据权利要求5所述的减少网元上报告警数量的方法,其特征在于,第一步中所述告警相关性规则和优先级规则由网络管理系统默认提供,并且网络管理系统允许用户根据实际需要编辑修改告警优先级规则。
8.一种减少网元上报告警数量的系统,其特征在于,包括由客户端和网管服务器组成的网络管理单元、设备代理和设备单元,这三部分协调工作完成对设备告警的管理:
网络管理单元提供用户接口和设备配置平台,用户通过网络管理系统配置设备参数、查看设备告警和性能参数;
设备代理是网络管理单元和设备单元之间的接口,网络管理单元发送的各种命令通过设备代理转发到设备单元,除被动响应网络管理单元发送的命令之外,设备代理还主动收集其管理范围之内设备单元的性能和告警,设备代理为上报告警事件的设备单板建立告警优先级链表,每个设备单板类型对应一个告警优先级链表,该链表用于按照告警优先级顺序记录当前发生在该单板类型上的所有告警信息,以过滤出最高优先级告警事件,设备代理根据存储的告警优先级规则对上报的告警进行优先级过滤分析,仅上报高优先级告警到网管服务器;
所述网络管理系统设置有设备代理层告警过滤功能使能开关,用户通过网络管理系统的用户界面设置该使能开关,以选择启用或者禁用所述告警过滤功能。
技术领域\n本发明属于网络管理技术领域,特别涉及网络管理中的告警管理方法及系统。\n背景技术\n目前网管管理系统对设备网元的告警管理分为两个层次,从上到下依次为,网管客户端和网管服务器中间层,网管服务器和设备网元中间层。在每个层次中传送设备告警信息,客户端和网元服务器之间可以采用广播或者点到点通讯方式;网管服务器和设备网元之间可以采用告警事件驱动和定时采集两种方式。下面比较一下在这两个层面上述不同方法的优缺点:客户端和服务器采用广播形式通讯,每个客户端看到的信息在任何时刻都相同,优点是服务器不需要为每个客户端维护一个不同的设备网元告警上报文件,处理简单。缺点是每次上报给客户端的告警信息是全网设备告警的一个全集,数据量较大。客户端和服务器采用点到点通讯,每个客户看到的信息可能不同,用户可以定制自己客户端对数据进行过滤,减少客户端、服务器之间通讯量,缺点是处理复杂,针对每个客户端,服务器需要维护相关文件。\n网管服务器和设备网元之间通讯如果采用告警事件驱动方式,优点在于用户可以实时监控设备网元告警,一旦有告警事件发生,告警能立刻传送到网管服务器,再通过客户端展现给用户。缺点是通讯频繁。网管服务器和设备网元间如果采用定时采集方法,优点是只有用户需要的时候服务器才进行设备网元告警收集。缺点是用户无法实时监控设备告警,可能会贻误定位、解决告警。因此,目前网络管理系统中多使用告警事件驱动方式,实时显示设备网元告警。但是无论使用哪种方式,遇到比较棘手的问题是,一旦网络发生瘫痪,设备将上报大量的告警,这种情况会在瞬间给网管服务器造成猛烈冲击,严重的话会堵塞通讯通道,导致服务器性能急剧下降,网络管理系统失去监控作用。\n公开号为CN 1870524A的专利申请提出了一种网元告警数据获取方法,通过网管服务器每次只发送告警数量有变化的网元告警数据,达到减少告警数据在网络中的传输量、减轻网络传输负担的目的。该方案的使用范围有一定局限性。对于网络管理客户端和网络管理服务器通过网络进行通讯时有效,对于网管服务器和客户端在一个宿主机器上的情况,作用很小。而且该方案主要在客户端和服务器之间实现,并没有降低由于设备大量上报告警而带来的网络负担。\n发明内容\n本发明要解决的技术问题是针对现有设备网元产生大量告警时将导致通讯堵塞、网管服务器处理能力迅速降低的缺陷,提出一种有效减少网元上报告警数量的方法及系统。采用该方法,当发生故障时,网络管理系统既能够把告警实时传递到用户面前,又能够防止通讯通道被堵塞,从而保证在告警大负载情况下网络管理系统的可靠性。\n为解决上述技术问题,本发明提出的减少网元上报告警数量的方法是这样的:\n第一步,将告警相关性规则和优先级规则配置到设备代理(Agent);\n第二步,设备代理为上报告警事件的设备单板建立告警优先级链表,每个设备单板类型对应一个告警优先级链表,该链表用于按照告警优先级顺序记录当前发生在该单板类型上的所有告警信息,以过滤出最高优先级告警事件;\n第三步,根据第二步过滤出的结果,设备代理按照只上报最高优先级告警事件的原则处理本次告警上报。\n上述第一步中所述告警相关性规则和优先级规则由网络管理系统默认提供,并且网络管理系统允许用户根据实际需要编辑修改告警优先级规则。告警优先级规则用于定义各告警之间优先级的高低关系,用户可以通过告警优先级来描述告警严重性,也可以使用优先级描述告警之间的因果关系,原因告警优先级比结果告警优先级高。\n本发明方法中的所述告警信息包括设备地址、设备单板类型、端口号、告警编号、告警优先级和告警产生时间等必要信息,还可以包括超限性能分类、超限性能号和超限性能值等信息。\n上述第二步中,设备代理收到告警信息后,根据告警消息类别进行相应处理:如果是告警产生消息,设备代理根据告警信息中的设备单板类型、端口号、告警编号信息对比告警优先级表,将告警事件插入到对应告警优先级链表的相应位置;如果是告警消失消息,设备代理从对应告警优先级链表中删除相应的告警事件,若删除的告警事件是链表上的最后一个告警事件,则同时删除该链表。\n上述第三步中,如果设备代理收到的是告警产生消息,在经过第二步过滤之后,若相应告警优先级链表中出现了新的最高优先级告警事件,则设备代理向网络管理系统上报该告警事件,对于此前该告警优先级链表有告警事件的,同时上报原最高优先级告警隐藏;在经过第二步过滤之后,若相应告警优先级链表中最高优先级告警事件不变,则设备代理不向网络管理系统上报本次收到的告警事件。如果设备代理收到的是告警消失消息,在经过第二步过滤之后,若消失的是最高优先级告警事件,则设备代理将该告警消失消息上报给网络管理系统,同时上报对应告警优先级链表中的当前最高优先级告警事件,除非该告警优先级链表中已不存在告警事件;在经过第二步过滤之后,若消失的不是最高优先级告警事件,则设备代理不向网络管理系统上报本次收到的告警事件。\n采用本发明方法的网络管理系统包括由客户端和网管服务器组成的网络管理单元、设备代理(Agent)和设备单元,这三部分协调工作完成对设备告警的管理。网络管理单元提供用户接口和设备配置平台,用户通过网络管理系统配置设备参数、查看设备告警和性能参数;设备代理是网络管理单元和设备单元之间的接口,网络管理单元发送的各种命令通过设备代理转发到设备单元,除被动响应网络管理单元发送的命令之外,设备代理还主动收集其管理范围之内设备单元的性能和告警,设备代理根据存储的告警优先级规则对上报的告警进行优先级过滤分析,仅上报高优先级告警到网管服务器。\n上述网络管理系统还可以设置一个设备代理层告警过滤功能使能开关,用户通过网络管理系统的用户界面设置该使能开关,以选择启用或者禁用设备代理层告警过滤功能。\n采用本发明所述方法上报告警,与现有技术相比,由于采用了在设备代理层过滤出高优先级告警的技术,大大减少了设备和网络管理系统之间的告警通讯量,既能够把告警实时传递到用户面前,又能够防止通讯通道被堵塞,从而保证在告警大负载情况下网络管理系统的可靠性。本发明不仅减少了告警通讯量,还有助于用户从海量的告警中分辩出高优先级的和根源性的告警,方便用户及时发现和解决故障问题。采用本发明方法的网络管理系统,设备代理层设置的告警过滤功能使能开关,可以方便用户在网络管理系统上选择启动或者禁止该功能。\n附图说明\n图1是基于本发明的网络管理体系结构示意图;\n图2是基于本发明的告警上报过程示意图;\n图3是基于本发明的告警优先级过滤过程示意图。\n具体实施方式\n下面结合附图与具体实施方式对本发明作进一步详细说明。\n图1是基于本发明的网络管理体系结构示意图。如图所示,网络管理系统被分为四层:最上面一次是客户层,提供用户可视化的操作界面;第二层是设备管理层,用来采集各种设备代理(Agent)上报的管理信息,如设备性能、告警等信息,同时为客户端和代理层提供命令转发;第三层是设备代理层,一个设备代理对应一个网元对象,设备代理负责本网元上管理信息收集,同时为设备层(MCU)和管理者层提供命令转发。一个设备代理管理多个设备单元,设备代理上有数据库用于存放本网元管理信息。设备代理和管理者(SMGR和MGR)通过TCP/IP通讯。因此,在工程应用中将有大量数据在这两层之间进行传递。本发明所提出的方法就是在设备代理层实现的。\n图2是基于本发明的告警上报过程示意图。如图所示,首先用户把告警的优先级规则以及告警相关性规则下发到设备代理,以数据库方式保存,供设备代理过滤告警用。当发生告警上报事件时,所有告警实时上报到设备代理,设备代理记录所有告警,按照告警信息中的“设备单板”形成告警优先级链表,该链表按照告警优先级顺序记录了当前所有发生在该单板上的告警,如果当前有N个设备单板上报了告警信息,则形成N条告警优先级链表。设备代理对上报的告警事件进行分类分析,根据存储的优先级规则更新告警优先级链表,同时过滤出高优先级告警上报到管理者MGR。\n告警优先级规则可以由网络管理系统默认提供,也可以由用户根据实际需要进行自定义编辑修改。告警优先级规则以设备单板类型、告警端口为组,在组范围内,高优先级的告警比低优先级告警紧急程度高,在有高优先级告警存在的情况下,低优先级告警不再上报。\n设备上报的告警信息包括设备地址、设备单板类型、端口号、告警编号、告警优先级、告警产生时间、超限性能分类、超限性能号和超限的性能值等,告警信息格式举例如下:\n 告警信息项 字节数 设备地址 4\n 告警信息项 字节数 设备单板类型 2 端口号 2 告警编号 2 告警等级 2 告警产生时间 4 超限性能分类 2 超限性能号 2 超限的性能值 4\n图3是基于本发明的告警优先级过滤过程示意图。如图所示,本发明方法中设备代理过滤高优先级告警的流程如下:\n(1)设备代理确认收到的告警消息类别,是告警产生消息还是告警消失消息;\n(2)如果是告警产生消息,则根据上报的告警的单板信息查找对应的告警优先级链表并进行相应处理:如果原来不存在告警优先级链表,说明该告警是这个单板上的唯一告警,则建立告警优先级链表并上报告警;如果找到告警优先级链表,根据告警优先级规则,把该告警放在告警优先级链表的合适位置,如果该告警是最高优先级告警,则上报该告警,同时上报原最高优先级告警隐藏;\n(3)如果是告警消失消息,则找到对应的告警优先级链表,从链表中删除该告警,若消失的是最高优先级告警事件,则将该告警消失消息上报给网络管理系统,同时上报对应告警优先级链表中的当前最高优先级告警事件,除非该告警优先级链表中已不存在告警事件;若消失的不是最高优先级告警事件,则设备代理不向网络管理系统上报本次收到的告警事件。\n下面以光通信波分复用WDM(Wavelength Division Multiplexing)系统中单板可能产生的告警为例,说明告警经过本发明方法过滤后的结果。\n\n表中优先级从5至1依次降低。假设告警上报的顺序为:\n告警1-OUT-MZ调制器偏置电压越限告警 产生;\n告警2-OA-输入无光告警 产生;\n告警3-OTU-激光器寿命终了告警 产生;\n告警4-OA-激光器温度越限 产生;\n告警3-OTU-激光器寿命终了告警 消失。\n本发明告警过滤过程如下:\n(1)告警1产生,形成OTU单板的告警优先级链表;\n目前上报的告警:告警1;\n本次上报事件:告警1 产生\n(2)告警2产生,形成OA单板的告警优先级链表;\n目前上报的告警:告警1、告警2;\n本次上报事件:告警2产生\n(3)告警3产生,查阅告警优先级规则可知该告警优先级高,因此上报告警3,并上报告警1隐藏;\n告警链:OTU链 告警3-告警1;\n OA链 告警2\n目前上报的告警:告警3、告警2\n本次上报事件:告警3产生,告警1隐藏;\n(4)告警4产生,该告警优先级低,直接加入告警优先级链表;\n告警链:OTU链 告警3-告警1;\n OA链 告警2-告警4;\n当前上报的告警:告警3、告警2;\n无上报事件;\n(5)告警3消失,该优先级高,告警从告警优先级链表上删除。\n告警链:OTU链 告警1;\n OA链 告警2-告警4;\n目前上报的告警:告警1,告警2\n本次上报事件:告警3消失,告警1产生\n采用本发明方法的网络管理系统包括由客户端和网管服务器组成的网络管理单元、设备代理(Agent)和设备单元,这三部分协调工作完成对设备告警的管理。网络管理单元提供用户接口和设备配置平台,用户通过网络管理系统配置设备参数、查看设备告警和性能参数;设备代理是网络管理单元和设备单元之间的接口,网络管理单元发送的各种命令通过设备代理转发到设备单元,除被动响应网络管理单元发送的命令之外,设备代理还主动收集其管理范围之内设备单元的性能和告警,设备代理根据存储的告警优先级规则对上报的告警进行优先级过滤分析,仅上报高优先级告警到网管服务器。该网络管理系统还设置有一个设备代理层告警过滤功能使能开关,用户通过网络管理系统的用户界面设置该使能开关,以选择启用或者禁用设备代理层告警过滤功能。告警过滤使能设置报文定义举例如下:\n以4字节描述网元ID,以2字节描述使能设置开关:0表示禁止;1表示使能。
法律信息
- 2018-10-16
未缴年费专利权终止
IPC(主分类): H04L 12/24
专利号: ZL 200710163445.1
申请日: 2007.10.25
授权公告日: 2010.06.02
- 2010-06-02
- 2008-05-14
- 2008-03-19
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2006-11-08
|
2006-03-08
| | |
2
| |
2006-10-25
|
2006-05-29
| | |
3
| |
2004-08-25
|
2003-09-05
| | |
4
| |
2005-07-06
|
2003-12-30
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |