著录项信息
专利名称 | 一种网络管理系统和网元管理系统之间的告警计数过滤方法 |
申请号 | CN200610086646.1 | 申请日期 | 2006-06-27 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2008-01-02 | 公开/公告号 | CN101098349 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | H04L29/14 | IPC分类号 | H04L29/14;H04L12/24;H04L12/26查看分类表>
|
申请人 | 中兴通讯股份有限公司 | 申请人地址 | 广东省深圳市南山区高新技术产业园科技南路中兴通讯大厦6层***
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 中兴通讯股份有限公司 | 当前权利人 | 中兴通讯股份有限公司 |
发明人 | 张凯;黄树强 |
代理机构 | 暂无 | 代理人 | 暂无 |
摘要
本发明公开了一种网络管理系统和网元管理系统之间的告警计数过滤方法,通过设定一个滑动时间窗,时间窗在时间轴上向后滑动,每次收到最新的重复告警进行判定时,统计在当前滑动窗口里的重复告警的总数,将其作为重复告警计数器的当前数值,重复告警计数器的数值随着滑动时间窗的不断滑动而增加或者减小,不存在被定时清零的情况,不会发生任何遗漏告警的错误情况,可以有效地进行重复告警的过滤,同时还降低了NMS和EMS之间的北向接口负荷,避免其它有用的告警信息被大量重复告警所淹没,便于操作管理人员迅速定位和排除故障。
1.一种网络管理系统和网元管理系统之间的告警计数过滤方法,其特征在于,包括以下处理步骤:
第一步,设置一个滑动时间窗长度,确定告警计数过滤的阈值条件;该时间窗的窗口时间长度应不小于告警计数过滤阈值对应的时间长度;
步骤二,滑动时间窗在时间轴上向后滑动,每次收到一个最新告警时,从当前收到的最新告警时刻起,在时间轴上往时间轴的反方向遍历时间窗长度个单位时间长度作为当前滑动窗口的范围,统计在当前窗口里的重复告警的总数,如果重复告警的数量大于等于告警计数过滤的阈值条件,网元管理系统就通过北向接口向网络管理系统上报该时刻收到的最新告警;否则,网元管理系统过滤该告警信息。
2.如权利要求1所述的告警计数过滤方法,其特征在于,步骤二中计算的重复告警的总数存储在重复告警计数器中,所述计数器随着滑动时间窗的变化动态存储窗口内的重复告警总数。
3.如权利要求1或2所述的告警计数过滤方法,其特征在于,所述告警信息包括:告警设备位置、告警类型、告警级别、告警可能原因。
4.如权利要求1或2所述的告警计数过滤方法,其特征在于,当网元管理系统需要向网络管理系统发送告警清除消息时:
如果该告警清除消息对应的告警消息被网元管理系统过滤掉,则该告警清除消息也被网元管理系统过滤;
如果该告警清除消息对应的告警消息被网元管理系统通过北向接口上报,则该告警清除消息也被网元管理系统通过北向接口上报。
一种网络管理系统和网元管理系统之间的告警计数过滤方
法
技术领域
[0001] 本发明涉及移动通信领域,具体涉及网络管理系统与网元管理系统之间告警信息的计数过滤方法。
背景技术
[0002] 网络管理系统(NMS,即Network Management System)与网元管理系统(EMS,即Element Management System)之间的接口称为北向接口(Itf-N,即Interface-N)。EMS主要完成ITU TMN(即International Telecommunications UnionTelecommunication Manager Network)中的网元管理层(EML,即ElementManagement Layer)功能,即完成面向设备的操作维护功能,通常不同设备供应商的EMS无法通用。NMS主要完成ITU TMN中的网络管理层(NML,即NetworkManagement Layer)功能,提供面向网络的操作管理功能,对一个被管网络(称为子网)内的所有网元设备进行管理。对于被管网络内存在多个设备供应商设备的情况,可以通过EMS管理达到管理整个子网的目的。
[0003] 当移动通信设备发生故障时,将产生相应的告警信息,如果NMS设置了相关告警信息的上报,则当故障发生时,告警信息将由EMS通过北向接口上报到NMS,使得操作管理人员可以了解故障的发生并尽快进行故障定位和故障排除。
[0004] 告警上报功能使用了公共管理功能中的“通知管理功能”的通知上报功能。而根据目前的处理方式,当告警产生时,通过北向接口传送的告警通知消息数量很大,对北向接口造成了很大的负担,而在这些传送的告警通知消息中,有很多是重复告警。重复告警是指这样的告警,它们由同样的设备(object instance)产生,具有相同的告警类型(Alarm Type),告警级别(Perceived Severity),告警可能原因(ProbableCause)。这些重复告警含有大量的冗余信息,不但无谓的增加了北向接口的负担,还可能把其它有用的告警信息淹没,给操作管理人员迅速定位和排除故障带来了很大困难。
[0005] 为了减少接口负荷,在业界相关的北向接口标准中提出了所谓高级告警的需求,其中一个研究内容就是通过设定相应的计数过滤准则,对于在一定时间内重复告警次数小于判定阈值的重复告警进行过滤,不通过北向接口上报。然而,目前已有的一种滑动时间窗告警计数过滤的方法,由于其技术上存在一定缺陷,会导致在某些情况下,漏报本应该上报的重复告警。下面结合图1,具体说明一下这种已有方法的技术缺陷。
[0006] 图1时间轴上的0,1串表示重复告警上报的情况,1表示有告警上报,0表示没有告警上报。假设图1中的告警上报的时间粒度都是单位时间粒度,即在每一个单位时间内,要么有告警上报,要么没有告警上报。即,对于图1中的0,1串,表示在10个单位时间内,总共有7个重复告警(对应于7个1)上报。假设判定阈值设定为5个,时间窗窗口长度设定为5个单位时间。
[0007] 按照现有的滑动时间窗告警计数过滤方法,第一个滑动窗口100,即滑动窗口1,其开始时刻110就是首次收到告警的时刻。此后,滑动窗口1开始记时,重复告警计数器同时开始针对重复告警进行计数。随着时间的向后推移,当滑动窗口1在时间轴上向后(即沿时间轴的箭头方向,下文同此约定)增长达到规定的时间长度后,在图1中就是达到5个单位时间长度的120时刻,滑动窗口1结束,重复告警计数器也同时清零。由于在滑动窗口
1的窗口长度内,重复告警计数器最大只是增加到3(对应于三个1),小于设定的阈值5,因此没有任何告警通过北向接口上报。
[0008] 下一个告警的到来将触发下一个滑动时间窗150,即滑动窗口2的开始,重复告警计数器也再次重新开始针对重复告警计数。在图1中,滑动窗口2开始于时刻130,在时间轴上向后增长到规定的时间长度后,即达到5个单位时间的长度,在时刻140结束,同时重复告警计数器也再次清零。由于在滑动窗口2的窗口长度内,重复告警计数器最大只是增加到4(对应于四个1),同样小于设定的阈值5,因此也没有任何告警通过北向接口上报。
[0009] 类似的,滑动窗口不断开始、在时间轴上向后增长、结束以及重复告警计数器反复清零的过程在整个时间轴上反复进行。
[0010] 在这种现有技术方法下,存在多个不同的滑动窗口,它们在时间轴上没有任何重叠。第一个滑动窗口向后推移增长,期满后结束,重复告警计数器同时清零,然后第二个滑动窗口在新告警触发下开始,重复告警计数器重新开始计数。在每个滑动窗口的向后推移增长过程中,重复告警计数器都是单方向递增的,并且会随着滑动窗口的结束而定时清零。
正是由于这种多个滑动窗口的分段不重叠性以及重复告警计数器定时清零的技术缺陷,就会导致在某一段时间内连续的告警被分配到多个滑动窗口的情况下,由于重复告警计数器分别清零后再次计数,就有可能造成某个滑动窗口内重复告警计数器数值小于设定阈值,导致产生遗漏告警上报的情况。例如,对于图1中的连续6个告警(6个1),大于设定的阈值5,本来应该上报该告警。但是由于被分配到了滑动窗口1和滑动窗口2,结果两个滑动窗口内的重复告警计数器取值分别为3和4,结果都没有任何告警上报,这就产生了不应该的遗漏。
发明内容
[0011] 本发明解决的技术问题是提出一种网络管理系统和网元管理系统之间的告警计数过滤方法,消除告警信息的漏报并提高告警的效率。
[0012] 本发明的告警计数过滤方法实现方式如下:
[0013] 第一步,设置一个滑动时间窗长度,确定告警计数过滤的阈值条件;该时间窗的窗口时间长度应不小于告警计数过滤阈值对应的时间长度;
[0014] 步骤二,滑动时间窗在时间轴上向后滑动,每次收到一个最新告警时,从当前收到的最新告警时刻起,在时间轴上往时间轴的反方向遍历时间窗长度个单位时间长度作为当前滑动窗口的范围,统计在当前窗口里的重复告警的总数,如果重复告警的数量大于等于告警计数过滤的阈值条件,网元管理系统就通过北向接口向网络管理系统上报该时刻收到的最新告警;否则,网元管理系统过滤该告警信息。
[0015] 步骤二中计算的重复告警的总数可以存储在重复告警计数器中,计数器随着滑动时间窗的变化动态存储窗口内的重复告警总数。
[0016] 告警信息包括:告警设备位置、告警类型、告警级别、告警可能原因。
[0017] 当网元管理系统需要向网络管理系统发送告警清除消息时:如果该告警清除消息对应的告警消息被网元管理系统过滤掉,则该告警清除消息也被网元管理系统过滤;如果该告警清除消息对应的告警消息被网元管理系统通过北向接口上报,则该告警清除消息也被网元管理系统通过北向接口上报。
[0018] 采用本发明所述方法,与现有技术相比,由于滑动时间窗在整个时间轴上向后滑动,每次收到最新的重复告警进行判定时,都从当前的时刻起,在时间轴上向前遍历时间窗长度个单位时间长度作为当前滑动窗口的范围,统计在当前滑动窗口里的重复告警的总数,将其作为重复告警计数器的当前数值,重复告警计数器的数值随着滑动时间窗的不断滑动而增加或者减小,不存在被定时清零的情况,因此不会发生任何遗漏告警的错误情况,可以有效地进行重复告警的过滤,同时还降低了NMS和EMS之间的北向接口负荷,避免其它有用的告警信息被大量重复告警所淹没,便于操作管理人员迅速定位和排除故障。
附图说明
[0019] 图1是现有滑动时间窗告警计数过滤方法示例图;
[0020] 图2是本发明提出的告警计数过滤方法示例图;
具体实施方式
[0021] 下面通过列举一个非限制示例进行描述:
[0022] a)定义一种数据结构Filter Rule,用于表示一条告警计数过滤规则,其包含但不限于如下属性:
[0023]
属性名 数据类型 说明
RuleID integer 告警计数过滤规则ID
RuleName string 告警计数过滤规则名称
RuleDesc string 告警计数过滤的描述
SlidingWindow integer 滑动时间窗窗口的时间长
度,单位可以是分钟等时间
单位,其数值不小于判定阈
值的数值。
Threshold integer 判定阈值
FilterAlmCounter integer 重复告警计数器
属性名 数据类型 说明
FilterAlmInfo N/A 待过滤的重复告警信息,包
括但不限于:告警设备位置
(objectinstance),告警类
型(AlarmType),告警级
别(PerceivedSeverity),告
警可能原因(Probable
Cause)。
[0024] b)EMS利用告警计数过滤规则,对相关的重复告警进行计数过滤判定处理。
[0025] 下面结合附图对实施过程作进一步的详细描述,参考图2。
[0026] 1)图2时间轴上的0,1串表示重复告警上报的情况,1表示有告警上报,0表示没有告警上报。假设图2中的告警上报的时间粒度都是单位时间粒度,即在每一个单位时间内,要么有告警上报,要么没有告警上报。即,对于图2中的0,1串,表示在10个单位时间内,总共有7个重复告警(7个1)上报。假设判定阈值设定为5个,滑动时间窗窗口长度设定为5个单位时间。
[0027] 2)每次收到最新告警进行判定时,都从当前收到的最新告警时刻起,在时间轴上向前遍历时间窗长度个单位时间长度作为当前滑动窗口的范围,统计在当前滑动窗口里的重复告警的总数,将其作为重复告警计数器的当前数值。例如,在步骤210,由于这是收到的第一个告警,因此滑动时间窗里的数值为0,0,0,0,1,重复告警的总数即为1,因此重复告警计数器的数值就是1。在软件实现时,可以利用但不限于队列,链表,数组等方式来进行重复告警的统计。
[0028] 3)用重复告警计数器的当前数值和判定阈值比较。如果重复告警计数器的当前数值大于等于设定的判别阈值,EMS就通过北向接口向NMS上报该时刻收到的最新告警;否则,EMS过滤该告警。在步骤210,重复告警计数器的数值是1,小于设定的判定阈值5,因此EMS过滤该时刻收到的最新告警不上报。
[0029] 4)重复告警计数器的数值是随着滑动时间窗的不断向后滑动而进行增加或者减小的,滑动时间窗的滑动方向如图2中箭头所示,即和时间轴的箭头方向一致。
[0030] 5)步骤220,表示该时刻滑动时间窗里的取值情况,计算可得重复告警计数器的数值是3,小于设定的判定阈值5,因此EMS仍然过滤该时刻收到的最新告警不上报。
[0031] 6)步骤230,表示该时刻滑动时间窗里的取值情况,计算可得重复告警计数器的数值是5,等于设定的判定阈值5,因此EMS通过北向接口向NMS上报该时刻收到的最新告警。
[0032] 7)步骤240,表示该时刻滑动时间窗里的取值情况,计算可得重复告警计数器的数值仍然是5,等于设定的判定阈值5,因此EMS仍然通过北向接口向NMS上报该时刻收到的最新告警。对于彼此相邻的两个时刻230和240,滑动窗口的两次取值范围存在4个单位时间长度的重叠。
[0033] c)当EMS需要向NMS发送告警清除消息时:
[0034] 1)如果该告警清除消息对应的告警消息被EMS过滤掉,则该告警清除消息也被EMS过滤。
[0035] 2)如果该告警清除消息对应的告警消息被EMS通过北向接口上报,则该告警清除消息也被EMS通过北向接口上报。
[0036] 3)对于步骤230和240,由于这两个时刻收到的告警消息都经由北向接口上报,因此这两个告警对应的告警清除消息也通过北向接口上报。
[0037] 4)对于步骤210和220,由于这两个时刻收到的告警消息都被过滤,因此这两个告警对应的告警清除消息也被过滤而不通过北向接口上报。
[0038] 对于上述的示例,可以看出:在没有采用本发明方法之前,如果采用了如附图1所示的现有的告警计数过滤方法,对于图1中的连续6个告警(6个1),虽然大于设定的阈值
5,本来应该上报该告警。但是由于这种方法的技术缺陷,即滑动窗口的分段不重叠性以及重复告警计数器定时清零的技术缺陷,导致没有任何告警上报,这就产生了不应该的遗漏。
而采用本方法的一个具体示例之后,EMS正确的进行了告警计数过滤,通过北向接口向NMS上报了2个重复告警。通过合理的设置滑动时间窗的窗口长度和判定阈值,可以有效地减小EMS和NMS之间的北向接口的负载,也避免了其它有用告警信息被大量重复的告警信息所淹没。
[0039] 上述具体实施方式以较佳实施例对本发明进行了说明,但这只是为了便于理解而举的一个形象化的实例,不应被视为是对本发明范围的限制。同样,根据本发明的技术方案及其较佳实施例的描述,可以做出各种可能的等同改变或替换,而所有这些改变或替换都应属于本发明权利要求的保护范围。
法律信息
- 2010-05-12
- 2008-02-27
- 2008-01-02
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2005-06-29
|
2004-12-21
| | |
2
| |
2003-12-17
|
2002-05-27
| | |
3
| |
1998-01-21
|
1995-12-22
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |