著录项信息
专利名称 | 一种网络告警的动态分析系统和方法 |
申请号 | CN200810067094.9 | 申请日期 | 2008-05-04 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2008-10-01 | 公开/公告号 | CN101277218 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | H04L12/24 | IPC分类号 | H;0;4;L;1;2;/;2;4查看分类表>
|
申请人 | 中兴通讯股份有限公司 | 申请人地址 | 广东省深圳市南山区高新技术产业园科技南路中兴通讯大厦法务部
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 中兴通讯股份有限公司 | 当前权利人 | 中兴通讯股份有限公司 |
发明人 | 石丽丽 |
代理机构 | 暂无 | 代理人 | 暂无 |
摘要
本发明公开了一种网络告警的动态分析系统,其用于动态分析告警对业务网络的影响程度,所述动态分析系统包括:所述相关业务分析器用于生成相关业务链表;所述告警频率分析器用于接收来自所述告警影响程度分析器的告警信息及用于计算告警频率的时间段,并计算当前告警发生端口上产生此类告警的告警频率;所述告警影响程度分析器用于综合当前告警的相关信息和所述告警频率计算当前告警的影响程度。与现有技术相比较,本发明的系统和方法使管理员能更直观、更快捷地发现威胁和影响网络稳健运行的关键问题,一方面保证了管理员工作的事半功倍,减少人力方面的成本,另一方面问题尽早的解决保证了网络的恢复能力和免疫能力。
一种网络告警的动态分析系统和方法\n技术领域\n[0001] 本发明涉及一种分析告警影响程度的网管系统和方法,更具体的说,是一种动态分析告警对业务网络的影响程度的系统和方法。\n背景技术\n[0002] 网络管理系统的作用是帮助网络管理人员对网络设备进行远程监控、配置、维护等一系列管理操作。假如网络中的设备出现了一个问题,监测器会即时发现并向上层网络管理系统上报告警编号和产生告警的位置及时间等信息,网络管理系统的图形操作界面对这些信息进行解析,以通俗易懂的文字描述方式告知网络管理员发生告警的原因、等级及位置等,管理员针对当前的告警,运用告警诊断规则对出现问题的设备进行维修,从而迅速解决问题,降低设备故障对网络运营的影响。\n[0003] 如果告警产生的速度小于管理人员解除告警的速度,或者说不会存在有大量告警等待管理员处理的情况,管理这样运营良好的网络,现有的技术方案是没有问题的。但是,一旦有类似告警风暴之类的大量设备问题产生时,当前会有一堆告警等待处理,而以往的网管技术只是将告警分级,各种告警的严重等级可以由管理员事先定制,上报告警后网络管理系统给出告警提示,图形界面中可以显示出告警原因、严重等级、位置等信息,一般管理员只会将当前告警按严重等级排序,先去处理严重等级高的告警。假如当前产生的都是紧急告警,不加分析的管理员还是采取盲目地来一个告警就解决一个告警的方法,必定造成管理员手忙脚乱,效率低下,使网络质量恶劣。\n[0004] 为了应对上述告警风暴之类的问题,专利公开号为CN 101018157A的中国专利申请“一种告警处理方法及告警系统”,提出了一种通过告警缓冲队列、多线程的解决方案来应对告警风暴这一种网络事故的解决方案。但是,这种解决方案仅针对告警风暴这一种网络事故,在告警风暴发生时通过增加处理线程来应对告警风暴的危机,而没有从告警相关性、告警相关业务和告警发生频率的角度综合动态地分析告警的影响程度,所以无法从根本上解决告警信息累计所带来的问题。\n[0005] 从上可见,现有技术中网络告警的处理还存在一定问题,需要进一步研发更好的解决方案。\n发明内容\n[0006] 本发明的目的在于提供一种网络告警的动态分析系统和方法,其能从告警相关性等角度综合动态地分析告警的影响程度、并帮助管理员高效地处理告警,彻底解决因告警所带来的问题。\n[0007] 为了达到以上发明目的,本发明采用以下技术方案:\n[0008] 本发明提供了一种网络告警的动态分析系统,用于动态分析告警对业务网络的影响程度,所述动态分析系统包括:用于接收上报告警信息的告警接收器;所述动态分析系统还包括:相关业务分析器、告警影响程度分析器及告警频率分析器;所述相关业务分析器用于接收来自所述告警接收器的告警信息,并生成相关业务链表,该表用于记录当前告警发生端口上通过的业务情况;所述告警频率分析器用于接收来自所述告警影响程度分析器的告警信息及用于计算告警频率的时间段,并计算当前告警发生端口上产生此类告警的告警频率,以及将该告警频率反馈至所述告警影响程度分析器;所述告警影响程度分析器用于接收所述相关业务链表及来自所述告警接收器的告警信息,并将获取的告警信息和计算得到的用于计算告警频率的时间段发送至所述告警频率分析器,以及综合当前告警的相关信息和所述告警频率计算当前告警的影响程度。\n[0009] 其中,所述告警影响程度分析器与所述告警接收器相连,所述告警影响程度分析器用于接收来自所述告警接收器的启动控制信号。\n[0010] 其中,所述业务情况包括相关业务数目、及所述相关业务链表中最早被激活业务的激活时刻。\n[0011] 其中,所述动态分析系统还包括:\n[0012] 告警相关性分析器,该分析器与所述告警接收器和告警影响程度分析器相连,所述告警相关性分析器用于接收来自所述告警接收器的告警信息,并设置当前告警的根源告警标志,以及将该根源告警标志发送至所述告警影响程度分析器。\n[0013] 其中,所述告警影响程度分析器包括:\n[0014] 信息接收单元,用于接收来自所述相关业务分析器的相关业务链表、所述告警接收器的告警信息、以及所述告警相关性分析器的根源告警标志;\n[0015] 告警信息分析单元,用于接收所述信息接收单元获得的相关业务链表和告警信息,并计算用于计算告警频率的时间段,以及将获得的告警信息和时间段发送至所述告警频率分析器;及\n[0016] 告警影响程度分析单元,用于接收来自所述告警信息分析单元的告警信息、来自所述信息接收单元的当前告警的根源告警标志、以及来自所述告警频率分析器的告警频率,并计算当前告警的影响程度。\n[0017] 本发明还提供了一种网络告警的动态分析方法,所述方法包括以下步骤:\n[0018] A、根据告警信息,获得当前告警发生的端口信息;\n[0019] B、依据所述端口信息,从业务链表中查找经过当前告警发生端口的所有业务,并将查找到的业务情况存储在相关业务链表中;\n[0020] C、计算当前告警发生端口上产生此类告警的告警频率;\n[0021] D、综合当前告警的相关信息和所述告警频率,计算当前告警的影响程度。\n[0022] 其中,所述步骤C和步骤D之间还包括以下步骤:\n[0023] C1、对当前告警进行相关性分析,并设置当前告警的根源告警标志;\n[0024] C2、依据所述根源告警标志和当前告警的严重性原始等级,计算当前告警的告警严重性扩张等级;\n[0025] 并且,所述步骤D采用以下过程计算当前告警的影响程度:\n[0026] 对告警严重性扩张等级、相关业务链表中的相关业务数、及告警频率进行加权计算,获得当前告警的影响程度。\n[0027] 其中,如果相关业务链表中记录的相关业务数为零,则所述步骤C的计算采用如下过程:\n[0028] S11、提示用户输入用于计算告警频率的时间段起始时刻,并计算所述起始时刻到当前时刻之间的时间差,将该时间差定义为用于计算告警频率的时间段;\n[0029] S12、统计所述时间段内当前告警发生端口上产生此类告警的次数;\n[0030] S13、将所述统计获得次数除以所述时间段,即获得所述告警频率。\n[0031] 其中,如果相关业务链表中记录的相关业务数不为零,则所述步骤C的计算采用如下过程:\n[0032] S21、计算所述相关业务链表中最早被激活业务的激活时刻到当前时刻的时间段,将该时间段定义为关于当前告警频率的时间段;\n[0033] S22、统计所述时间段内当前告警发生端口上产生此类告警的次数;\n[0034] S23、将所述统计获得次数除以所述时间段,即获得所述告警频率。\n[0035] 其中,所述步骤C2中告警严重性扩张等级采用如下公式计算:\n[0036] G=F×M+G0;\n[0037] 上述公式中,G表示告警严重性扩张等级,F表示根源告警标志的值,M表示原始告警严重性等级的最大值,G0表示告警严重性原始等级;\n[0038] 所述步骤D中当前告警的影响程度采用如下公式计算:\n[0039] Result=G×216+NS×28+Q;\n[0040] 上述公式中,Result表示当前告警的影响程度的值,G表示告警严重性扩张等级,NS表示所述相关业务链表中记录的相关业务数,Q表示所述告警频率。\n[0041] 结合上述技术方案可知,与现有技术相比较,本发明的系统和方法使管理员能更直观、更快捷地发现成胁和影响网络稳健运行的关键问题,一方面保证了管理员工作的事半功倍,减少人力方面的成本,另一方面问题尽早的解决保证了网络的恢复能力和免疫能力。本发明不仅可以引入影响业务范围和告警发生频率这两个因素,还可以引入是否是根源告警的因素,来综合分析判断告警的影响程度,因为这三个因素的值是根据具体时刻的网络情况动态计算出来的,所以比现有技术中使用静态的告警严重性等级来评估告警的影响程度更准确。\n附图说明\n[0042] 图1是本发明的动态分析系统的结构示意图;\n[0043] 图2是本发明告警影响程度分析器的结构示意图;\n[0044] 图3是本发明的动态分析告警对业务网络影响程度的方法流程图;\n[0045] 图4是计算告警发生频率的流程图;\n[0046] 图5是本发明的设置告警的根源告警标志位的流程图;\n[0047] 图6是本发明实施例中提示用户输入计算告警发生频率时需要的时间段的界面示意图;\n[0048] 图7是本发明实施例中用户选中单条告警点击鼠标右键弹出菜单的示意图。\n具体实施方式\n[0049] 以下结合附图详细描述本发明的技术方案。\n[0050] 如图1所示,本发明提供了一种动态分析系统,主要用于动态分析告警对业务网络的影响程度,其包括:告警接收器200、相关业务分析器210、告警频率分析器230和告警影响程度分析器220。\n[0051] 其中,告警接收器200,用于接收上报告警信息,并向其下游模块/单元传递参数,其中包括:将告警信息中告警发生端口的位置信息传入相关业务分析器210中,用以计算相关业务数参数;还将告警信息中告警严重性等级传入告警影响程度分析器220中,作为告警影响程度分析器220计算最终告警影响程度的一个参数;还可以向告警影响程度分析器220发送启动控制信号,进而使数据传输进入运行状态。可见,告警信息中应该包含:关于此告警发生端口的位置、原因以及告警严重性原始等级等信息。各种告警对应的严重性等级由管理员预先依据具体情况来设定。\n[0052] 其中,相关业务分析器210,用于接收来自告警接收器200的告警信息,并根据告警信息中告警发生端口的位置信息,统计当前告警发生端口上通过的业务情况,并生成相关业务链表,其中,业务情况包括相关业务数目、及所述相关业务链表中最早被激活业务的激活时刻息。在具体实现统计工作时,需要建立一业务数据库211,其与所述相关业务分析器210相连,主要用于存放当前建立的所有业务,并用于向相关业务分析器210提供查询、统计等数据库服务器的功能。如果告警端口是业务相关的端口,则相关业务分析器210在业务数据库210中查找经过此端口的所有业务,生成相关业务链表,并计算这些相关业务中最早被激活的业务的激活时刻,最后将这个激活时刻和相关业务链表传给告警影响程度分析器220。如果该告警发生的端口不是业务相关的端口,则设置传给告警影响程度分析器\n220的相关业务链表为空,激活时刻不传,告警影响程度分析器220最终计算告警影响程度时会提醒用户输入要分析的时间段的起始时刻。这里提到了业务相关的端口,目前业务可能经过的所有端口类型只有有限的二十几种,除此之外还有一些端口上的告警也会对业务运营有影响,如端口类型为0的单板自身上的告警,这两类端口的并集就是业务相关端口的类型范围。\n[0053] 其中,告警频率分析器230,用于接收来自告警影响程度分析器220的告警信息(其中包括:告警发生端口、位置编号及告警严重性等级信息)及用于计算告警频率的时间段(该时间段是用于计算告警频率的,可以是用户输入的或者计算获得的),然后计算此时间段内当前告警发生端口上产生此类告警的告警频率。在具体实现频率计算时,需要建立一告警数据库231,其与所述告警频率分析器230相连,用于存放历史告警数据和当前告警数据,并用于向告警频率分析器230提供查询、统计等数据库服务器的功能。当告警频率分析器230接收到告警信息时,预先将关于高警的端口位置、编号等信息存入告警数据库231中,然后在告警数据库231中统计出给定时间段内当前告警端口上发生此类告警的次数,进而计算当前告警在此段时间内发生的告警频率,并传给告警影响程度分析器220。\n[0054] 其中,告警影响程度分析器220,用于接收所述相关业务链表及来自所述告警接收器的告警信息,并将获取的告警信息和计算得到的用于计算告警频率的时间段发送至所述告警频率分析器230,以及综合当前告警的相关信息和所述告警频率计算当前告警的影响程度。如果相关业务链表不为空,且相关业务数目不为零,则根据传入的相关业务链表中记录的最早被激活业务的激活时刻和当前时刻计算告警频率的时间段;如果相关业务链表为空,则提示用户输入要分析的时间段,如图6所示界面,终止时刻默认为当前时刻,然后将告警的端口、编号等告警信息及计算告警频率的时间段信息传给告警频率分析器230。这里所说的当前告警的相关信息包括:所述相关业务链表中的相关业务数目、告警严重性等级等等,以下在方法流程的说明中还会具体描述。如图2所示,此告警影响程度分析器220还设置有一显示单元225,用于将最终计算获得的告警影响程度以图形化的形式显示给管理,同时还提供按照告警的影响程度对当前告警进行排序的功能。\n[0055] 在上述结构的基础上,如图1所示,本发明的动态分析系统还包括以下单元:\n[0056] 告警相关性分析器240,该分析器与所述告警接收器和告警影响程度分析器相连。\n告警相关性分析器240用于接收来自告警接收器200的告警信息,并根据告警信息设置当前告警的根源告警标志,以及将该根源告警标志发送至告警影响程度分析器220。在具体进行查找根源告警时,需要建立一当前告警库241,该数据库与告警相关性分析器240相连,只用于存放当前告警,并用于向告警相关性分析器240提供查询、统计等功能。告警相关性分析器240从告警接收器200接收当前告警信息,并直接输入当前告警库241中,根据现有技术分析库中告警数据的相关性,找出各种根源告警,并依据查找结果设置当前告警的根源告警标志,如果当前告警属于根源告警,则可以将其根源告警标志的值标记为1,否则,标记为0,并将此标志的值传递给告警影响程度分析器220。\n[0057] 由于增加了告警相关性分析器240,所以为了完成告警影响程度分析器220的各个功能,如图2所示,其包括以下几个部分:\n[0058] 信息接收单元222,用于接收来自相关业务分析器210的相关业务链表、告警接收器200的告警信息、以及告警相关性分析器240的根源告警标志;\n[0059] 告警信息分析单元223,用于接收信息接收单元222获得的相关业务链表和告警信息,并依据用户输入的时间或相关业务链表中记录的激活时刻计算用于计算告警频率的时间段,以及将获得的告警信息和时间段发送至告警频率分析器230;及[0060] 告警影响程度分析单元224,用于接收来自告警信息分析单元223的告警信息、来自信息接收单元220的当前告警的根源告警标志、以及来自告警频率分析器230的告警频率,并依据与当前告警相关的各个参数计算当前告警的影响程度,其具体计算方法可以参见以下关于方法的说明。\n[0061] 基于上述系统结构,本发明还提供了一种动态分析告警对业务网络的影响程度的方法,该方法主要应用于本发明的动态分析系统中。如图3所示,本发明所述方法包括以下几个步骤:\n[0062] 步骤310,接收到告警信息,根据该告警信息可以获取当前告警发生的端口、位置编号以及告警严重性等级等信息。根据告警编号与严重性等级的对应表可获取当前告警的严重性原始等级的值Go,各种告警对应的严重性等级可以由管理员依具体情况自行修改定制。\n[0063] 步骤320,依据上述端口信息,从业务链表中查找经过当前告警发生端口的所有业务,并将查找到的业务情况存储在相关业务链表中。如果告警发生的端口是与业务相关的端口,则从业务链表中查找经过此端口的所有业务,并在相关业务链表中记录相关业务数目Ns,如果此相关业务数不为0,则还要在相关业务链表中记录最早被激活的业务的激活时刻Tb,并转到步骤330;如果此相关业务数为0、或者告警发生的端口是与业务无关的端口则转到步骤340;\n[0064] 步骤330,获取当前时刻Tc,则计算告警频率的时间段T=Tc-Tb,转到步骤350;\n[0065] 步骤340,提示用户输入计算告警频率的时间段的起始时刻Ts,终止时刻Te默认为当前时刻,提示界面如图6所示,然后计算起始时刻Ts到当前时刻Te之间的时间差,将该时间差定义为用于计算告警频率的时间段T=Te-Ts,转到步骤350;\n[0066] 步骤350,计算在时间段T内该端口上产生此类告警的频率Q;\n[0067] 步骤360,对当前告警进行相关性分析,并设置当前告警的根源告警标志的值F,若当前告警属于根源告警,则F=1,否则,F=0;\n[0068] 步骤370,依据根源告警标志的值F和当前告警的严重性原始等级Go,计算当前告警的告警严重性扩张等级G=F×M+Go,即非根源告警的告警等级仍为原等级,而根源告警的告警等级为原值加M;\n[0069] 步骤380,对告警严重性扩张等级G、相关业务链表中的相关业务数NS、及告警频率Q进行加权计算,获得当前告警的影响程度Result,比如可以采用如下公式计算当前告警的影响程度Result:\n[0070] Result=G×216+Ns×28+Q。\n[0071] 从上述当前告警的影响程度Result的计算公式可以看出,如果相关业务链表中\n16\n记录的相关业务数目Ns为零,则当前告警的影响程度Result=G×2 +Q,Result只与告警严重性扩张等级G和告警频率Q相关,此时,如果当前告警不属于根源告警,则当前告警的\n16\n影响程度Result=G0×2 +Q,Result就只与告警严重性原始等级G0和告警频率Q相关。\n所以,综合各种情况,可以看出,当前告警的影响程度是综合当前告警的相关信息和所述告警频率计算获得,这里的当前告警的相关信息包括:告警严重性等级的情况(即告警严重性原始等级G0或告警严重性扩张等级G)、及相关业务链表中记录的相关业务数目Ns。\n[0072] 步骤390,在界面上显示告警的详细信息,包括告警的影响程度值,流程结束。\n[0073] 如图4所示,上述步骤350中计算告警的频率具体步骤如下,\n[0074] 步骤351,将该告警输入告警数据库和当前告警库;\n[0075] 步骤352,在告警数据库中统计由步骤330或步骤340得出的时间段内该端口上产生的此类告警的次数Na;\n[0076] 步骤353,计算在时间段T内该端口上产生此类告警的频率Q=Na/T。\n[0077] 可见,如果告警端口属于业务相关端口,且相关业务链表中记录的相关业务数不为零,则可以通过上述步骤330,并结合步骤351、352、353计算告警频率Q;如果告警端口不属于业务相关端口,或相关业务链表中记录的相关业务数为零,则可以通过上述步骤340,并结合步骤351、352、353计算告警频率Q。\n[0078] 如图5所示,上述步骤360中计算当前告警的根源告警标志位的具体步骤如下:\n[0079] 步骤361:运用现有的告警相关性分析技术,找出当前告警库中的根源告警,生成根源告警链表;\n[0080] 步骤362:判断步骤310中接收到的当前告警是否在根源告警链表中;\n[0081] 步骤363:如果当前告警在根源链表中,则它的根源告警标志值F赋值为1,否则,它的根源告警标志值F赋值为0。\n[0082] 综上所述,上述当前告警的影响程度Result的计算公式,综合了以下三个方面的因素:\n[0083] (1)是否是根源告警。因为只有向管理反映出告警的根源所在,才可以快刀斩乱麻、一步到位解除告警威胁;\n[0084] (2)相关业务数目。业务质量的好坏也是衡量网络优劣的重要因素,因此影响业务数目越多的告警越应该值得重视。\n[0085] (3)告警频率。频繁出现的告警,可能预示着告警风暴的来临,即使不是紧急告警,对网络性能的影响也是很严重的,所以对此频繁出现的告警进行及时处理,可以避免严重网络事故的发生。\n[0086] 可见,本发明通过仔细分析告警之间的相关性,抓住这些告警原因的根源,从运营商最关心的是设备问题对业务的影响角度出发,统计了频繁出现的告警,动态分析了告警对业务网络的影响程度,并通过图形将结果显示给管理员。如图6和7所示,本发明还可以加入人机界面,为管理员提供查看告警相关业务、根源告警、告警发生频率的功能,用户选中某条告警,点击鼠标右键即可弹出如图6所示的菜单。\n[0087] 当然,本发明还可以有其他多种实施方式,在不背离本发明精神及实质的情况下,本领域技术人员可根据本发明做出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
法律信息
- 2010-12-29
- 2008-11-26
- 2008-10-01
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2005-08-17
|
2005-01-19
| | |
2
| | 暂无 |
2000-11-07
| | |
3
| | 暂无 |
1998-10-13
| | |
4
| |
2004-03-31
|
2002-09-28
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |