著录项信息
专利名称 | 基于日志的智能自适应网络故障定位和分析方法 |
申请号 | CN200810124195.5 | 申请日期 | 2008-06-17 |
法律状态 | 暂无 | 申报国家 | 中国 |
公开/公告日 | 2008-12-17 | 公开/公告号 | CN101325520 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | H04L12/26 | IPC分类号 | H;0;4;L;1;2;/;2;6;;;H;0;4;L;2;9;/;0;6查看分类表>
|
申请人 | 南京邮电大学 | 申请人地址 | 江苏省苏州市苏州工业园区仁爱路188号综合楼203室
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 苏州锐创通信有限责任公司 | 当前权利人 | 苏州锐创通信有限责任公司 |
发明人 | 张顺颐;李甜;王攀 |
代理机构 | 南京经纬专利商标代理有限公司 | 代理人 | 叶连生 |
摘要
基于日志的智能自适应网络故障定位和分析方法主要由基于优先级的日志预处理方法、基于时间序列的日志事件聚类分析方法和多维日志统计分析方法组成。海量日志信息首先按照优先级别进行分类存储,然后再根据基于时间序列的日志事件聚类分析方法筛选出关键的事件类型即“策略”的获取,随后再运用多维日志统计分析方法将关键的日志信息呈现在界面上,并触发告警判断机制进行实时告警。该方法具有良好的可扩展性和准确性,且易于与运营商相关的应用接口对接。
1.一种基于日志的智能自适应网络故障定位和分析方法,其特征在于运用多维日志分析方法对日志数据进行统计,采用哈希表和链表的结构来存储数据,该方法步骤为:
步骤1.统计周期内网络设备日志信息的每个优先级别的事件总数:将周期内的所有发生事件累加;
步骤2.统计事件类型的事件次数最大的N位:这部分采用16位长度的数组作为哈希表,通过将事件类型进行哈希函数运算以后快速定位到相应的链表进行查找,链表中的结点分别保存日志信息的设备地址、源地址、目的地址、事件类型和事件次数;当查找到有相同五元组的结点以后,将事件次数进行累加,若没有查找到相同的结点,则新建一个结点插入链表中;对事件次数排序,存入记录事件类型的事件总数排名前N位的表;
步骤3.统计按源地址分类的事件次数最大的N位:这部分依然采用16位长度的数组作为哈希表,通过将源地址进行哈希函数运算以后快速定位到相应的链表进行查找,链表中的结点保存日志信息的源地址和事件次数;当查找到有相同源地址的结点以后,将事件次数进行累加,若没有查找到相同结点,则新建一个结点插入链表中;对事件次数排序,存入记录源地址的事件总数排名前N位的表;
步骤4.统计按目的地址分类的事件总数最大的N位:这部分依然采用16位长度的数组作为哈希表,通过将目的地址进行哈希函数运算以后快速定位到相应的链表进行查找,链表中的结点保存日志信息的目的地址和事件总数;当查找到有相同目的地址的结点以后,将事件次数进行累加成事件总数,若没有查找到相同结点,则新建一个结点插入链表中;对事件次数进行排序,存入记录目的地址的事件总数排名前N位的表;
步骤5.统计按端口号分类的事件总数最大的N位:这部分依然采用16位长的数组作为哈希表,链表中的结点用来保存端口号和事件次数;对事件次数进行排序,存入记录端口号的事件总数排名前N位的表,结束。
技术领域\n本发明设计了基于Syslog(系统日志)的网络故障定位的分析模型和方法,主要研究如何对互联网网络设备(交换机、路由器、CMTS)的日志数据进行分析,及时、准确地定位网络质量劣化点,涉及到Syslog协议分析、网络管理以及数据挖掘等技术领域。\n背景技术\n目前,从外部看,网络环境发生了巨大的变化,经历了由结构的单一到复杂、应用的单一到多样的发展过程,这就要求网络管理员在网络的协议层次结构上对系统管理重新认识,通过适当的策略实现集中式管理,实现事件的实时监控和快速响应的网络管理。但是,网络管理的对象主要由构成网络的硬件和软件组成,包括工作站、服务器、网卡、路由器、交换机等。通常情况下这些设备都分散在不同的地方,而且由于设备众多,要做到实时实地管理需要大量的人力、物力和财力,对网络设备进行远程管理以及对设备状态进行预警有一定困难。因此对于网络管理员来说,网络的运营维护、监测优化成为了一个富有挑战性的问题。\n从内部看,各类IT资源、设备飞速膨胀,设备本身产生的日志数量也呈指数级增长。其单独的日志分析结果对安全问题没有太大帮助,而海量日志的产生也使分析成为空想,导致日志只能简单丢弃。如何为不同的网络设备提供统一的事件管理分析平台,打破企业中不同网络设备存在的信息鸿沟,有效地实现全网的服务故障、安全预警、入侵行为的实时发现、入侵事件的动态响应,是摆在众多企业面前亟待解决的问题。\n当前的Syslog信息管理和分析机制严重不能适应主动防御网络的要求,主要表现在以下几点:\n一、不具备针对网络设备的特点而对接收的Syslog信息进行特别的处理:目前只能按IP地址和时间的不同来区分Syslog信息,不能按照优先级区分和存储Syslog信息。因此大量的普通信息淹没优先级高的信息,使维护人员不能及时发现网络设备的严重事件,延长了突发事件的响应时间。\n二、目前的日志审查方式大多以定期方式进行,这样做的缺点是不能及时的分析日志中的信息,尤其在网络故障诊断时,定期审查的方式显得尤为不足。\n由上可以看出,采用传统的Syslog信息分析方法很难满足网络管理的需求。因此,必须另辟蹊径。\n发明内容\n技术问题:本发明的目的是建立基于日志的智能自适应网络故障定位和分析方法,将海量日志数据按照优先级进行存储和深度挖掘,从多个维度分析基于Syslog的日志信息,及时发现网络劣化点,并能动态实时地进行告警。\n技术方案:本发明基于日志的智能自适应网络故障定位和分析方法运用多维日志分析方法对日志数据进行统计,采用了哈希表和链表的结构来存储数据,该方法步骤为:\n步骤1.统计周期内网络设备日志信息的每个优先级别的事件总数:将周期内的 所有发生事件累加,\n步骤2.统计事件类型的事件次数最大的N位:这部分采用16位长度的数组作为哈希表,通过将事件类型进行哈希函数运算以后快速定位到相应的链表进行查找,链表中的结点分别保存日志信息的设备地址,源地址,目的地址,事件类型,事件次数;当查找到有相同五元组的结点以后,将事件次数进行累加,若没有查找到相同的结点,则新建一个结点插入链表中;对事件次数排序,存入记录事件类型的事件总数排名前N位的表,\n步骤3.统计按源地址分类的事件次数最大的N位:这部分依然采用16位长度的数组作为哈希表,通过将源地址进行哈希函数运算以后快速定位到相应的链表进行查找,链表中的结点保存日志信息的源地址、事件次数;当查找到有相同源地址的结点以后,将事件次数进行累加,若没有查找到相同结点,则新建一个结点插入链表中;对事件次数排序,存入记录源地址的事件总数排名前N位的表,\n步骤4.统计按目的地址分类的事件总数最大的N位:这部分依然采用16位长度的数组作为哈希表,通过将目的地址进行哈希函数运算以后快速定位到相应的链表进行查找,链表中的结点保存日志信息的目的地址、事件总数;当查找到有相同目的地址的结点以后,将事件次数进行累加,若没有查找到相同结点,则新建一个结点插入链表中;对事件次数进行排序,存入记录目的地址的事件总数排名前N位的表,\n步骤5.统计按端口号分类的事件总数最大的N位:这部分依然采用16位长的数组作为哈希表,链表中的结点用来保存端口号、事件次数;对事件次数进行排序,存入记录端口号的事件总数排名前N位的表,结束。\n我们每种数据格式统计事件排名的前N位。管理员能够实时了解到各种统计数据中占比重较大的数据有哪些,有助于发现一些异常情况。\n有益效果:通过基于日志的智能自适应网络故障定位和分析方法,我们能够解决以下问题:\n(1)快速定位故障,保障网络可靠运行:日志信息分级别呈现,通过预设设备的报警状态值预警,可以帮助管理员及时方便地发现运行异常问题。\n(2)加强网络安全等级,提高网络安全系数:可以根据日志数据提供的混合型病毒和蠕虫攻击的行为特征,确定网络攻击源,能对恶意代码入侵提供信息线索,从而实施预防或快速补救措施。\n(3)动态添加“策略”,及时发现未知异常:根据以往的行为进行自动学习,并对未知事件进行异常检测,可以帮助管理员发现潜在危险。\n附图说明\n图1是基于Syslog的网络故障定位和分析的技术框架图。图中给出了日志数据处理的流程和接口。\n图2数据挖掘模型。图中给出了数据挖掘在日志信息检测中的应用。\n图3哈希表的结构。图中给出了哈希表在多维日志统计分析方法中的应用。\n具体实施方式\n本发明提出了一个基于Syslog的网络故障定位和分析的技术框架,如图1所示。 从图1中可以看出,系统分为四个层次,从下往上依次是:\n数据采集层:主要负责搜集网络设备中的各种类型的日志,包括Syslog,交换机和路由器日志,Web服务器日志等等。\n数据存储层:这部分主要负责将采集到的不同类型的日志进行整合,转换成统一的事件格式存储并进行日志预处理。\n业务逻辑层:主要是利用数据挖掘中的关联分析的方法对转换后的日志消息分析,提炼出有意义的关联规则,帮助管理员了解网络的状况。\n表示层:主要用于系统的配置和结果的反馈。\n本文的关键在于数据存储层的日志预处理和业务逻辑层,这里对其实现方法进行详细说明。\n1.日志预处理\n我们将日志信息按优先级别进行划分和存储,下面就此进行讨论:\n分析网络设备发送过来的SysLog日志数据格式,将各项信息提取出来,将设备的日志信息转换为统一的日志事件格式,从而非常方便的支持任意类型设备的事件规格化。Syslog格式是由RFC3164(The BSD syslog Protocol)定义的,并对消息头部进行扩展,是设备产生的基于事件的日志。其格式为:\n<优先级>时间戳 主机名 模块名/级别/信息摘要:内容\n
timestamp sysname module/level/digest:content\n■优先级\nPRI:Priority Value,优先级。PRI中用二进制数的低三位表示Severity Code,高位表示Facility,PRI=Facility x 8+Severity得到xyz。例如<138>为17×8+2,即表示其Facility为17,Severity为2。具体的Facility和Severity的含义如表1.1和表1.2所示。\nNumerical Code Facility 描述 0 kernel messages 内核日志消息 1 user-level messages 随机的用户日志消息 2 mail system 邮件系统日志消息 3 system daemons 系统守护进程日志消息 4 security/authorization messages 安全管理日志消息 5 messages generated internally by syslogd syslogd本身的日志消息 6 line printer subsystem 打印子系统日志消息 7 network news subsystem 新闻服务子系统日志消息\n 8 UUCP subsystem UUCP子系统日志消息 9 clock daemon 系统始终守护进程日志消息 10 security/authorization messages 私有的安全管理日志消息 11 FTP daemon FTP守护进程日志消息 12 NTP subsystem NTP系统日志消息 13 log audit 日志审计 14 log alert 日志警报 15 clock daemon 系统始终守护进程日志消息 16 local use 0(local0) 保留为本地使用0 17 local use 1(local1) 保留为本地使用1 18 local use 2(local2) 保留为本地使用2 19 local use 3(local3) 保留为本地使用3 20 local use 4(local4) 保留为本地使用4 21 local use 5(local5) 保留为本地使用5 22 local use 6(local6) 保留为本地使用6 23 local use 7(local7) 保留为本地使用7\n表1.1优先级中Facility的详细信息\n Numerical Code Severity 描述 0 Emergency:system is unusable 紧急:系统不可用 1 Alert:action must be taken immediately 告警:应马上行动 2 Critical:critical conditions 严重:有严重情况发生 3 Error:error conditions 错误:错误消息\n Numerical Code Severity 描述 4 Warning:warning conditions 警告:警告消息 5 Notice:normal but significant condition 通知:正常但重要的消息 6 Informational:informational messages 信息:普通信息 7 Debug:debug-level messages 调试:调试信息(大量)\n表1.2优先级中Severity的详细信息\n因此,将网络设备的日志信息划分为八大级别,如表1.3所示,并在数据库中进行分别存储。\n 日志级别 日志级别描述 系统状态 0 紧急(Emergencies) 系统不可用 1 告警(Alerts) 应马上行动 2 严重的(Critical) 有严重情况发生 3 错误(Errors) 错误消息 4 警告(Warnings) 警告消息 5 通知(Notifications) 正常但重要的消息 6 信息(Informational) 普通信息 7 调试(debugging) 调试信息(大量)\n表1.3网络设备日志信息级别\n2.业务逻辑层\n在业务逻辑层,将数据挖掘运用到日志信息检测中,如图2所示。包括两方面的内容:基于时间序列的增量聚类分析和多维日志统计分析。\n■基于时间序列的增量聚类分析\n基于时间序列的增量聚类分析主要考虑的是日志信息中关键事件类型的获取即“策略”的获得。“策略”包含了管理员对于一些异常事件的定义和系统运行所需要的参数。聚类分析结果又能够对“策略”库进行补充,这样能够使得系统能够适应环境的变化。\n具体方法如下:\n1)选择一个固定的统计时间(5分钟,2小时或6小时)作为标准,把一段时间内的日志数据按此标准进行时间域划分,同时把第一个时间域的日志数据分配到第一个类里。\n2)对于目前的时间域认为是检测阶段,之前的所有时间域认为是比较阶段。对于检测阶段的日志数据,把它分配到比较阶段的某个类或者一个新类中。该分配是基于一些标准的。例如新日志数据到目前类的重心的距离。在这种情况下,每次添加一个时间域内的日志数据到目前的类中,需要重新计算重心的值。\n在分析中,如果出现新的类别,则发出警告。当检测阶段的数据特征与比较阶段的数据特征距离相差超过一个限定值时则认为新的类别产生。管理员在此基础上添加“策略”。\n■多维日志统计分析\n主要从以下几个方面对日志信息进行统计分析:①计算周期内网络设备的每个优先级别的事件总数;②事件类型的事件总数最大的N位;③按源地址分类的事件总数最大的N位;④按目的地址分类的事件总数最大的N位;⑤按端口号(应用)分类的流量值最大的N位。为了能够快速进行统计,主要采用了哈希表和链表的结构来存储数据。根据统计的类别不同,具体的哈希表的大小和哈希算法会有所不同。主要结构如图3所示。\n根据本方法开发出的基于日志的智能自适应网络故障定位和分析方法在广电城域网上得到了具体验证。\n系统硬件主要由日志数据库服务器、日志管理服务器、日志管理查询终端三部分组成。考虑到数据备份问题,配置两台高性能数据库服务器作双机热备,同时配置一台日志管理服务器作为核心的日志接收和处理设备。系统的数据库服务器和日志管理服务器部署在网络传输部,日志管理查询终端则可以分布在不同的分支部门供其使用。\n数据库服务器为整个系统的核心实体,用于存放所有的原始日志和提炼后的日志信息及其相关系统信息。日志管理服务器接收来自各个设备的日志信息,经过过滤、解析、提取、清洗、挖掘之后,将关键的日志信息呈现在界面上,并触发告警判断机制进行实时告警。同时将信息存储入数据库中。\n该方法步骤为:\n步骤1.统计周期内网络设备日志信息的每个优先级别的事件总数:将周期内的所有发生事件累加,\n步骤2.统计事件类型的事件次数最大的N位:这部分采用16位长度的数组作为哈希表,通过将事件类型进行哈希函数运算以后快速定位到相应的链表进行查找,链表中的结点分别保存日志信息的设备地址,源地址,目的地址,事件类型,事件次数;当查找到有相同五元组的结点以后,将事件次数进行累加,若没有查找到相同的结点,则新建一个结点插入链表中;对事件次数排序,存入记录事件类型的事件总数排名前N位的表,\n步骤3.统计按源地址分类的事件次数最大的N位:这部分依然采用16位长度的数组作为哈希表,通过将源地址进行哈希函数运算以后快速定位到相应的链表进行查找,链表中的结点保存日志信息的源地址、事件次数;当查找到有相同源地址的结点以后,将事件次数进行累加,若没有查找到相同结点,则新建一个结点插入链表中;对事件次数排序,存入记录源地址的事件总数排名前N位的表,\n步骤4.统计按目的地址分类的事件总数最大的N位:这部分依然采用16位长度的数组作为哈希表,通过将目的地址进行哈希函数运算以后快速定位到相应的链表进行查找,链表中的结点保存日志信息的目的地址、事件总数;当查找到有相同目的地址的结点以后,将事件次数进行累加,若没有查找到相同结点,则新建一个结点插入链表中;对事件次数进行排序,存入记录目的地址的事件总数排名前N位的表,\n步骤5.统计按端口号分类的事件总数最大的N位:这部分依然采用16位长的数组作为哈希表,链表中的结点用来保存端口号、事件次数;对事件次数进行排序,存入记录端口号的事件总数排名前N位的表,结束。法律信息
- 2022-06-07
未缴年费专利权终止
IPC(主分类): H04L 12/26
专利号: ZL 200810124195.5
申请日: 2008.06.17
授权公告日: 2010.08.18
- 2016-06-08
专利权的转移
登记生效日: 2016.05.19
专利权人由南京邮电大学变更为苏州锐创通信有限责任公司
地址由210003 江苏省南京市新模范马路66号变更为215123 江苏省苏州市苏州工业园区仁爱路188号综合楼203室
- 2016-04-20
专利实施许可合同备案的注销
合同备案号: 2016320000103
让与人: 南京邮电大学
受让人: 中博信息技术研究院有限公司
解除日: 2016.03.29
- 2016-03-30
专利实施许可合同备案的生效
IPC(主分类): H04L 12/26
合同备案号: 2016320000103
专利号: ZL 200810124195.5
申请日: 2008.06.17
让与人: 南京邮电大学
受让人: 中博信息技术研究院有限公司
发明名称: 基于日志的智能自适应网络故障定位和分析方法
申请公布日: 2008.12.17
授权公告日: 2010.08.18
许可种类: 独占许可
备案日期: 2016.03.07
- 2014-06-04
著录事项变更
发明人由张顺颐 李甜 王攀变更为王攀 张顺颐 李甜
- 2010-08-18
- 2009-02-11
- 2008-12-17
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2006-12-13
|
2006-07-19
| | |
2
| |
2007-01-03
|
2006-07-10
| | |
3
| |
2005-07-20
|
2004-01-02
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |