著录项信息
专利名称 | 基于矩阵奇异值关联规则挖掘的传感器数据校验方法 |
申请号 | CN200910028013.9 | 申请日期 | 2009-01-05 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2009-07-08 | 公开/公告号 | CN101477375 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G05B23/02 | IPC分类号 | G;0;5;B;2;3;/;0;2;;;G;0;6;K;9;/;6;2查看分类表>
|
申请人 | 东南大学 | 申请人地址 | 江苏省南京市四牌楼2号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 东南大学 | 当前权利人 | 东南大学 |
发明人 | 邱凤翔;司风琪;徐治皋 |
代理机构 | 南京经纬专利商标代理有限公司 | 代理人 | 叶连生 |
摘要
基于矩阵奇异值关联规则挖掘的传感器数据校验方法的实现分为两部分,具体如下:第一部分为相似关联规则测点挖掘,第二部分为传感器数据在线校验;将寻找的具有相似关联的测点组用于最小二乘支持向量回归建模,训练样本选取全工况数据,目的是覆盖所有运行工况;对于n个测点,一共需要建立(n+1)个回归模型,包括:1个用于运行数据监测的“n输入-n输出”的“残差生成模块”;n个用于各个测点运行数据重构的“(n-1)输入-单输出”的“#K数据重构模块”,n为数据在线校验的传感器个数;本发明在非间断性工业生产领域提出运行设备测点间波动相似度的概念,将关联规则的概念扩展到波动相似关联规则,是对关联规则在这一领域的补充和有效的拓展,具有实际意义。
1.一种基于矩阵奇异值关联规则挖掘的传感器数据校验方法,其特征在于,该方法的实现分为两部分,具体如下:
第一部分:相似关联规则测点挖掘
步骤1:收集需要挖掘相似关联规则的n个测点置于程序列表中,n为测点个数;
步骤2:按照 方式将测点任意两两组合,采集某时间段采样时间间隔Δt正常运行数据,组成一个m×2阶矩阵X,m为样本数目,X由2个测点m个采样值组成的m×2阶矩阵;
步骤3:将矩阵X各列分别归一化处理,得到矩阵A,将矩阵A进行奇异值分解,分解为:
A=U×S×V,其中矩阵A为矩阵X各列分别归一化后的m×2阶矩阵,U为m×m阶正交阵,V为2×2阶正交阵,S=diag(σ1,σ2),S为m×2阶对角阵,σ1≥σ2,σ1>0,σ2≥0,σ1为矩阵A的较大的一个奇异值,σ2为矩阵A的较小的一个奇异值,求得两测点波动相似度d为:
步骤4:重复步骤2和步骤3,有 个组合,得到 个对应的波动相似度,按照 方式的任意两两组合共计(n×(n-1))/2对测点组合;
步骤5:选择波动相似度大于80%的相关测点组合,从而获得一组具有相似关联关系的多个测点;
第二部分:传感器数据在线校验
将寻找的具有相似关联的测点组用于最小二乘支持向量回归建模,训练样本选取全工况数据,目的是覆盖所有运行工况;对于n个测点,一共需要建立(N+1)个回归模型,包括:
1个用于运行数据监测的“n输入-n输出”的“残差生成模块”;n个用于各个测点运行数据重构的“(n-1)输入-单输出”的“#K数据重构模块”,n为数据在线校验的传感器个数;
传感器数据在线校验前,需要对“残差生成模块”、各线路数据的“#K数据重构模块”进行全工况数据训练;对运行数据的监测,故障判断,数据重构数据校验流程如下:
1.)现场数据通过网络交换机后,得到两路数据,一路进入传感器数据校验模块,进行数据校验;另一路直连接到数据采集接口机,作为传感器数据校验的冗余,防止数据流中断;
2.)现场数据从数据输入接口进入传感器数据校验模块,到达上下限判断模块;在这个模块,首先对各线路数据进行上下限判断,如果发现#K线路数据超出上下限,系统认为该线路有故障,直接送到#K数据重构模块,用其他正常数据重构该线路数据,并发出报警信号,显示#K线路故障;
3.)数据没有超出上下限,则进入残差生成模块;在这个模块,通过最小二乘支持向量回归模型对各参数运行数据生成对应的残差;
4.)各线路数据和残差进入残差判断模块;在这个模块,判断各线路残差是否有异常,如果没有异常,各线路数据直接进入数据输出接口;如果发现#K线路残差异常,将各线路数据送到#K数据重构模块,用其他正常数据重构该线路数据,并发出报警信号,显示#K线路故障;
5.)数据通过数据输出接口,连接数据采集接口机,由数据采集接口机判断采用哪一线路信号发送到显示屏,并将数据写入实时数据库。
2.如权利要求1所述的基于矩阵奇异值关联规则挖掘的传感器数据校验方法,其特征在于,两测点波动相似度d指非间断性工业生产设备上两个测点或两个参数的运行数据在时间轴上随着时间上下波动具有一定的相似程度。
3.如权利要求1所述的基于矩阵奇异值关联规则挖掘的传感器数据校验方法,其特征在于,采样时间间隔Δt的取值范围为30秒到120秒;采集样本数目m的取值范围为500个到2000个。
4.如权利要求1所述的基于矩阵奇异值关联规则挖掘的传感器数据校验方法,其特征在于,“残差判断模块”的数据异常判断有3个判据:一是测点残差超过0.02;二是异常数据残差与正常数据残差正负异号,三是异常数据残差绝对值大于正常数据残差。
基于矩阵奇异值关联规则挖掘的传感器数据校验方法\n技术领域\n[0001] 本发明是利用矩阵奇异值来寻找具有相似关联规则的测点组合的数据挖掘方法,并用于火电厂传感器数据校验和故障检测。涉及到数据挖掘和数据校验领域。\n背景技术\n[0002] 数据挖掘从大量的数据中挖掘出有用的信息,它是一个多学科交叉研究领域。关联规则是挖掘发现大量数据中有价值的关联关系,它在数据挖掘中是一个重要的课题,最近几年已被业界所广泛研究。目前关联规则挖掘广泛地应用于商业界、医疗保险、金融业、电信部门、工业生产领域等,因此对它的研究有着极其重要的意义。关联规则在实际应用中,还存在不少问题,比如,仅凭支持度和置信度这两个评价关联规则的标准,可能会遗漏一些其他关联关系,因而研制一些新的评价标准很有必要。另外,计算复杂度依赖于具体的实现细节和硬件环境,在数据挖掘中,由于操作对象是海量数据库,因此,空间和时间的复杂度问题将是非常重要的一个环节,寻求新的方法以降低数据挖掘计算复杂度和计算量是十分有益的工作。\n[0003] 火电厂是能量转换的场所,为国民经济持续发展提供源源不断的动力。火电厂的安全经济运行十分重要,所以对火电厂的运行监控一直是重大研究课题。监控数据来源于感应器、传感器、变送器等组成的测量系统对运行设备的测量,其中任何一个设备出现故障都会响应数据的准确性。然而火电厂发电在高温高压的环境中进行,运行环境恶劣,上万的测点难免出现故障,从现场运行数据来看,经常出现一些测点数据异常,比如突然变大,突然变为零,各种不规则跃变等等。直接影响运行人员对实时数据的判断;对于实时历史数据库而言,出现一些无意义的数据,影响历史数据的有效获取,进而影响对历史数据的分析,获取有效信息,对机组历史趋势的把握。\n[0004] 现有的基于神经网络方法的数据检验,传感器故障定位等方法需要用到具有相似关联关系的测点。而在寻找这些测点的传统方法通过对设备数学模型的分析,通过对趋势曲线直接观察等定性的方法来确定测点间相似关联关系,具有对测点相关性把握不准确,选择测点较困难等缺点。神经网络方法是基于风险最小化原理,没有足够的数学理论支持,而支持向量机是基于结构最小化原理,有充分的数学理论支持,很多领域研究表明支持向量机有更高的可靠性和更好的回归精度。\n发明内容\n[0005] 技术问题:针对以上描述中存在的问题,本发明提供了一种基于矩阵奇异值关联规则挖掘的传感器数据校验方法,并将挖掘发现的具有相似关联的测点用最小二乘支持向量回归的方法进行传感器数据校验和故障检测。\n[0006] 技术方案:本发明的基于矩阵奇异值关联规则挖掘的传感器数据校验方法,其特征在于,该方法的实现分为两部分,具体如下:\n[0007] 第一部分:相似关联规则测点挖掘\n[0008] 步骤1:收集需要挖掘相似关联规则的n个测点置于程序列表中,n为测点个数;\n[0009] 步骤2:按照Cn2方式将测点任意两两组合,采集某时间段采样时间间隔Δt正常运行数据,组成一个m×2阶矩阵X,m为样本数目,X由2个测点m个采样值组成的m×2阶矩阵;\n[0010] 步骤3:将矩阵X各列分别归一化处理,得到矩阵A,将矩阵A进行奇异值分解,分解为:A=U×S×V,其中矩阵A为矩阵X各列分别归一化后的m×2阶矩阵,U为m×m阶正交阵,V为2×2阶正交阵,S=diag(σ1,σ2),S为m×2阶对角阵,σ1≥σ2,σ1>0,σ2≥0,σ1为矩阵A的较大的一个奇异值,σ2为矩阵A的较小的一个奇异值,求得两测点波动相似度d为:\n[0011] 步骤4:重复步骤2和步骤3,有Cn2个组合,得到Cn2个对应的波动相似度,按照Cn2方式的任意两两组合共计(n×(n-1))/2对测点组合;\n[0012] 步骤5:选择波动相似度d大于80%的相关测点组合,从而获得一组具有相似关联关系的多个测点;\n[0013] 第二部分:传感器数据在线校验\n[0014] 将寻找的具有相似关联的测点组用于最小二乘支持向量回归建模,训练样本选取全工况数据,目的是覆盖所有运行工况;对于n个测点,一共需要建立(n+1)个回归模型,包括:1个用于运行数据监测的“n输入-n输出”的“残差生成模块”;n个用于各个测点运行数据重构的“(n-1)输入-单输出”的“#K数据重构模块”,n为数据在线校验的传感器个数;\n[0015] 传感器数据在线校验前,需要对“残差生成模块”、各线路数据的“#K数据重构模块”进行全工况数据训练;对运行数据的监测,故障判断,数据重构数据校验流程如下:\n[0016] 1)现场数据通过网络交换机后,得到两路数据,一路进入传感器数据校验模块,进行数据校验;另一路直连接到数据采集接口机,作为传感器数据校验的冗余,防止数据流中断;\n[0017] 2)现场数据从数据输入接口进入传感器数据校验模块,到达上下限判断模块;在这个模块,首先对各线路数据进行上下限判断,如果发现#K线路数据超出上下限,系统认为该线路有故障,直接送到#K数据重构模块,用其他正常数据重构该线路数据,并发出报警信号,显示#K线路故障;\n[0018] 3)数据没有超出上下限,则进入残差生成模块;在这个模块,通过最小二乘支持向量回归模型对各参数运行数据生成对应的残差;\n[0019] 4)各线路数据和残差进入残差判断模块;在这个模块,判断各线路残差是否有异常,如果没有异常,各线路数据直接进入数据输出接口;如果发现#K线路残差异常,将各线路数据送到#K数据重构模块,用其他正常数据重构该线路数据,并发出报警信号,显示#K线路故障;\n[0020] 5)数据通过数据输出接口,连接数据采集接口机,由数据采集接口机判断采用哪一线路信号发送到显示屏,并将数据写入实时数据库。\n[0021] 两测点波动相似度d指非间断性工业生产设备、特别是火电机组运行设备上两个测点或两个参数的运行数据在时间轴上随着时间上下波动具有一定的相似程度。\n[0022] 两测点波动相似度d大于80%,则可认为两测点具有相似关联关系。\n[0023] 采样时间间隔Δt的取值范围为30秒到120秒;采集样本数目m的取值范围为\n500个到2000个。\n[0024] “残差判断模块”的数据异常判断有3个判据:一是测点残差超过0.02;二是异常数据残差与正常数据残差正负异号,三是异常数据残差绝对值大于正常数据残差。\n[0025] 1个用于运行数据监测的“n输入-n输出”的“残差生成模块”,n个用于各个测点运行数据重构的“(n-1)输入-单输出”的“#K数据重构模块”,共计(n+1)个回归模型均通过最小二乘支持向量回归方法建立。\n[0026] 有益效果:\n[0027] 1、本发明在非间断性工业生产领域提出运行设备测点间波动相似度的概念,将关联规则的概念扩展到波动相似关联规则,是对关联规则在这一领域的补充和有效的拓展,具有实际意义。\n[0028] 2、本发明在寻找波动相似关联关系时具有计算量小,运算速度快,寻找具有相似关联规则测点准确等优点,不需要对海量数据整体进行运算,只需要取其中小部分正常运行数据既可得出有价值的关联关系。\n[0029] 3、本发明能很好地解决在非间断性工业生产、特别是大型火电厂的传统数据校验方法定性寻找关联测点的不足,将测点间的相似关联规则用波动相似度来定量衡量,能够更加准确的选取具有关联规则的测点,在实际中更好的应用。\n[0030] 4、实时显示数据的可靠性得到提高,更好的为运行人员操作提供可靠的数据,避免虚假数据或者错误数据给运行人员带来的误指导。\n[0031] 5、存入实时数据库的运行数据的有效性得到提高,能够更好的反映机组运行情况,为电厂历史数据分析提供更多的有效数据,更好地把握机组运行状况。\n[0032] 6、为电厂监测信息系统(如SIS)的各个高级功能模块(如机组运行优化、状态监测与故障诊断等)的运算提供更加可靠的数据。\n附图说明\n[0033] 图1基于矩阵奇异值的相似关联测点挖掘流程图。\n[0034] 图2传感器数据校验流程图。\n[0035] 图3第一级压力与调节级压力波动曲线(相似度99.5%)。\n[0036] 图4第一级压力与中压缸排汽压力波动曲线(相似度81.1%)。\n[0037] 图5除氧器进汽压力与中压缸排汽温度波动曲线(相似度29.0%)。\n[0038] 图6残差故障定位示意图。\n[0039] 图7高压排汽压力数据重构示意图。\n[0040] 图8高压排汽压力测量值与重构值的相对误差。\n[0041] 图9经过数据校正的再热器压力数据曲线。\n[0042] 图3到图5是选取三个不同等级的波动相似度测点组合,以表明波动相似度与波动曲线的内在关系。图6是各线路生成残差,高压排汽压力残差与其他残差异号,而且绝对值明显大于其他参数的残差,由此判断高压排汽压力有故障。图8表明了本发明数据重构的精度。图9虚线是某电厂#2机组再热器压力测点从2008-2-28 0:00:00开始的一段时间实际运行数据,数据出现异常波动现象;实线是经过传感器数据校验后数据得到很好的复原。\n具体实施方式\n[0043] 首先通过矩阵奇异值挖掘具有相似关联规则的测点,再通过这些测点建模,包括残差生成模型和各个输入线路数据重构模型。实现过程分为两个部分,具体描述如下:\n[0044] 第一部分:相似关联规则测点挖掘\n[0045] 通过矩阵奇异值挖掘具有相似关联规则的测点,具体步骤如下:\n[0046] 步骤1:收集需要挖掘相似关联规则的n个测点置于程序列表中,n为测点个数;\n[0047] 步骤2:按照Cn2方式将测点任意两两组合,采集某时间段采样时间间隔Δt正常运行数据,组成一个m×2阶矩阵X,m为样本数目,X由2个测点m个采样值组成的m×2阶矩阵;\n[0048] 步骤3:将矩阵X各列分别归一化处理,得到矩阵A,将矩阵A进行奇异值分解,分解为:A=U×S×V,其中矩阵A为矩阵X各列分别归一化后的m×2阶矩阵,U为m×m阶正交阵,V为2×2阶正交阵,S=diag(σ1,σ2),S为m×2阶对角阵,σ1≥σ2,σ1>0,σ2≥0,σ1为矩阵A的较大的一个奇异值,σ2为矩阵A的较小的一个奇异值,求得两测点波动相似度d为:\n[0049] 步骤4:重复步骤2和步骤3,有Cn2个组合,得到Cn2个对应的波动相似度,按照Cn2方式的任意两两组合共计(n×(n-1))/2对测点组合;\n[0050] 步骤5:选择波动相似度d大于80%的相关测点组合,从而获得一组具有相似关联关系的多个测点;\n[0051] 波动相似度指非间断性工业生产设备、特别是火电机组运行设备上两个测点或两个参数的运行数据在时间轴上随着时间上下波动具有一定的相似程度;波动相似度范围是\n0%~100%,如果波动相似度大于80%,则认为这两个测点具有相似关联规则;步骤2中采样时间间隔Δt的取值范围为30秒到120秒;采集样本数目m的取值范围500个到2000个。\n[0052] 第二部分:传感器数据在线校验\n[0053] 将寻找的具有相似关联的测点组用于最小二乘支持向量回归(LS-SVR)建模,训练样本选取全工况数据,目的是覆盖所有运行工况;对于n个测点,建立(n+1)个回归模型,包括:1个用于运行数据监测的“n输入-n输出”的“残差生成模块”;n个用于各个测点运行数据重构的“(n-1)输入-单输出”的“#K数据重构模块”;1个“残差生成模块”和n个“#K数据重构模块”共计(n+1)个回归模型均通过最小二乘支持向量回归方法建立。\n[0054] 系统在线数据校验启动前,需要对“残差生成模块”、各线路数据的“#K数据重构模块”进行全工况数据训练;对运行数据的监测,故障判断,数据重构等数据校验流程如下:\n[0055] 传感器数据在线校验前,需要对“残差生成模块”、各线路数据的“#K数据重构模块”进行全工况数据训练;对运行数据的监测,故障判断,数据重构等数据校验流程如下:\n[0056] 1.现场数据通过“网络交换机”后,得到两路数据,一路进入传感器数据校验模块,进行数据校验;另一路直连接到“数据采集接口机”,作为传感器数据校验的冗余,防止数据流中断;\n[0057] 2.现场数据从“数据输入接口”进入传感器数据校验模块,到达“上下限判断模块”;在这个模块,首先对各线路数据进行上下限判断,如果发现#K线路数据超出上下限,系统认为该线路有故障,直接送到“#K数据重构模块”,用其他正常数据重构该线路数据,并发出报警信号,显示#K线路故障;\n[0058] 3.数据没有超出上下限,则进入“残差生成模块”;在这个模块,通过最小二乘支持向量回归模型对各参数运行数据生成对应的残差;\n[0059] 4.各线路数据和残差进入“残差判断模块”;在这个模块,判断各线路残差是否有异常,如果没有异常,各线路数据直接进入“数据输出接口”;如果发现#K线路残差异常,将各线路数据送到“#K数据重构模块”,用其他正常数据重构该线路数据,并发出报警信号,显示#K线路故障;\n[0060] 5.数据通过“数据输出接口”,连接“数据采集接口机”,由“数据采集接口机”判断采用哪一线路信号发送到显示屏,并将数据写入实时数据库。\n[0061] 在第4步的“残差判断模块”,数据异常的3个判据:一是残差超过0.02;二是异常数据残差与正常数据残差异号,三是异常数据残差绝对值大于正常数据残差。\n[0062] 结合本发明方法的内容,给出以下火电厂生产运行数据相似关联规则挖掘以及在线数据校验和传感器故障检测实例。过程分为两部分进行,第一部分通过历史数据离线进行,第二部分在线数据过滤。以某300MW机组运行数据为例。\n[0063] 第一部分:相似关联规则测点挖掘\n[0064] 数据从集散控制系统(DCS)通过传感器由接口程序采集得到,并将数据存储到实时数据库PI中。\n[0065] 基于矩阵奇异值的关联规则挖掘,寻找具有相似关联规则的测点步骤如下:\n[0066] 1)收集表1中的21个测点(测点描述、位号),将表1中测点置于程序列表中。\n(注:步骤1取测点时,可以通过程序从实时数据库PI中自动获取机组所有模拟量的描述和位号,进行全机组测点相似关联规则挖掘。)\n[0067] 表1待计算测点\n[0068] \n[0069] 2)程序将把表1中的测点任意两两组合,在实时数据库PI中读取(2008-2-23 \n12:00:00,2008-2-23 22:00:00)10小时内数据,采集时间间隔为60秒,采集600个数据。\n生成600×2的矩阵X600×2。\n[0070] 3)将矩阵X600×2两列分别进行归一化处理,得到矩阵A600×2,进行奇异值分解,A=U×S×V,其中U600×600,S600×2,V2×2,\n[0071] 4)S=diag(σ1,σ2),σ1≥σ2,σ1>0,σ2≥0,求得波动相似度d为:\n[0072] 5)重复步骤(2)和(3),有C212个组合,得到210个对应的波动相似度;如表2所示,表2列出其中的一部分。\n[0073] 表2测点波动相似度(%)\n[0074] \n[0075] 6)选择波动相似度d大于80%的组合,即为具有相似关联规则的测点,如表3所示,是一组具有相似关联关系的测点。\n[0076] 表3一组波动相似关联规则测点\n[0077] \n[0078] 第二部分:传感器数据在线校验\n[0079] 为了全面说明本发明的有效性和实用性,实例分为以下几个步骤:\n[0080] 步骤一:选取一组具有波动相似关联关系的测点,准备全工况训练样本数据。\n[0081] 在表3中选择以下6个测点:#1高加进汽压,高压缸排汽压力,中压排汽压力,再热器压力,除氧器进汽压力,四抽压力作为本实例的在线数据校验的一组测点。收集全工况训练样本,用于系统运行前对各个模型进行训练。训练样本选取全工况共计1000个点,机组运行功率范围从40%到110%。\n[0082] 步骤二:验证本发明数据校正的有效性和精度。\n[0083] 在高压排汽压力正常数据叠加定值偏差型数据故障,通过残差生成模块生成的残差定位故障。基于支持向量回归的数据重构方法判断故障有两点:一是故障残差与其他残差异号,二是故障残差绝对值明显大于其他参数残差绝对值。图6示,高压排汽压力残差与其他残差异号,而且绝对值明显大于其他参数的残差,由此判断高压排汽压力有故障。图8明了本发明数据重构的精度,由此可知,本发明的数据重构精度控制非常理想,在0.4%以内,完全满足工业过程的要求。精度高的重要原因在于通过本发明矩阵奇异值相似关联规则挖掘,寻找到波动相似度很高的测点组,进而说明本发明数据挖掘方法以及基于支持向量回归的数据重构方法的有效性。\n[0084] 步骤三:实际运行参数故障检测与数据校正。\n[0085] 在精度达到要求的基础上,为了说明实际应用效果,实例给出了现场运行中由于某种原因导致的运行数据残缺的情况。图9中虚线是某电厂#2机组再热器压力测点从\n2008-2-28 0:00:00之后的一段时间的实际运行数据,可以看出中间有一段时间由于传感器跳动,数据出现异常波动现象。这种情况下,运行人员监视的显示器也出现异常波动,不能得到准确运行信息;同时,存储到数据库的运行数据由此失效。异常数据经过传感器数据校验后,数据得到很好的复原,如图9实线所示。
法律信息
- 2018-12-21
未缴年费专利权终止
IPC(主分类): G05B 23/02
专利号: ZL 200910028013.9
申请日: 2009.01.05
授权公告日: 2012.01.04
- 2012-01-04
- 2009-09-02
- 2009-07-08
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |