1.一种基于数据挖掘的风力发电机组故障诊断方法,包括以下步骤:
S1对实时采集到的风力发电机组包括振动信号在内的参数进行数据预处理:消除数据噪声和处理空缺值;
S2对经过步骤S1得到的风力发电机组振动信号进行幅值域分析;
S3对实时采集到的风力发电机组性能参数和进行幅值域分析后得到的振动参数进行相关性分析,除去对故障诊断没有作用的冗余参数;
S4对不同故障类型的数据样本建立故障判定树;
S5对于创建好的故障判定树,采用后剪枝方法消除数据中的噪声和孤立点带来的训练异常;
S6提取后剪枝完的故障判定树表示的知识,以IF-THEN的形式给出故障判定规则;
S7对实时采集到的风力发电机组运行参数,重复步骤S1、S2、S3,对处理后的数据利用步骤S6提取到的故障诊断规则进行故障诊断,并对诊断结果予以显示;
所述的步骤S2中进行幅值域分析的振动信号包括:计算峰值、有效值、峭度、偏度、波形因子、峰值因子、脉冲因子、裕度因子参数;
所述的步骤S4包括以下步骤:
S4-1创建节点S;
S4-2如果所有数据样本都属于同一故障类型A,则返回S作为叶节点,并标记为故障类型A;
S4-3否则,选择所有参数中具有最高信息增益的参数t,参数t成为节点S的“测试”参数;
S4-4对测试参数的每个区间划分创建一个分支,并据此划分样本;
S4-5重复以上过程,递归形成每个划分上的样本判定树;
S4-6递归划分步骤仅当下列条件之一成立时停止:给定节点的所有样本属于同一故障类型;没有剩余参数可以用来进一步划分样本;分支没有样本;
所述的步骤S4-3中选择所有参数中具有最高信息增益的参数t方法如下:
设数据样本集合为{s1,s2,s3,…sn},故障类型共m种,分别为C1,C2,C3,…Cm,属于不同故障类型的样本数据分别为q1,q2,q3,…qm,且满足∑qi=n;
计算对给定样本分类所需的期望信息I为
I=I(q1,q2,q3,…qm)=∑pilog2(pi)=∑(qi/s)log2(qi/s)
对数据样本集合{s1,s2,s3,…ss}的参数r,构造集合R:{r1,r2,r3,…,rl},其中l≦s;
*
用r =(ri+ri+1)/2对集合和作一个划分:R1={r1,r2,r3,…ri},R2={ri+1,ri+2,ri+3,…* *
,rl},使R1中的元素均小于r,R2中的元素大于等于r ;
分别统计属于R1、R2的样本中各故障类型的总数,分别记为r11,r12,r13,…,r1m;
r21,r22,r23,…,r2m;
*
对r 的划分计算子集的期望信息E:
E=(r01)/s*∑(r1j/r01)*log2(r1j/r01)+(r02)/s*∑(r2j/r02)*log2(r2j/r02)其中r01=∑r1i,r02=∑r2i;
* * *0
遍历r =(ri+ri+1)/2,i=1,2,3,…,l-1.记使划分子集期望最大的r 为r ,此时,*0
对用参数r的r 对集合{s1,s2,s3,…ss}进行划分,具有最大的信息增益;
*0
遍历所有参数,获得对集合{s1,s2,s3,…ss}具有最大信息增益的参数t和划分点t 。
2.根据权利要求1所述的基于数据挖掘的风力发电机组故障诊断方法,其特征是:所述的步骤S5包括:使用统计度量,剪去最不可靠的分支。
3.根据权利要求2所述的基于数据挖掘的风力发电机组故障诊断方法,其特征是:所述的步骤S6包括:对从根到树叶的每条路径创建一条故障判定规则,沿着给定路径上的每个参数区间形成规则前件,即IF部分;叶节点包含的故障类型预测,形成规则后件,即THEN部分。
一种基于数据挖掘的风力发电机组故障诊断方法
技术领域
[0001] 本发明涉及风力发电机组故障的诊断方法,尤其是涉及一种基于数据挖掘的风力发电机组故障诊断方法。
背景技术
[0002] 世界能源危机的日益严峻使以风力发电为代表的可再生能源利用得到了巨大的发展。在全球的风电总装机容量迅速增长的同时,风力发电机组的故障也层出不穷。风力发电机组的故障主要有风轮故障、传动系统故障、发电机故障、变桨系统故障等。风轮故障包括风轮质量不平衡故障、气动不平衡故障、叶片结冰故障、叶片裂纹损伤等,传动系统故障包括主轴不对中故障、主轴承损坏故障、联轴器损坏故障、齿轮轮齿损伤、齿轮轴承损伤等,发电机故障包括发电机轴承损伤、发电机转子不平衡故障、发电机定子故障、发电机转子故障等,变桨系统故障轴承损伤、齿轮损伤、变桨电机过热等。风力发电机组故障种类繁多,又由于其复杂的非线性性,故障发生时,难以判断发生故障的部位及确定故障的原因。目前对[1]
风力发电机组的故障处理大多集中于电网故障时风力发电机的控制方法 、风力发电机组[2] [3]
叶片故障诊断 、风电机组变频器故障诊断 等风力发电机组特定部件的故障诊断,无法实现对风力发电机组整机的故障定位及故障判别。
发明内容
[0003] 本发明所要解决的技术问题,就是提供一种基于数据挖掘的风力发电机组故障诊断方法,通过分析数据间的关系,揭示风力发电机组发生不同故障时参数的变化特征,可实现风力发电机组的故障定位及故障判别。
[0004] 本发明解决其技术问题所采用的技术方案如下:
[0005] 一种基于数据挖掘的风力发电机组故障诊断方法,包括以下步骤:
[0006] S1对采集到的风力发电机组包括振动信号的参数进行数据预处理:消除数据噪声和处理空缺值;
[0007] S2对经过步骤S1得到的风力发电机组振动信号进行幅值域分析;
[0008] S3对采集到的风力发电机组性能参数和进行幅值域分析后得到的振动参数进行相关性分析,除去对故障诊断没有作用的冗余参数;
[0009] S4对不同故障类型的数据样本建立故障判定树;
[0010] S5对于创建好的故障判定树,采用后剪枝方法以消除数据中的噪声和孤立点带来的训练异常;
[0011] S6提取后剪枝完的故障判定树表示的知识,以IF-THEN的形式给出故障判定规则;
[0012] S7对实时采集到的风力发电机组运行参数,重复步骤S1、S2、S3,对处理后的数据利用步骤S6提取到的故障诊断规则进行故障诊断,并对诊断结果予以显示。
[0013] 所述的步骤S2中进行幅值域分析的振动信号包括:计算峰值、有效值、峭度、偏度、波
[0014] 形因子、峰值因子、脉冲因子、裕度因子参数。
[0015] 所述的步骤S4包括:
[0016] S4-1创建节点S;
[0017] S4-2如果所有数据样本都属于同一故障类型A,则返回S作为叶节点,并标记为故障类型A;
[0018] S4-3否则,选择所有参数中具有最高信息增益的参数t,参数t成为节点S的“测试”参数;
[0019] S4-4对测试参数的每个区间划分创建一个分支,并据此划分样本;
[0020] S4-5重复以上过程,递归形成每个划分上的样本判定树;
[0021] S4-6递归划分步骤仅当下列条件之一成立时停止:给定节点的所有样本属于同一故障类
[0022] 型;没有剩余参数可以用来进一步划分样本;分支没有样本。
[0023] 所述的步骤S4-3中选择所有参数中具有最高信息增益的参数t方法如下:
[0024] 设数据样本集合为{s1,s2,s3,…sn},故障类型共m种,分别为C1,C2,C3,…Cm,属于不同故障类型的样本数据分别为q1,q2,q3,…qm,且满足∑qi=n。计算对给定样本分类所需的期望信息I为
[0025] I=I(q1,q2,q3,…qm)=∑pilog2(pi)=∑(qi/s)log2(qi/s)
[0026] 对数据样本集合{s1,s2,s3,…ss}的参数r,构造集合R:{r1,r2,r3,…,rl},其中l≦s;
[0027] 用r*= (ri+ri+1)/2对 集 合 和 作 一 个 划 分:R1= {r1,r2,r3,…ri},R2 =* *
{ri+1,ri+2,ri+3,…,rl},使R1中的元素均小于r,R2中的元素大于等于r ;
[0028] 分别统计属于R1、R2的样本中各故障类型的总数,分别记为r11,r12,r13,…,r1m;
r21,r22,r23,…,r2m;
[0029] 对r*的划分计算子集的期望信息E:
[0030] E=(r01)/s*∑(r1j/r01)*log2(r1j/r01)+(r02)/s*∑(r2j/r02)*log2(r2j/r02)[0031] 其中r01=∑r1i,r02=∑r2i;
[0032] 遍历r*=(ri+ri+1)/2,i=1,2,3,…,l-1.记使划分子集期望最大的r*为r*0,此*0
时,对用参数r的r 对集合{s1,s2,s3,…ss}进行划分,具有最大的信息增益;
[0033] 遍历所有参数,获得对集合{s1,s2,s3,…ss}具有最大信息增益的参数t和划分点*0
t 。
[0034] 所述的步骤S5包括:使用统计度量,剪去最不可靠的分支。
[0035] 所述的步骤S6包括:对从根到树叶的每条路径创建一条故障判定规则,沿着给定路径上的每个参数区间形成规则前件,即IF部分;叶节点包含的故障类型预测,形成规则后件,即THEN部分。
[0036] 有益效果:本发明可及时并有效地确定风力发电机组发生故障的部件,确定故障类型及故障原因,防止故障恶化而产生重大事故。
附图说明
[0037] 下面结合附图对本发明进一步说明。
[0038] 图1是风力发电机组故障诊断软件程序框图;
[0039] 图2为判定树示意图。
具体实施方式
[0040] 下面结合附图对本发明基于数据挖掘的风力发电机组故障诊断方法的工作原理和工作过程作详细的说明。
[0041] 针对现有的风力发电机组状态监测与故障诊断系统不能较好地完成风力发电机组故障诊断的任务,本发明采用数据挖掘的方法,对风力发电机组的实时监测数据进行数据分析,判断风力发电机组是否处于正常运行状态,对发生故障的风力发电机组判断故障发生的部位,给出故障原因并报警,防止故障恶化。
[0042] 本发明的基于数据挖掘的风力发电机组故障诊断方法实施例,包括以下步骤:
[0043] ①对采集的风力发电机组参数进行数据预处理:数据清理,包括消除数据噪声、处理空缺值;
[0044] ②对采集得到的风力发电机组振动信号进行幅值域分析,计算峰值、有效值、峭度、偏度、波形因子、峰值因子、脉冲因子、裕度因子等参数;
[0045] ③对采集到的风力发电机组性能参数和计算得到的振动参数进行相关性分析,除去对故障诊断没有效果的冗余参数;
[0046] ④对不同故障类型的数据样本建立故障判定树:1.创建节点S;2.如果所有数据样本都属于同一故障类型A,则返回S作为叶节点,并标记为故障类型A;3.否则,选择所有参数中具有最高信息增益的参数t,参数t成为节点S的“测试”参数;4.对测试参数的每个区间划分创建一个分支,并据此划分样本;5.重复以上过程,递归形成每个划分上的样本判定树;6.递归划分步骤仅当下列条件之一成立时停止:给定节点的所有样本属于同一故障类型;没有剩余参数可以用来进一步划分样本;分支没有样本。
[0047] ⑤对于创建好的故障判定树,采用后剪枝方法以消除数据中的噪声和孤立点带来的训练异常。该方法通过删除节点的分支,剪掉树节点,进而防止判定树过分地适应样本数据。该方法使用统计度量,剪去最不可靠的分支,可提高判定树独立于测试数据正确分类的能力。
[0048] ⑥对于剪完枝的故障判定树,提取判定树表示的知识,以IF-THEN的形式给出故障判定规则。对从根到树叶的每条路径创建一条故障判定规则,沿着给定路径上的每个参数区间形成规则前件,即IF部分;叶节点包含的故障类型预测,形成规则后件,即THEN部分。这样,即可对所有的风力发电机组故障类型形成故障诊断规则。
[0049] ⑦对实时采集到的风力发电机组运行参数,重复步骤①、②、③,对处理后的数据利用⑥提取到的故障诊断规则进行故障诊断,并对分类结果予以显示。
[0050] 对于④中的第3步:选择所有参数中具有最高信息增益的参数t,其具体方法如下:
[0051] 设数据样本集合为{s1,s2,s3,…sn},故障类型共m种,分别为C1,C2,C3,…Cm,属于不同故障类型的样本数据分别为q1,q2,q3,…qm,且满足∑qi=n。计算对给定样本分类所需的期望信息I为
[0052] I=I(q1,q2,q3,…qm)=∑pilog2(pi)=∑(qi/s)log2(qi/s)
[0053] 对数据样本集合{s1,s2,s3,…ss}的参数r,构造集合R:{r1,r2,r3,…,rl},其中*
l≦s。用r =(ri+ri+1)/2对集合和作一个划分:R1={r1,r2,r3,…ri},R2={ri+1,ri+2,ri+3,…* *
,rl},使R1中的元素均小于r,R2中的元素大于等于r。分别统计属于R1、R2的样本中各故*
障类型的总数,分别记为r11,r12,r13,…,r1m;r21,r22,r23,…,r2m。对r 的划分计算子集的期望信息E:
[0054] E=(r01)/s*∑(r1j/r01)*log2(r1j/r01)+(r02)/s*∑(r2j/r02)*log2(r2j/r02)[0055] 其中r01=∑r1i,r02=∑r2i。遍历r*=(ri+ri+1)/2,i=1,2,3,…,l-1.记使划* *0 *0
分子集期望最大的r 为r ,此时,对用参数r的r 对集合{s1,s2,s3,…ss}进行划分,具有最大的信息增益。遍历所有参数,获得对集合{s1,s2,s3,…ss}具有最大信息增益的参数t*0
和划分点t 。