著录项信息
专利名称 | 基于偏最小二乘回归的疏浚作业产量预测模型建立方法 |
申请号 | CN201410340375.2 | 申请日期 | 2014-07-16 |
法律状态 | 驳回 | 申报国家 | 中国 |
公开/公告日 | 2014-10-29 | 公开/公告号 | CN104123451A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F19/00 | IPC分类号 | G06F19/00查看分类表>
|
申请人 | 河海大学常州校区 | 申请人地址 | 江苏省常州市新北区晋陵北路2***
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 河海大学常州校区 | 当前权利人 | 河海大学常州校区 |
发明人 | 李凯凯;许焕敏;穆乃超;宋庆峰;周玉刚 |
代理机构 | 南京纵横知识产权代理有限公司 | 代理人 | 董建林 |
摘要
本发明公开了一种基于偏最小二乘回归的疏浚作业产量预测模型建立方法,采取一种先进的多元回归分析方法,通过将自变量和因变量的高维数据空间投影到相应的低维特征空间,分别得到自变量与因变量的相互正交的特征向量,再建立自变量和因变量的特征向量间的线性回归关系。它在选取特征向量时强调自变量对因变量的解释和预测作用,去除了对回归无益的噪声的影响,使模型包含最小的变量数,因而其模型具有较好的鲁棒性和预测的稳定性。可为疏浚作业产量的优化研究打下理论基础,达到高效率、高产量、低能耗的目的,对挖泥船进行产量预测具有重要意义。
1.基于偏最小二乘回归的疏浚作业产量预测模型建立方法,其特征在于,包括以下步骤:
步骤(1):收集影响疏浚作业产量因素变量的数据资料,确定p个分析变量,列出因变量与自变量样本矩阵;其中,p为正整数;
步骤(2):对样本矩阵进行标准化处理;
步骤(3):根据标准样本矩阵,提取主成分;
步骤(4):根据提取主成分终止判断准则,依次计算出主成分对自变量、因变量信息的解释能力;
步骤(5):确定主成分个数;
步骤(6):根据主成分个数,建立回归预测方程。
2.根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法,其特征在于,所述步骤(1)中的样本矩阵如下:
设对p个自变量x1,x2,…xp和q个因变量y1,y2,…yq行了n次观测,分别记自变量与因变量的“样本点×变量”型的数据矩阵为:
X=(xij)n×p=(x1,x2,...xp),i=1,2...,n;j=1,2,...pY=(yij)n×q=(y1,y2,...yq),i=1,2...,n;j=1,2,...q。
3.根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法,其特征在于,所述步骤(2)中矩阵标准化处理过程如下:
记标准化后的数据矩阵为:
E0=(eij)n×p和F0=(fij)n×q
其中
(1-1)
(1-2)
式中(1-1)和式中(1-2)中, 分别为矩阵X与Y的第j列数据的平均值,sxj,syj为矩阵X与Y的第j列数据的标准差。
4.根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法,其特征在于,步骤(3)中主成分提取的计算步骤如下:
①第一轮主成分提取
求矩阵 的最大特征值所对应单位特征向量w1,得自变量的第一个主成分,i1=E0w1
求矩阵 的最大特征值所对应单位特征向量c1,得因变量的第一个主成分,u1=F0c1
求残差矩阵
式中(1-3)中 式中(1-4)中
②新一轮主成分提取
令E0=E1,F0=F1,对残差矩阵进行新一轮的主成分提取
设第h步的计算结果为
th=Eh-1wh (1-5)
uh=Fh-1ch (1-6)
式(1-5)~(1-8)中, 。
5.根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法,其特征在于,所述步骤(4)中的提取主成分终止判断准则采用复测定系数准则,由统计量
评价自变量系统的前h个主成分是否对因变量Y系统有足够的解释能力;
复测定系数 度量的是由前h个主成分构建的回归方程能够解释的变异信息量占总变异的百分比,当h=m且复测定系数 的值足够大时,可在第m步终止主成分提取计算,其中
在复测定系数 的应用中,参考统计量
值的大小, 度量的是自变量X系统被提取的变异信息量。
6.根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法,其特征在于,所述步骤(4)中主成分对自变量、因变量信息的解释能力的计算过程如下:
2
记ρ(yj;th)是主成分th与因变量yj的简单相关系数的平方,th对因变量系统Y的解释能力:
2
Rd(yj;th)=ρ(yj;th)
(1-11)
t1,t2,...,tm对因变量系统Y的累计解释能力:
依据式(1-11)~(1-13),计算各主成分对因变量Y的解释能力;
2
记ρ(xj;th)是主成分th与自变量xj的简单相关系数的平方,th对自变量系统X的解释能力:
2
Rd(xj;th)=ρ(xj;th)
(1-14)
t1,t2,...,tm对自变量系统X的累计解释能力
依据式(1-14)~(1-16)计算各主成分对自变量X的解释能力。
7.根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法,其特征在于所述步骤(5)中主成分个数的确定如下:
分别绘制主成分和主成分对因变量Y解释能力总信息及自变量X解释能力总信息柱状图,找出Rdh(Cum)≥85%时,两者的主成分个数,然后对其两者取主成分个数交集。
8.根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法,其特征在于,所述步骤(6)中根据主成分个数,建立回归预测方程过程如下:
①建立F0关于主成分t1,t2,...,tm的多元线性回归方程
②变换为关于标准化变量的PLS回归方程
将 代入方程(1-17),得F0关于E0的PLS回归方程
其中, 为单位矩阵。
③还原为关于原始变量的PLS回归方程
将方程(1-18)还原成关于原始变量的PLS回归方程
其中,ak是矩阵 的第k个列向量,aki是ak的第i个分量,i=1,2,…,m,k二1,2,...,q。
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2007-08-22
|
2006-02-14
| | |
2
| |
2014-08-20
|
2014-05-26
| | |
3
| |
2011-01-19
|
2010-09-02
| | |
4
| |
2015-12-23
|
2013-01-11
| | |
5
| | 暂无 |
2007-09-12
| | |
6
| | 暂无 |
2003-05-30
| | |
7
| |
2011-05-25
|
2010-12-10
| | |
8
| |
2011-07-06
|
2011-02-28
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 1 | | 2015-06-29 | 2015-06-29 | | |
2 | | 2016-01-22 | 2016-01-22 | | |
3 | | 2016-01-22 | 2016-01-22 | | |
4 | | 2016-11-16 | 2016-11-16 | | |
5 | | 2015-06-29 | 2015-06-29 | | |
6 | | 2015-07-14 | 2015-07-14 | | |