著录项信息
专利名称 | 基于超像素和最大边界分布的高光谱数据降维方法 |
申请号 | CN201510508697.8 | 申请日期 | 2015-08-18 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2015-11-04 | 公开/公告号 | CN105023239A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06T3/00 | IPC分类号 | G;0;6;T;3;/;0;0查看分类表>
|
申请人 | 西安电子科技大学 | 申请人地址 | 陕西省西安市太白南路2号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 西安电子科技大学 | 当前权利人 | 西安电子科技大学 |
发明人 | 杨淑媛;周红静;王敏;冯志玺;刘志;刘红英;马晶晶;马文萍;侯彪;李素婧 |
代理机构 | 陕西电子工业专利中心 | 代理人 | 田文英;王品华 |
摘要
本发明公开了一种基于超像素和最大边界分布的高光谱数据降维方法,克服了现有技术因缺乏足够空域和谱域信息,波段间相关性大的缺点。本发明实现的步骤是:(1)划分样本集合;(2)生成正则矩阵;(3)生成判别矩阵;(4)求解最优投影矩阵;(5)投影降维。本发明具有保持近邻样本空间和谱间一致性,减少冗余的波段的优点,可用于高光谱遥感影像的降维。
1.一种基于超像素和最大边界分布的高光谱数据降维方法,其特征在于,包括如下步骤:
(1)划分样本集合:
(1a)从高光谱数据样本集中随机选取40%的样本作为训练样本集;
(1b)从训练样本集的每类中,按标记-训练样本集比选取样本,组成标记样本集;
(2)生成正则矩阵:
(2a)采用超像素分割图像的方法,将训练样本集分割成500个超像素;
(2b)按照下式,计算包含第q类标记样本的超像素的均值:
其中,xq表示包含第q类标记样本的超像素的均值,Nq表示包含第q类标记样本的超像素中的所有像素的总数,q=1,2,...,c,c表示标记样本集的类别总数,∑表示求和操作, 表示包含第m个标记样本的超像素中的第n个像素,m=1,2,...,g,g表示每类标记样本的总数,n=1,2,...,Nm,Nm表示包含第m个标记样本的超像素中的所有像素的总数;
(2c)按照下式,生成基于超像素的正则矩阵:
其中,R表示基于超像素的正则矩阵,∑表示求和操作,q表示包含标记样本集的超像素的均值的索引值,q的取值范围为{1,2...,c},c表示标记样本集的类别总数,m表示超像素中标记样本的索引值,m的取值范围为{1,2...,g},g表示每类标记样本的总数,n表示超像素中像素的索引值,n的取值范围为{1,2...,Nm},Nm表示包含第m个标记样本的超像素中的所有像素的总数, 表示包含第m个标记样本的超像素中的第n个像素,xq表示包含第q类标记样本的超像素的均值,T表示转置符号;
(3)生成判别矩阵:
按照下式,生成基于最大边界分布准则的判别矩阵:
其中,Z表示基于最大边界分布准则的判别矩阵,∑表示求和操作,g表示每类标记样本的总数,u表示标记样本集中标记样本的索引值,b表示标记样本集中与du异类的标记样本的总数,k表示标记样本集中与du异类的标记样本的索引值,du表示每类标记样本中的第u个标记样本,vk表示标记样本集中与du异类的第k个标记样本,a表示标记样本集中与du同类的标记样本的总数,yh表示标记样本集中与du同类的第h个标记样本,T表示转置操作;
(4)求解最优投影矩阵:
采用特征值分解方法,求解最优投影矩阵;
(5)投影降维:
将最优投影矩阵和高光谱数据样本集的矩阵相乘,得到高光谱数据样本集的降维矩阵。
2.根据权利要求1所述的基于超像素和最大边界分布的高光谱数据降维方法,其特征在于:步骤(1b)所述的标记-训练样本集比是在1/120~1/10范围内选取。
基于超像素和最大边界分布的高光谱数据降维方法\n技术领域\n[0001] 本发明属于图像处理技术领域,更进一步涉及一种信息提取和机器学习技术领域中一种基于超像素和最大边界分布的高光谱数据降维方法。本发明可用于对高光谱数据进行降维与分类,减少冗余的波段,更准确地判定高光谱中不同类别的地物。\n背景技术\n[0002] 目前在高光谱遥感影像领域中,对高光谱数据进行降维处理的方法通常分为两类:特征提取和特征选择的方法。特征提取方法利用原始数据提取其特征参数,通过数学变换压缩波段,将数据投影到低维空间,常见的方法有主成分分析和线性判别分析。特征选择方法是在原始数据众多波段中选择感兴趣的若干波段或选择信息量大和相关性小的若干波段。\n[0003] Zhang X,He Y,Zhou N等人在其发表的论文“Semisupervised Dimensionality Reduction of Hyperspectral Images via Local Scaling Cut Criterion”(IEEE Geoscience and Remote Sensing Letters,vol.10,no.6,pp.1547-1551,2013)中提出一种基于局部缩放比例原则的半监督高光谱降维方法。该方法首先根据局部缩放比例的原则,提取高光谱数据的局部信息;在投影后的子空间中,约束来自不同类别的样本分离,而来自相同类别的样本聚集,找到一个最优投影。该方法存在的不足之处是,由于该方法只是利用高光谱数据间的谱域信息,缺少高光谱数据的空域信息,影响了高光谱图像的分类识别率。\n[0004] 哈尔滨工业大学在其申请的专利“基于距离计算的高光谱图像顺次波段选择的方法”(申请号:201210140052.X申请日:2012-05-08公开号:102663439A)中公开了一种基于距离计算的高光谱遥感图像波段选择方法。该方法首先选择第1个典型波段:计算每个波段向量的长度,即波段端点到原点的距离,选出对应于最大长度的波段作为第1个典型波段;\n然后选择第2个典型波段:计算其他每个波段到第1个典型波段的距离,选出对应最大距离的波段作为第2个典型波段;依次类推,选择第i个典型波段,其中i=1,2,...,d,d为典型波段的个数。该方法存在的不足之处是,由于缺少高光谱数据中近邻样本的谱域信息,波段相关性和数据信息量不可兼得,所以在最大信息量的条件下,会导致波段间相关性大,影响分类识别率。\n发明内容\n[0005] 本发明的目的在于针对上述已有技术的不足,提出一种基于超像素和最大边界分布的高光谱数据降维方法。本发明可充分利用样本间空域和谱域信息,减少冗余的波段,保持高光谱图像的局部一致性,实现对高光谱遥感数据的高效分类。\n[0006] 为实现上述目的,本发明实现的具体步骤如下:\n[0007] (1)划分样本集合:\n[0008] (1a)从高光谱数据样本集中随机选取40%的样本作为训练样本集;\n[0009] (1b)从训练样本集的每类中,按标记-训练样本集比选取样本,组成标记样本集;\n[0010] (2)生成正则矩阵:\n[0011] (2a)采用超像素分割图像的方法,将训练样本集分割成500个超像素;\n[0012] (2b)按照下式,计算包含第q类标记样本的超像素的均值:\n[0013]\n[0014] 其中,xq表示包含第q类标记样本的超像素的均值,Nq表示包含第q类标记样本的超像素中的所有像素的总数,q=1,2,...,c,c表示标记样本集的类别总数,Σ表示求和操作,表示包含第m个标记样本的超像素中的第n个像素,m=1,2,...,g,g表示每类标记样本的总数,n=1,2,...,Nm,Nm表示包含第m个标记样本的超像素中的所有像素的总数;\n[0015] (2c)按照下式,生成基于超像素的正则矩阵:\n[0016]\n[0017] 其中,R表示基于超像素的正则矩阵,Σ表示求和操作,q表示包含标记样本集的超像素的均值的索引值,q的取值范围为{1,2...,c},c表示标记样本集的类别总数,m表示超像素中标记样本的索引值,m的取值范围为{1,2...,g},g表示每类标记样本的总数,n表示超像素中像素的索引值,n的取值范围为{1,2...,Nm},Nm表示包含第m个标记样本的超像素中的所有像素的总数, 表示包含第m个标记样本的超像素中的第n个像素,xq表示包含第q类标记样本的超像素的均值,T表示转置符号;\n[0018] (3)生成判别矩阵:\n[0019] 按照下式,生成基于最大边界分布准则的判别矩阵:\n[0020]\n[0021] 其中,Z表示基于最大边界分布准则的判别矩阵,Σ表示求和操作,g表示每类标记样本的总数,u表示标记样本集中标记样本的索引值,b表示标记样本集中与du异类的标记样本的总数,k表示标记样本集中与du异类的标记样本的索引值,du表示每类标记样本中的第u个标记样本,vk表示标记样本集中与du异类的第k个标记样本,a表示标记样本集中与du同类的标记样本的总数,yh表示标记样本集中与du同类的第h个标记样本,T表示转置操作;\n[0022] (4)求解最优投影矩阵:\n[0023] 采用特征值分解方法,求解最优投影矩阵;\n[0024] (5)投影降维:\n[0025] 将最优投影矩阵和高光谱数据样本集的矩阵相乘,得到高光谱数据样本集的降维矩阵。\n[0026] 本发明与现有技术相比具有以下优点:\n[0027] 第一,由于本发明采用了超像素分割图像的方法,对训练样本集进行分割,克服了现有技术因缺乏足够空域信息而无法精确地对高光谱图像分类的缺点,使得本发明具有了保持近邻样本空间一致性的优点。\n[0028] 第二,由于本发明采用了最大边界分布准则,对训练样本集进行投影,克服了现有技术中因缺乏谱域的近邻信息,在最大信息量的条件下,会导致波段间相关性大的缺点,使得本发明具有保持谱间一致性,减少冗余的波段,分类识别率高的优点。\n附图说明\n[0029] 图1是本发明的流程图;\n[0030] 图2是本发明采用的高光谱数据IndianPines的真实地物分布图及其真实标记图。\n具体实施方式\n[0031] 下面结合附图对本发明做进一步的描述。\n[0032] 参照附图1,对本发明的具体实现步骤做进一步的描述。\n[0033] 步骤1,划分样本集合。\n[0034] 从高光谱数据样本集中随机选取40%的样本,作为训练样本集X,X的取值范围为:\nX∈RD×M,其中,Rn表示n维实数空间,D表示训练样本集中样本的维数,M表示训练样本集中样本的总数,∈表示属于操作。\n[0035] 在本发明的实施例中,高光谱数据样本集为印第安松树Indian Pines数据样本集,训练样本集中样本的维数D为200,训练样本集中样本的总数M为4156。\n[0036] 从训练样本集的每类中按标记-训练样本集比选取样本组成标记样本集A,A的取值范围为:A∈RD×L,其中,Rn表示n维实数空间,D表示训练样本集中样本的维数,L表示标记样本集中样本的总数,∈表示属于操作。\n[0037] 在本发明的实施例中,标记-训练样本集比为1/70,训练样本集中样本的维数D为\n200,标记样本集中样本的总数L为64。\n[0038] 步骤2,生成正则矩阵。\n[0039] 采用简单线性迭代簇聚类SLIC方法,将训练样本集分割成500个超像素。简单线性迭代簇聚类SLIC方法具体步骤如下:\n[0040] 第一步,从训练样本集中随机选取500个样本作为500个簇各自的中心样本。\n[0041] 第二步,按照下式,计算训练样本集中剩余的样本与500个簇各自的中心样本的相似性:\n[0042] d=(x-y)(x-y)T\n[0043] 其中,d表示训练样本集中剩余的样本x与500个簇各自的中心样本y的相似性,x表示训练样本集中剩余的样本,y表示500个簇各自的中心样本,T表示转置操作。\n[0044] 第三步,从500个簇各自的中心样本中,选择与训练样本集中剩余的样本最相似的中心样本,将其划分到该中心样本所在的簇。\n[0045] 第四步,按照下式,更新第p个簇的中心:\n[0046]\n[0047] 其中,Ep表示第p个簇的中心,Σ表示求和操作,w表示第p个簇中样本的总数,r表示训练样本集中样本x的索引值,r的取值范围:{1,2,...,w},xr表示第r个训练样本集中的样本。\n[0048] 第五步,重复执行第2步、第3步和第四步500次,获取训练样本集的超像素。\n[0049] 按照下式,计算包含第q类标记样本的超像素的均值:\n[0050]\n[0051] 其中,xq表示包含第q类标记样本的超像素的均值,Nq表示包含第q类标记样本的超像素中的所有像素的总数,q=1,2,...,c,c表示标记样本集的类别总数,Σ表示求和操作,表示包含第m个标记样本的超像素中的第n个像素,m=1,2,...,g,g表示每类标记样本的总数,n=1,2,...,Nm,Nm表示包含第m个标记样本的超像素中的所有像素的总数。\n[0052] 按照下式,生成基于超像素的正则矩阵:\n[0053]\n[0054] 其中,R表示基于超像素的正则矩阵,Σ表示求和操作,q表示包含标记样本集的超像素的均值的索引值,q的取值范围为{1,2...,c},c表示标记样本集的类别总数,m表示超像素中标记样本的索引值,m的取值范围为{1,2...,g},g表示每类标记样本的总数,n表示超像素中像素的索引值,n的取值范围为{1,2...,Nm},Nm表示包含第m个标记样本的超像素中的所有像素的总数, 表示包含第m个标记样本的超像素中的第n个像素,xq表示包含第q类标记样本的超像素的均值,T表示转置符号。\n[0055] 步骤3,生成判别矩阵。\n[0056] 按照下式,生成基于最大边界分布准则的判别矩阵:\n[0057]\n[0058] 其中,Z表示判别矩阵,Σ表示求和操作,g表示每类标记样本的总数,u表示标记样本集中标记样本的索引值,b表示标记样本集中与du异类的标记样本的总数,k表示标记样本集中与du异类的标记样本的索引值,du表示每类标记样本中的第u个标记样本,vk表示标记样本集中与du异类的第k个标记样本,a表示标记样本集中与du同类的标记样本的总数,yh表示标记样本集中与du同类的第h个标记样本,T表示转置操作。\n[0059] 步骤4,求解最优投影矩阵。\n[0060] 采用特征值分解方法求解最优投影矩阵,根据步骤2得到的正则矩阵R和步骤3得到的判别矩阵Z,对Z-λR进行特征值分解,得到的前d个最大的特征值对应的特征向量组成最优投影矩阵,使得在投影后的子空间中,来自不同类别的样本分离,而来自相同类别的样本聚集,其中,λ表示正则参数,用来平衡判别项和正则项之间的权重,d为降维后的高光谱数据样本集中样本的维数。\n[0061] 在本发明的实施例中,正则参数λ取值为0.4,降维后的高光谱数据样本集中样本的维数l取值为60。\n[0062] 步骤5,投影降维。\n[0063] 将最优投影矩阵和高光谱数据样本集的矩阵相乘,得到高光谱数据样本集的降维矩阵。采用分类方法对降维后的高光谱数据样本集分类。\n[0064] 在本发明的实施例中,采用的分类方法为K近邻方法,K的取值为1。\n[0065] 下面结合仿真实验对本发明的效果做进一步说明。\n[0066] 1.仿真实验条件:\n[0067] 本发明仿真实验的硬件测试平台是:处理器为Intel Core2 CPU,主频为2.33GHz,内存2GB,软件平台为:Windows XP操作系统和Matlab R2012a。本发明的输入图像为高光谱图像印第安松树Indian Pines,图像大小为145×145×220,图像共包含220个波段和16类地物,图像格式为TIF。\n[0068] 图2为本发明采用的高光谱数据IndianPines的真实地物分布图及其真实标记图。\n其中,图2(a)为输入的高光谱图像印第安松树Indian Pines的真实地物分布图,图2(b)为输入的高光谱图像印第安松树Indian Pines的真实标记图。\n[0069] 2.仿真实验内容:\n[0070] 本发明用到的四个现有技术对比降维方法分别如下:\n[0071] Jolliff等人在“Principal component analysis.Wiley Interdisciplinary Reviews:Computational Statistics,2(4):433-459,2010”中提出的高光谱图像降维方法,简称主成分分析PCA方法。\n[0072] Welling等人在“Fisher linear discriminant analysis.Department of Computer Science,University of Toronto,2005”中提出的高光谱图像降维方法,简称Fisher线性判别分析FLDA方法。\n[0073] Zhang等人在“Efficient and robust feature extraction by maximum margin criterion”.IEEE Transactions on Neural Networks,vol.17.no.1,pp.157-165,2006”中提出的高光谱图像降维方法,简称最大化边界准则MMC方法。\n[0074] Wang等人在“MarginFace:A novel face recognition method by average neighborhood margin maximization”.Pattern Recognition,vol.42,no.11,pp.2863-\n2875,2009”中提出的高光谱图像降维方法,简称平均近邻最大化边界ANMM方法。\n[0075] 在本仿真实验中,采用总精度(OA)指标来评价本发明方法的性能,该指标表示正确分类的样本占所有样本的比例,值越大,说明分类效果越好。\n[0076] 3.仿真实验结果分析:\n[0077] 本仿真实验采用本发明和现有降维方法对仿真实验数据降维,采用K近邻方法对仿真实验数据分类,其中,K的取值为1。\n[0078] 表1给出了采用本发明和现有技术的主成分分析PCA方法、Fisher线性判别分析FLDA方法、最大化边界准则MMC方法、平均近邻最大化边界ANMM方法对仿真实验数据降维,采用K近邻方法对仿真实验数据分类,分别得到的最优识别率,其中,K的取值为1。\n[0079] 表1:本发明与现有降维方法的对比结果\n[0080]\n方法 本发明 PCA FLDA MMC ANMM\n总精度OA 72.16% 47.14% 62.19% 51.33% 67.79%\n[0081] 从表1可以看出,现有技术的主成分分析PCA方法的分类结果比较差,主要因为该方法缺少了高光谱图像的邻域信息,使得分类结果很差;同时现有技术的Fisher线性判别分析FLDA方法、最大化边界准则MMC方法和平均近邻最大化边界ANMM方法的分类结果有很大改善,错分率有所下降,但这三种方法只利用了谱域的近邻信息,不能充分挖掘图像的空域信息,所以依然不能更好的提取有用波段,存在图像错分的现象;本发明充分利用了遥感数据中空域和谱域的信息,在定量分析方面优于前三种现有技术降维方法,取得更好的分类效果。\n[0082] 以上仿真实验表明,本发明能够充分利用样本的空域信息和谱域信息,保持近邻样本空间和谱间的一致性,能够在最大信息量的条件下,减少冗余的波段,具有更好的分类识别率。
法律信息
- 2018-03-13
- 2015-12-02
实质审查的生效
IPC(主分类): G06T 3/00
专利申请号: 201510508697.8
申请日: 2015.08.18
- 2015-11-04
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2014-08-27
|
2014-05-20
| | |
2
| |
2013-01-30
|
2012-09-27
| | |
3
| |
2013-12-04
|
2013-07-22
| | |
4
| |
2010-08-25
|
2010-04-30
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |