著录项信息
专利名称 | 高光谱遥感数据鉴别特征提取方法 |
申请号 | CN200910250850.6 | 申请日期 | 2009-12-30 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2010-07-07 | 公开/公告号 | CN101770584A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06K9/66 | IPC分类号 | G;0;6;K;9;/;6;6;;;G;0;1;S;7;/;4;8查看分类表>
|
申请人 | 重庆大学 | 申请人地址 | 重庆市沙坪坝区沙正街174号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 重庆大学 | 当前权利人 | 重庆大学 |
发明人 | 黄鸿;李见为;马泽忠;冯海亮;何同弟;相入喜 |
代理机构 | 重庆博凯知识产权代理有限公司 | 代理人 | 张先芸 |
摘要
本发明提供一种高光谱遥感数据鉴别特征提取方法,包括如下步骤:高光谱遥感图像数据读入计算机;将读入的高光谱遥感图像中每一个数据点根据其波段生成一个向量,从而整幅高光谱遥感图像构成一个矩阵,作为训练样本集;从训练样本集中选取部分数据点进行已知地物类别的标注,生成样本类别标签;在部分数据点的地物类别已知的前提下,通过训练样本集构建相似图和相异图来度量数据点的相似性与相异性;根据构建的相似图和相异图分别计算权重矩阵;计算局部相似结构矩阵和相异结构矩阵;通过目标优化函数计算投影矩阵;通过投影矩阵将高光谱遥感数据投影到低维嵌入空间,实现高光谱数据鉴别特征的提取。它有效解决高光谱数据中的本征流形结构和鉴别特征提取问题。
高光谱遥感数据鉴别特征提取方法\n技术领域\n[0001] 本发明涉及高光谱数据处理方法与应用技术领域,具体涉及一种高光谱遥感数据鉴别特征提取方法。\n背景技术\n[0002] 高光谱遥感是20世纪最后二十年人类在对地观测方而取得的重大技术突破之一。它在成像过程中以极高的光谱分辨率用上百个连续窄光谱波段描述一个像元,在提供每一波段区间图像的同时,对每一像素产生一条完整而连续的光谱曲线。高光谱遥感图像包含了丰富的空间、辐射和光谱三重信息,在相关领域具有广泛的应用和发展空间。高光谱数据的特点如下:a)图谱合一:在获取数百个光谱图像的同时,可以显示图像中每个像元的连续光谱;b)海量数据:高光谱的波段一般都是上百个,未来甚至能达到千以上;c)数据冗余度高:成像光谱仪采样间距一般都在纳米级,造成了相邻波段的高度相关性,冗余度也随之增加;d)信噪比低:高光谱数据信噪比下降,噪声增加,增加了数据处理的难度。\n[0003] 由于高光谱数据具有数据量大、含混度高、地面样本数据少的特点,使用传统算法对其进行分类时性能不够理想。为此而提出的技术举措主要包括两方面,一是维数约简,力图从高光谱数据中提取出具有重要信息的特征,目前常用的技术包括主成分分析(PrincipalComponent Analysis,简称PCA)、线性判别分析(Linear Discriminant Analysis,简称LDA)、光谱指纹等;二是寻求或改进更有效的分类算法,目前常用的分类算法包括最小距离分类、贝叶斯分类、二进制编码分类、光谱角映射分类等。虽然高光谱遥感携带的信息量增多,理论上讲其辨识不同类别的能力更强,但是由于其数据量的剧增,并且数据之间存在很大的冗余,带来处理上的困难。尤其在样本不是很多的情况下,用很多特征进行分类器设计,无论是计算的复杂程度还是分类器的性能来看都是不适宜的。因此,在不损失有用信息的前提下,减少数据维数,提取有效信息对于高光谱遥感图像的处理是极其必要的。\n[0004] 在高光谱遥感图像处理中,维数约简即在尽可能地保留数据信息的同时,对波段进行压缩。目前压缩波段有两种方法:i)特征选择,在全部数据集中选择若干能包含原数据最大信息的特征,即从众多波段中选择感兴趣的若干波段,或选择信息量大、相关性小的若干波段;ii)特征提取,从原始数据中提取其特征参数,以满足后续处理要求,即利用所有波段,通过数学变换来压缩波段。而对原始高光谱图像的数据分析可以看出,含信息量较多的那些波段有很强的相关性,而相关性较弱的波段含的有用信息又非常少,所以不能从原始波段中直接选出一个子集来进行分类处理,只有通过某种映射关系将原始高维空间压缩到低维空间。\n[0005] PCA与LDA是最为常用的两种线性特征提取方法。PCA以最大化方差为准则,能够在均方误差最小意义下最优表达数据,却不适合于分类。LDA以最大化类间离散度矩阵与类内离散度矩阵之比为准则,通过求解广义瑞利商问题获得投影矩阵。但LDA算法也存在缺陷,例如只能提取比已标注类别数少的特征,没有考虑类别方差的差异性,而且小样本问题会使算法失效。\n[0006] 近年来,研究发现高光谱影像可以由一些连续的变量来参数化,也就是说,高光谱影像在本质上属于低维子流形。这意味着,传统线性特征提取方法由于不能有效发现高光谱数据中的本征流形结构,并不能有效的实现高光谱数据的维数约简;并且现实中数据的有用特征往往不一定是特征的线性组合,也使得线性方法在这样的场合中不适用。\n[0007] 流形学习方法也是常用的维数约简方法。传统的流形学习方法主要分为无监督流形学习方法和监督流形学习方法。无监督流形学习方法主要目标是保持数据间的几何结构,并不适合于分类,对于高光谱数据不适用。监督流形学习方法则需要对样本数据中的所有数据进行标注,以提供给待检测数据进行学习;然而在许多机器学习方法中,能够标注的数据时相对有限的,特别是高光谱遥感数据,因其数据量大、冗余度高、信噪比低,一幅高光谱遥感图中可供标注地物数据非常有限,根本无法实现样本数据的全部标注以提供学习。\n发明内容\n[0008] 针对现有技术存在的上述不足,本发明的目的在于提供一种能有效发现高光谱数据中的本征流形结构,融合半监督学习和流形学习的高光谱遥感数据鉴别特征提取方法。\n[0009] 本发明的目的是这样实现的:高光谱遥感数据鉴别特征提取方法,包括如下步骤:\n[0010] 1)将高光谱遥感图像数据读入计算机;\n[0011] 2)将读入的高光谱遥感图像中每一个数据点根据其波段生成一个向量,从而整幅高光谱遥感图像构成一个矩阵,作为训练样本集;\n[0012] 3)从训练样本集中选取部分数据点进行已知地物类别的标注,生成样本类别标签;\n[0013] 4)在部分数据点的地物类别已知的前提下,结合训练样本集中的未标注数据点构建相似图和相异图来度量数据点的相似性与相异性;\n[0014] 5)根据构建的相似图和相异图分别计算权重矩阵;\n[0015] 6)计算局部相似结构矩阵和相异结构矩阵;\n[0016] 7)通过目标优化函数计算投影矩阵;\n[0017] 8)通过投影矩阵将高光谱遥感数据投影到低维嵌入空间,实现高光谱数据鉴别特征的提取。\n[0018] 本发明方法通过将用户先验知识提供的标注信息融入半监督流形学习方法,不仅可以揭示隐藏在高光谱高维空间数据中的低维流形结构;而且,在一定程度上融入了人的视觉解译信息,从而得到一个结合了用户语义理解的高光谱数据低维鉴别子流形特征。\n[0019] 与现有技术相比,本发明具有以下优点:\n[0020] (1)提出了一种基于半监督方法流形学习的高光谱遥感数据鉴别特征提取方法。\n高维空间的遥感图像数据呈现复杂的非线性流形分布,该非线性流形分布由不同地物目标之间的变化、天气等因素决定。而流形学习的方法更容易揭示这种变化的影响,可以揭示隐藏在高光谱高维空间中的低维流形结构,消除波段的相关性,降低冗余度,为高光谱遥感数据鉴别特征提取提供了有效的保证。\n[0021] (2)建立了一种基于半监督方法的鉴别性流形学习模型,即仅通过对数据样本中的少量数据点进行标注,并结合大量未标注数据点来进行学习,适宜于对数据量大、含混度高、地面样本数据少的高光谱遥感数据进行维数约简处理。\n[0022] (3)有区别的对待已标注数据与无标注数据,通过权重参数的区别设置突出已标注数据与无标注数据在得到低维鉴别特征重要程度的差异,实现在低维嵌入空间中相同地物类别数据点之间依然保持其近邻关系,不同地物类别数据点之间的距离尽可能最大化,最大程度的增加不同地物类别的数据点之间的可分性,从而实现高光谱数据的鉴别特征提取。\n[0023] (4)通过用户标注数据点将人的视觉解译信息融入半监督流形学习方法,构建了一种结合了用户语义理解的高光谱数据鉴别子流形特征提取模型,从而得到一个结合了用户语义理解的高光谱数据低维鉴别子流形特征。\n附图说明\n[0024] 图1为本发明高光谱遥感数据鉴别特征提取方法的流程图;\n[0025] 图2为本发明特征提取方法学习过程示意图;\n[0026] 图3为采用本发明方法对CTR Plastic高光谱遥感图像数据鉴别特征提取方法的流程图;\n[0027] 图4为采用本发明方法对CTR Plastic高光谱遥感图像数据投影到2维空间进行特征提取的可视化示意图。\n具体实施方式\n[0028] 下面结合附图和具体实施方式对本发明作进一步详细说明。\n[0029] 参照图1,一种高光谱遥感数据鉴别特征提取方法,包括如下步骤:\n[0030] 1)计算机读入高光谱遥感图像数据;\n[0031] 2)将读入的高光谱遥感图像中每一个数据点根据其波段生成一个向量,从而整幅高光谱遥感图像构成一个矩阵,作为训练样本集;\n[0032] 3)从训练样本集中选取部分数据点进行已知地物类别的标注,生成样本类别标签;\n[0033] 4)在部分数据点的地物类别已知的前提下,结合训练样本集中的未标注数据点构建相似图和相异图来度量数据点的相似性与相异性;\n[0034] 5)根据构建的相似图和相异图分别计算权重矩阵;\n[0035] 6)计算局部相似结构矩阵和相异结构矩阵;\n[0036] 7)通过目标优化函数计算投影矩阵;\n[0037] 8)通过投影矩阵将高光谱遥感数据投影到低维嵌入空间,实现高光谱数据鉴别特征的提取。\n[0038] 上述步骤2)~步骤8)中,步骤2)具体为:\n[0039] 高光谱遥感图像数据反映了不同波段对地物的光谱反射特性,可视为(M×N×B)的三维数据,令n=M×N,则n是图像的空间尺寸,B表示波段数,于是将读入的高光谱遥感T\n图像数据转换为M×N行B列矩阵X={x1,x2,…,xi,…,xn},其中,i∈[1,n],矩阵的每一行对应一个波段的数据点xi,T是矩阵转置符号。\n[0040] 步骤3)具体为:\n[0041] X={(x1,l1),(x2,l2),…,(xi,li),…,(xC,lC),xC+1,xC+2,…,xn}T (1),[0042] 其中,xi为矩阵X中任一数据点,li为对数据点xi标注的样本类别标签,前C个数据点具有样本类别标签,其余的n-C个数据点无样本类别标签。\n[0043] 步骤4)中,相似图和相异图的构建方法具体为:\n[0044] 对于任一数据点xi,建立 为数据点xi的k个近邻数据点组\n成的近邻数据集,将近邻数据集knn(xi)为两部分:knnD(xi)与knnS(xi),其中,knnD(xi)为数据点xi的k个近邻数据点中来自于不同地物类别的数据点组成的子集,knnS(xi)则为knn(xi)中除knnD(xi)以外的部分组成的子集;需要进一步说明的是,knnS(xi)中部分样本可能不包含类别信息,但是这些样本距离xi足够的近。knn(xi)与knnD(xi)、knnS(xi)之间的关系可用下式来表示:\n[0045] (2),\n[0046] knnS(xi)=knn(xi)-knnD(xi)\n[0047] 其中,d∈[1,k],xid为近邻数据集knnn(xi)中任一数据点;\n[0048] 显然, knnS(xi)∪knnD(xi)=knn(xi)。\n[0049] 然后,根据knnS(xi)构建相似图GS,根据knnD(xi)构建相异图GD。首先在样本数据点与相似图GS和相异图GD的节点之间定义一一对应,然后根据k-NN方法定义两个图中的边,具体为:考虑训练样本集中任一个不同于xi的数据点xj,j∈[1,n]且j≠i,若xj∈knnS(xi),则用一条边连接相似图GS中xi和xj两点;若xj∈knnD(xi),则用一条边连接相异图GD中xi和xj两点。\n[0050] 步骤5)按如下公式计算:\n[0051] \n[0052] \n[0053] 其中,由元素WS,ij构成的矩阵WS为相似图GS对应的权重矩阵,由元素WD,ij构成的矩阵WD为相异图GD对应的权重矩阵,α为同类权重参数。\n[0054] 若两个数据点具有相同的类别标签,则表明两数据点属于相同地物类别,为了体现已标注数据点(具有样本类别标签的数据点)与未标注数据点(无样本类别标签的数据点)在得到低维鉴别特征重要程度的差异性,对连接相同地物类别的数据点之间的边赋予更高的同类权重参数α,以同类权重参数α突出标注的相同地物类别的数据点的作用,使维数约简处理得到的低维嵌入空间中相同地物类别的数据点更加聚集;因此α的取值较大,1<α<100,以实现在低维嵌入空间中相同地物类别的数据点之间依然保持其近邻关系,不同地物类别的数据点之间的距离尽可能最大化,最大程度的增加不同地物类别的数据点之间的可分性。\n[0055] 步骤6)具体为:\n[0056] 根据读入的高光谱遥感图像数据矩阵X和权重矩阵WS计算局部相似结构矩阵:\n[0057] \n[0058] \n[0059] \n[0060] \n[0061] 其中,DS是由元素DS,ij构成的矩阵,且DS,ii=∑jWS,ij,因此DS是一个对角矩阵,LS=DS-WS为拉普拉斯矩阵;\n[0062] 根据读入的高光谱遥感图像数据矩阵X和权重矩阵WD计算相异结构矩阵:\n[0063] \n[0064] \n[0065] \n[0066] \n[0067] 其中,DD是由元素DD,ij构成的矩阵,且DD,ii=∑jWd,ij,因此DD是一个对角矩阵,LD=DD-WD为拉普拉斯矩阵。\n[0068] 步骤7)按如下公式计算:\n[0069] 高光谱数据鉴别特征提取的目标是将高光谱高维投影到低维嵌入空间后,能达到相同地物类别的数据点之间散度尽可能小、不同地物类别的数据点之间散度尽可能大的目标; 基于上述考虑,投影矩阵A通过目标优化函数求得:\n[0070] \n[0071] 即,投影矩阵A由以下特征方程的t个最大特征值λ1>λ2>…>λt>0对应特征向量v1,v1,…,vt构成:\n[0072] MDv=λMLv (8),\n[0073] 特征向量个数t的选择可通过下式计算:\n[0074] \n[0075] 其中,β为能量保持系数,即从特征值中选择保持能量β的t个特征值,取0<β≤1,进而选择特征值对应特征向量v1,v1,…,vt,构成投影矩阵A=(v1,v1,…,vt)。\n[0076] 步骤8)中的高光谱数据鉴别特征提取的计算方法如下:\n[0077] Y=ATX (10),[0078] 其中,Y为高光谱遥感图像数据矩阵X通过投影矩阵A投影到低维嵌入空间的特征矩阵,通过投影矩阵A将高光谱遥感数据投影到低维嵌入空间,实现高光谱数据鉴别特征的提取。\n[0079] 高光谱数据鉴别特征提取的效果,可通过图例来说明。参见图2:(a)表示中心数据点有5个近邻数据点,不同形状的点代表不同的地物类别;(b)表示对相似图GS中相同地物类别的数据点之间进行连接,(c)表示对相异图GD中不同地物类别的数据点之间进行连接,(d)表示经目标优化函数得到投影矩阵A实现低维嵌入后,相同地物类别的数据点更加聚集,不同地物类别的数据点之间的间距尽可能最大化。\n[0080] 实施例:\n[0081] 参见图3,利用本发明方法对Carinthia Tech Research提供的CTR Plastic高光谱遥感图像数据进行特征提取。CTR Plastic数据为210个波段,共1320个数据,主要包含林地、道路、建筑物、水体、不可渗透地区五类地物,分别为372、360 258、161、169个数据点。具体步骤为:\n[0082] 1)计算机读入高光谱遥感图像数据:计算机读入CTR Plastic高光谱图像数据数据,剔除水汽影响及坏波段,还有162个波段,分别为band5至band75,band77至band86,band88至band100,band112至band135,band154至band197;\n[0083] 2)高光谱遥感数据训练样本集的生成:通过转换可以表示成1032行162列矩阵[0084] X={x1,x2,…,xi,…,x1032}T,i∈[1,1032],T是矩阵转置符号;\n[0085] 3)用户利用先验知识从训练样本集中选取部分数据点进行标注:对每类地物标注10个数据点,则样本训练数据中50个点具有类别信息,其余982个无类别信息;\n[0086] X={(x1,l1),(x2,l2),…,(xi,li),…,(x50,l50),x51,x52,…,x1032}T[0087] 其中,xi为矩阵X中任一数据点,li为对数据点xi标注的样本类别标签,前50个数据点具有样本类别标签,其余的982个数据点无样本类别标签。\n[0088] 4)利用部分标注后的样本数据,结合训练样本集中的未标注数据点构建相似图GS和相异图GD:\n[0089] 首先找到每一个数据点的8个近邻数据点: 然后将\nknn(xi)分为两部分:knnD(xi)与knnS(xi)。\n[0090] 再在数据点和无向图GS和GD的节点之间定义一一对应关系,然后根据k-NN方法定义两个图中的边,具体为:考虑训练样本集中任一个不同于xi的数据点xj,若xj∈knnS(xi),则用一条边连接图GS中xi和xj两点;若xj∈knnD(xi),则用一条边连接图GD中xi和xj两点;\n[0091] 5)计算权重矩阵:\n[0092] 162×1320高光谱数据的相似图GS和相异图GD对应的权重矩阵WS和WD的计算方法如下:\n[0093] \n[0094] \n[0095] 从而得到权重矩阵WS和WD,在本实施例中,取同类权重参数α=20。\n[0096] 6)计算局部相似结构矩阵和相异结构矩阵:\n[0097] 利用X、WS和WD计算局部相似结构矩阵ML和相异结构矩阵MD,具体如下:\n[0098] \n[0099] \n[0100] \n[0101] \n[0102] \n[0103] \n[0104] \n[0105] \n[0106] 7)利用目标优化函数计算投影矩阵A:\n[0107] 投影矩阵A通过目标优化函数求得:\n[0108] \nT T T\n[0109] 利用拉格朗日函数AMDA-λ(AMLXA-1),上述最优化问题可以很容易地转换为广义的特征值求解问题\n[0110] MDv=λMLv; \n[0111] 上述特征方程的t个最大特征值λ1>λ2>…>λt对应特征向量v1,v1,…,vt,构成投影矩阵A=(v1,v1,…,vt);本实施例中,选择保持90%能量(能量保持系数β=0.9)的方法确定t,\n[0112] \n[0113] 8)利用投影矩阵A得到将162×1320高光谱数据X投影到低维嵌入空间Y,实现高光谱数据鉴别特征提取;得到了表征所使用的高光谱数据信息的本征特征。\n[0114] 为了进一步理解本发明,图4是利用本发明将CTR Plastic高光谱遥感数据投影到2维空间的可视化示意图,不同符号代表不同地物类别的数据点,其中:\n[0115] +代表林地;\n[0116] ○代表道路;\n[0117] □代表建筑物;\n[0118] *代表水体; \n[0119] ×代表不可渗透地区。\n[0120] 从此示意图可以发现在低维嵌入空间(2维空间)中,不同地物类别的数据点之间拥有较好的区分度,相同地物类别的数据点之间聚集,不同地物类别的数据点之间发散,说明本发明能够有效提取高光谱高维数据中的鉴别信息,最大程度的增加了不同地物类别的数据点之间的可分性,可以更好的为高光谱遥感数据分类服务。\n[0121] 至此,本发明完成了高光谱数据鉴别特征提取的全过程。\n[0122] 本发明提供了一种基于半监督流形学习的高光谱遥感数据鉴别特征提取方法,是指一种半监督流形学习方法将高光谱高维空间遥感数据进行维数约简到表征高光谱数据本征结构特性的低维嵌入空间的方法,即用户根据先验信息从高光谱图像中选取部分数据作为已知地物类别的训练样本数据,通过考虑标注数据和无标签数据对于提取高光谱数据的低维鉴别特征的差异性来得到高光谱数据的本征低维特征,在低维嵌入空间使相同地物类别的数据点之间依然保持其近邻关系,不同地物类别的数据点之间的距离尽可能最大化,从而实现高光谱数据的鉴别特征提取。\n[0123] 需要说明的是,以上实施例仅以说明本发明技术方案而非限制本发明。尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围之中。
法律信息
- 2015-02-25
未缴年费专利权终止
IPC(主分类): G06K 9/66
专利号: ZL 200910250850.6
申请日: 2009.12.30
授权公告日: 2011.11.09
- 2011-11-09
- 2010-09-08
实质审查的生效
IPC(主分类): G06K 9/66
专利申请号: 200910250850.6
申请日: 2009.12.30
- 2010-07-07
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |