著录项信息
专利名称 | 一种基于带权图的半监督图像分类方法 |
申请号 | CN200810105980.6 | 申请日期 | 2008-05-07 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2008-10-29 | 公开/公告号 | CN101295360 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06K9/46 | IPC分类号 | G;0;6;K;9;/;4;6查看分类表>
|
申请人 | 清华大学 | 申请人地址 | 广东省佛山市顺德区大良凤翔路41号创意创业园C栋107房
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 广东清立方科技有限公司 | 当前权利人 | 广东清立方科技有限公司 |
发明人 | 戴琼海;李斐;徐文立;尔桂花 |
代理机构 | 北京清亦华知识产权代理事务所(普通合伙) | 代理人 | 廖元秋 |
摘要
本发明涉及半监督图像分类技术,属于计算机多媒体技术领域,该方法包括:在对数字图像进行分割的基础上,提取区域特征并计算各个区域面积占整幅图像面积的比例;使用线性规划构建带权图;使用标签传播的方法在带权图上传递已标注图像的类别信息;最后根据类别信息传递的最终结果,对未标注图像进行分类。本方法使用线性规划构建带权图,其中需要设定的参数为近邻图像的数目,当该参数在较大的范围内变化时,使用本方法得到的图像分类结果比较稳定,从而有效地克服了基于高斯函数构建带权图的方法中参数对分类结果影响较大的问题。
1.一种基于带权图的半监督图像分类方法,其特征在于,包括如下步骤:
1)对所有图像进行分割:设一共有N幅图像,对每一幅图像Im(1≤m≤N)进行分割得到nm个区域,nm为自然数;
2)对所有图像分割后得到的区域,进行底层视觉特征的抽取;
3)计算每幅图像中各个区域面积占整幅图像面积的比例;使用区域属性的集合对图像Im描述为:,其中rmk(1≤k≤nm)表示图像Im中第k个区域的特征,vmk(1≤k≤nm)表示图像Im中第k个区域的面积占整幅图像面积的比例;
4)使用线性规划构建带权图;
5)使用标签传播的方法在带权图上传递已标注图像的类别信息;
6)根据类别信息传递的最终结果,对未标注图像进行分类;
所述步骤4)中使用线性规划构建带权图具体包括以下步骤:
41)选取第一幅图像Im即令m=1;
42)根据图像的区域特征和区域面积比例,计算图像Im与其它所有图像之间的泥土搬运距离,记作dEMD(Im,I1),dEMD(Im,I2),…,dEMD(Im,Ik(k≠m)),…,dEMD(Im,IN);
43)根据步骤42)中计算出的泥土搬运距离确定与图像Im之间距离最小的K幅近邻图像,记作其中Mk(1≤k≤K)表示近邻图像的标号;
44)设由图像Im对应结点到图像(1≤k≤K)对应结点的边的权重为rmi与之间的距离为dk(i,j)基于下述线性规划问题计算的值:
(1)
其中,待求解的决策变量为fk(i,j)和(1≤k≤K),它们需要满足如下约束条件:
fk(i,j)≥0,1≤i≤nm,1≤k≤K; (2)
1≤k≤K; (3)
1≤i≤nm; (4)
1≤k≤K; (5)
45)如果则令由图像Im对应结点到图像Ik对应结点的边的权重为wmk=0,即由图像Im对应结点到图像Ik对应结点的边不存在;
46)m的取值加1,如果m ≤N,则转至步骤42),直至所有图像都被选取。
技术领域\n本发明属于计算机多媒体技术领域,特别涉及半监督图像分类技术。\n背景技术\n数字图像是指以数字形式记录的图像信息。随着计算机科学和网络技术的发展,数字图像的数量正在以惊人的速度急剧增长,并且在人们日常生活中发挥着日益重要的作用。为了更好地处理和利用海量数字图像中包含的信息,需要对数字图像进行合理的分类。完全依靠人工对图像进行分类的方法费时费力,而且分类结果会受到分类人员主观性的影响。为了提高图像分类的速度和精度,基于内容的图像分类技术应运而生。\n基于内容的图像分类的基本框架是:给定若干已经确定了其所属类别的图像(称为已标注图像)和若干没有确定其所属类别的图像(称为未标注图像),在使用计算机自动抽取图像底层视觉特征的基础上,设计合适的分类方法,判断未标注图像所属的类别。\n对于图像特征的抽取,最直接的方法是针对整幅图像提取其全局特征。但是,图像的语义往往是由图像中的物体表现出来的,而基于图像中物体的信息一般不能在全局特征中得以体现。为了尽量获取基于物体的信息,需要先将整幅图像分割成若干个区域,并在此基础之上抽取区域的特征。理想情况下,图像分割得到的每一个区域对应一个具有实际意义的物体。尽管现有技术并不能够达到理想的分割效果,而一般只能将图像分为许多具有相似底层视觉特征的区域,但是,使用区域特征对图像内容进行描述更加符合人类的视觉感知,因此,基于区域的图像分类技术一般可以获得更高的正确率。\n基于区域的图像分类技术可以分为监督学习和半监督学习两大类。二者的主要区别在于:在分类器设计的过程中,监督学习方法着眼于充分利用已标注图像中的信息,而半监督学习方法则同时挖掘已标注图像和未标注图像中的信息。由于对未标注图像中蕴含的信息进行了合理利用,所以,一般来说,半监督图像分类技术可以取得更好的分类结果。在实际中,图像标注的工作通常需要人工来完成,已标注图像的数量往往是十分有限的;而相对而言,未标注图像的数量要多得多。只使用很少的已标注图像进行训练时,监督学习得到的分类器的性能往往是不稳定的,且一般不具有很好的推广能力。因此,监督图像分类技术的应用受到了很大的限制,而半监督图像分类技术往往更具实用价值。\n基于带权图的方法是半监督图像分类技术中的重要组成部分,该类方法的基本内容是:构建一张用来表征所有图像之间关系的带权图,其中每一个结点对应一幅图像,连接两个结点的边的权重表示两幅图像之间的相似性;已标注图像的类别信息可以在带权图上进行传递,传递的结果可以为未标注图像提供有效的分类信息。图1示出了一张带权图,图中以圆圈表示结点,10个结点分别对应10幅图像Ii(1≤i≤10);图中以两圆圈之间带箭头的连线表示两个结点之间的边,wij(1≤i≤10,1≤j≤10,i≠j)表示由图像Ii对应结点到图像Ij对应结点的边的权重。在所有的10幅图像中,I1,I2为已标注图像且属于不同的图像类,其余8幅图像为未标注图像。合理利用带权图的信息,可以将I1,I2的类别信息传递给其余图像,从而确定其所属的类别。\n在所有基于带权图的半监督图像分类方法中,带权图的构建都是极其重要的。由于和所有图像存在一一对应的关系,带权图结点数目的设置是显而易见的,因此,构建带权图的关键问题在于如何有效确定边的权重。现有的绝大多数方法都基于高斯(Gaussian)函数构建带权图,已有的一种半监督图像分类方法的流程如图2所示,其基本步骤如下:\n1)对所有图像进行分割;\n2)对所有图像分割后得到的区域,进行底层视觉特征的抽取;\n3)计算每幅图像中各个区域面积占整幅图像面积的比例;\n4)基于高斯函数使用公式(1)计算带权图中边的权重,并对计算出的边的权重进行标准化处理:\n\n其中Ii,Ij为任意两幅图像,wij为由图像Ii对应结点到图像Ij对应结点的边的权重,dEMD(·,·)为两幅图像之间的泥土搬运距离(Earth Mover’s Distance,简称EMD),是两幅基于区域表征的图像之间一种有效的距离度量,σ为高斯函数中的参数;\n5)使用标签传播的方法在带权图上传递已标注图像的类别信息;\n6)根据类别信息传递的最终结果,对未标注图像进行分类。\n基于高斯函数构建带权图的方法简单易行,但是,F.Wang等人的文章“Labelpropagation through linear neighborhoods,”(《基于线性近邻的标签传播》)中指出,参数σ对分类结果有较大的影响,而且,目前还没有可靠的方法能够自动确定参数σ的合理取值。在上述文章中,F.Wang等人提出了基于近邻线性重构的思想来构建带权图的方法。但是,该方法只适用于图像特征长度相等的情况。对于基于区域的图像分类而言,不同图像分割后得到的区域数目往往是不同的,故不同图像的特征长度也是不同的,因此,直接使用近邻线性重构的方法是不可行的。\n作为运筹学的一个重要分支,线性规划在实际中得到了广泛的应用。一般来说,线性规划问题指的是求线性目标函数在线性约束条件下的最大值或最小值的问题。包含n个决策变量xj(1≤j≤n)和m个线性约束的线性规划问题的标准形式为:\n\n其中xj(1≤j≤n)需要满足如下约束条件:\nxj≥0,1≤j≤n; (3)\n1≤i≤m. (4)\n其中aij,bi(bi≥0),cj(1≤i ≤m,1≤j≤n)均为常数,m、n为自然数。\n发明内容\n本发明的目的是为克服已有技术的不足之处,提出一种基于带权图的半监督图像分类方法。本方法使用线性规划构建带权图,其中需要设定的参数为近邻图像的数目。当参数在较大的范围内变化时,使用本方法得到的图像分类结果比较稳定。本发明提出的基于带权图的半监督图像分类方法,包括以下步骤:\n1)对所有图像进行分割;\n2)对所有图像分割后得到的区域,进行底层视觉特征的抽取;\n3)计算每幅图像中各个区域面积占整幅图像面积的比例;\n4)使用线性规划构建带权图;\n5)使用标签传播的方法在带权图上传递已标注图像的类别信息;\n6)根据类别信息传递的最终结果,对未标注图像进行分类。\n本发明的特点及效果:\n本发明提出一种基于带权图的图像分类方法,本方法使用线性规划构建带权图,其中需要设定的参数为近邻图像的数目。实验结果表明,使用该方法构建的带权图,当参数在较大的范围内变化时,得到的图像分类结果比较稳定,从而有效地克服了基于高斯函数构建带权图的方法中参数对分类结果影响较大的问题。\n附图说明\n图1为表征所有图像之间关系的带权图示例。\n图2为已有的使用基于高斯函数的带权图构建方法进行图像分类的流程框图。\n图3为使用本发明提出的带权图构建方法进行图像分类的流程框图。\n图4为本发明提出的带权图构建方法的流程框图。\n图5为实施例中的图像分割结果示例。\n图6为实施例中得到的表征所有图像之间关系的带权图。\n图7为使用基于高斯函数的带权图构建方法在参数的不同取值下得到的分类正确率。\n图8为使用本发明提出的带权图构建方法在参数的不同取值下得到的分类正确率。\n具体实施方式\n本发明提出的一种基于带权图的半监督图像分类方法,结合附图及实施例详细说明如下:\n本发明方法的流程如图3所示,包括以下步骤:\n1)对所有图像进行分割:设一共有N幅图像,对每一幅图像Im(1≤m≤N)进行分割得到nm个区域,nm为自然数;\n2)对所有图像分割后得到的区域,进行底层视觉特征的抽取;\n3)计算每幅图像中各个区域面积占整幅图像面积的比例;\n使用区域属性的集合对图像Im描述为:其中rmk(1≤k≤nm)表示图像Im中第k个区域的特征,vmk(1≤k≤nm)表示图像Im中第k个区域的面积占整幅图像面积的比例;\n4)使用线性规划构建带权图;\n5)使用标签传播的方法在带权图上传递已标注图像的类别信息;\n6)根据类别信息传递的最终结果,对未标注图像进行分类。\n上述步骤4)的具体流程如图4所示,包括以下步骤:\n41)选取第一幅图像Im即令m=1;\n42)根据图像的区域特征和区域面积比例,计算图像Im与其它所有图像之间的泥土搬运距离,记作dEMD(Im,I1),dEMD(Im,I2),…,dEMD(Im,Ik(k≠m)),…,dEMD(Im,IN);\n43)根据步骤42)中计算出的泥土搬运距离确定与图像Im之间距离最小的K幅近邻图像,记作其中Mk(1≤k≤K)表示近邻图像的标号;\n44)使用线性规划计算由该图像对应结点到其近今图像对应结点的边的权重:\n设由图像Im对应结点到图像(1≤k≤K)对应结点的边的权重为rm1和之间的距离为dk(i,j)(1≤i≤nm,),基于下述线性规划问题计算的值:\n\n其中,待求解的决策变量为fk(i,j)(1≤i≤nm,1≤k≤K)和(1≤k≤K),它们需要满足如下约束条件:\nfk(i,j)≥0,1≤i≤nm,1≤k≤K; (6)\n1≤k≤K; (7)\n1≤i≤nm; (8)\n \n\n45)如果则令由图像Im对应结点到图像Ik对应结点的边的权重为wmk=0,即由图像Im对应结点到图像Ik对应结点的边不存在;\n46)选取下一幅图像,即m的取值加1,如果m≤N,则转至步骤42),直至所有图像都被选取。\n本发明的一种实施例选用标准图像库Corel中的沙滩(beach)和森林(forest)两类图像进行分类,每个图像类共包括6幅图像,每类取其中1幅为已标注图像,其余的5幅作为未标注图像。\n本实施例包括以下步骤:\n1)选用Y.Deng等人在文章“Color image segmentation”(《彩色图像分割》)中提出的基于J值的图像分割(JSEG)方法对所有12幅图像进行分割;\n其中一幅图像的分割结果如图5所示,该图像被分割为3个区域,分别对应沙滩、小孩和塑料桶;\n2)对所有图像分割后得到的区域,抽取共91维的区域特征,包括64维的颜色直方图、9维的颜色矩、10维的粗糙度向量和8维的方向度向量;\n3)计算每幅图像中各个区域面积占整幅图像面积的比例;\n图5所示图像分割结果中,对应于沙滩、小孩和塑料桶三个区域的面积占整幅图像面积的比例分别为:0.8935、0.0891和0.0174。\n4)使用线性规划构建带权图,得到的带权图如图6所示;\n5)分别使用1和-1作为沙滩和森林两类标注图像的原始类别标签,未标注图像的原始类别标签设为0。使用D.Zhou等人在文章“Learning with local and global consistency”(《基于局部和全局一致性的学习》)中提出的方法在带权图上进行类别标签传播;\n6)判定类别标签传播的最终结果为正的未标注图像属于沙滩类,判定类别标签传播的最终结果为负的未标注图像属于森林类。\n本实施例中,上述步骤4)的具体流程如图4所示,包括以下步骤:\n41)令m=1;\n42)根据图像的区域特征和区域面积比例,计算图像Im与其它所有图像之间的泥土搬运距离,记作dEMD(Im,I1),dEMD(Im,I2),…,dEMD(Im,Ik(k≠m)),…,dEMD(Im,I12);\n43)根据步骤42)中计算出的泥土搬运距离确定与图像Im之间的距离最小3幅近邻图像,记作其中Mk(1≤k≤3)表示近邻图像的标号;\n44)设由图像Im对应结点到图像对应结点的边的权重为rmi和之间的距离为dk(i,j)(1≤i≤nm,),基于下述线性规划问题计算的值:\n\n其中,待求解的决策变量为fk(i,j)(1≤i≤nm,1≤k≤3)和(1≤k≤3),它们需要满足如下约束条件:\nfk(i,j)≥0,1≤i≤nm,1≤k≤3; (12)\n1≤k≤3; (13)\n1≤i≤nm; (14)\n \n\n45)如果则令由图像Im对应结点到图像Ik对应结点的边的权重为wmk=0,即由图像Im对应结点到图像Ik对应结点的边不存在;\n46)m的取值加1,如果m≤N,则转至步骤42)。\n本发明方法与已有方法的实验结果比较\n选用标准图像库Corel中的沙滩(beach)和森林(forest)两类图像进行分类,每个图像类共包括100幅图像,取其中2幅为已标注图像,其余的98幅作为未标注图像。\n使用基于高斯函数构建带权图的方法,在参数σ的不同取值下,得到的分类正确率如图7所示。图中横坐标表示高斯函数中参数σ的取值,纵坐标表示图像分类的正确率。当0.1≤σ≤0.2时,分类正确率高于90%;当0.2≤σ≤0.3时,分类正确率急剧下降,从高于90%降至50%;当0.3≤σ≤1时,分类正确率只有50%。可见,分类结果受σ的影响较大;只有当σ在一较小的范围内取值时,才可以获得较好的图像分类效果。\n在近邻图像数目的不同取值下,使用本发明提出的带权图构建方法得到的分类正确率如图8所示。图中横坐标表示近邻图像数目K的取值,纵坐标表示图像分类的正确率。当3≤K≤16时,分类正确率一直保持在90%左右。可见,当参数在较大的范围内变化时,图像分类的结果比较稳定。
法律信息
- 2019-04-23
未缴年费专利权终止
IPC(主分类): G06K 9/46
专利号: ZL 200810105980.6
申请日: 2008.05.07
授权公告日: 2010.06.02
- 2016-04-20
专利权人的姓名或者名称、地址的变更
专利权人由广东圣洋信息科技实业有限公司变更为广东清立方科技有限公司
地址由528300 广东省佛山市顺德区大良凤翔路41号顺德创意产业园C栋首层变更为528300 广东省佛山市顺德区大良凤翔路41号创意创业园C栋107房
- 2013-03-27
专利权的转移
登记生效日: 2013.02.28
专利权人由清华大学变更为广东圣洋信息科技实业有限公司
地址由100084 北京市海淀区清华园变更为528300 广东省佛山市顺德区大良凤翔路41号顺德创意产业园C栋首层
- 2010-06-02
- 2008-12-24
- 2008-10-29
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2007-11-07
|
2007-06-08
| | |
2
| |
2007-08-15
|
2006-02-09
| | |
3
| | 暂无 |
2006-03-31
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |