首页专利查询专利详情

*来源于国家知识产权局数据，仅供参考，实际以国家知识产权局展示为准

一种表示超像素以及度量超像素之间相似性的方法

发明专利有效专利

申请号：
CN201310398404.6
IPC分类号：G06T7/00G06T3/40
申请日期：
2013-09-04
申请人：
天津大学

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	一种表示超像素以及度量超像素之间相似性的方法
申请号	CN201310398404.6	申请日期	2013-09-04
法律状态	暂无	申报国家	中国
公开/公告日	2013-12-18	公开/公告号	CN103456013A
优先权	暂无	优先权号	暂无
主分类号	G06T7/00 ? IPC结构图谱： G 物理 G0 仪器 G06 计算；推算；计数 G06T 一般的图像数据处理或产生〔6，2006.01〕 G06T7/00 图像分析〔6，2006.01，2017.01〕	IPC分类号	G06T7/00;G06T3/40查看分类表>
申请人	天津大学	申请人地址	北京市海淀区北三环中路44号58号1层*** 变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	北京宏博知微科技有限公司	当前权利人	北京宏博知微科技有限公司
发明人	冯伟;万亮;张加万;张士杰;王超
代理机构	天津市北洋有限责任专利代理事务所	代理人	杜文茹

摘要

一种表示超像素以及度量超像素之间相似性的方法，包括两个阶段，第一阶段，进行超像素BoS构建：对于给定的输入图像，获取超像素建立超像素金字塔、提取最大内接正方形、显著正方形求解、建立超像素BoS描述符；第二阶段，基于超像素BoS模型的超像素相似度计算，在获得超像素BoS模型描述符的基础上，对于两个超像素和之间的相似度进行度量。本发明可以更好地匹配超像素的特性、精确地捕获超像素的细节信息，以及合理地处理超像素分离与合并的多样性。本发明的方法，可以使得计算机视觉等相关领域中基于超像素的特定应用算法，如图像分割、图像匹配等算法，更好地应对超像素的不规则性、分离——合并多样性以及多特征性的特征，从而得到更好的效果。

一种激光打火机及控制方法（高校光电）

发明授权

立即咨询

一种水利工程生态护坡支撑结构

实用新型

立即咨询

一种腿部骨折复位机

发明授权

立即咨询

一种抗菌防臭面料

实用新型

立即咨询

一种用于铝箔复合纸加工用剥离设备

实用新型

立即咨询

一种中空玻璃生产用快速注胶装置

实用新型

立即咨询

一种龙门铣床防护结构

实用新型

立即咨询

一种油墨印刷辊用清洁装置

实用新型

立即咨询

一种建筑模板清理装置

实用新型

立即咨询

一种机械配件钻孔设备

实用新型

立即咨询

一种农产品加工用切丝机

实用新型

立即咨询

一种用于粮食加工的可调节倾斜角度的清理筛

实用新型

立即咨询

多种安装方式的投影仪（多媒体，影视，教学培训，展厅，会展）

实用新型

立即咨询

一种远距离调节式中频治疗仪医学

实用新型

立即咨询

一种自适应式颈椎枕头

实用新型

立即咨询

一种便于叠放的光伏板生产用储存装置（太阳能光伏发电，光伏板生产）

实用新型

立即咨询

一种具有翻转功能的光伏板生产用切割设备（太阳能光伏发电，光伏板生产）

实用新型

立即咨询

一种自恒压型阀门（石油化工饮料制药天然气）

实用新型

立即咨询

一种建筑施工浇筑模板

实用新型

立即咨询

一种塑料波纹管生产用搅拌机

实用新型

立即咨询

1.一种表示超像素以及度量超像素之间相似性的方法，其特征在于，包括两个阶段，第一阶段，进行超像素BoS构建：对于给定的输入图像，获取超像素建立超像素金字塔、提取最大内接正方形、显著正方形求解、建立超像素BoS描述符；第二阶段，基于超像素BoS模型的超像素相似度计算，在获得超像素BoS模型描述符的基础上，对于两个超像素P和Q之间的相似度进行度量，其中，BoS表示利用最大内接正方形对超像素进行描述、构建和相似度度量的一种方法。
2.根据权利要求1所述的一种表示超像素以及度量超像素之间相似性的方法，其特征在于，所述的第一阶段进行超像素BoS构建包括如下步骤：
1)提取超像素建立超像素金字塔：通过标准SLIC算法产生第1层超像素；给定第i层的超像素Pi，通过检测第i+1层中超像素Pi+1的初始种子与超像素Pi的从属关系来产生第i+1层的超像素Pi+1；在第i+1层中，每一个初始种子产生的超像素只包含具有和种子具有相同标签的像素，使得第i+1层超像素Pi+1的边界严格落在第i层中产生该超像素的超像素的边界内；
2)提取超像素内最大内接正方形：将BoS模型建立在超像素金字塔中的第一层超像素中，对于金字塔第1层中的所有超像素，使用它在金字塔中的所有子超像素以及它本身作为提取最大内接正方形的源区域，在源区域中通过距离变换近似地提取最大内接正方形，具体是找到具有最大距离值的像素点，并且以该点作为中心，以该像素点到达边界的最短距离值为半径作圆，再作出圆的内接正方形，该内接正方形就是该区域的最大内接正方形，在剩余的区域内继续提取的最大内接正方形，从而递归地提取出一定数量的最大内接正方形；
3)正方形区域的表达：将正方形区域划分为一个均匀分布的同心带，每一个带区域都使用一个量化的颜色直方图H描述，该颜色直方图H将RGB三个颜色通道都划分为16等分，这样，该颜色直方图H一共拥有4096个分布中心，每一个显著正方形的同心带都用H来表示，将显著正方形的所有同心带从内到外拼接成一个中心点更大的直方图，再经过归一化处理形成了一个更大的稀疏直方图；
4)显著正方形区域求解：对于一个超像素P，通过步骤1)～步骤3)，得到候选的最大内接正方形CP，对所有候选的内接正方形依照面积大小使用降序排序，得到如下序列：
CP＝{C0，…，Cn}
通过自验证聚类方法从CP中得到显著正方形SP；
5)建立超像素BoS模型描述符：一个超像素P的BoS模型是一个带权显著正方形的集合：
其中，
SP表示一个显著正方形的集合， |SP|为超像素P中显著正方形的
个数；
WP是一个权重向量，代表了显著正方形的重要程度，它表示为：
3.根据权利要求2所述的一种表示超像素以及度量超像素之间相似性的方法，其特征在于，步骤4)所述的通过自验证聚类方法从CP中得到显著正方形SP是，首先，令S0＝C0，表示将面积最大的候选正方形当做一个显著正方形，并将它的权值赋值为1，同时定义表示距离SP最远的显著正方形，对于CP中的候选正方形Ci，我们将它与SP中的每一个显著正方形的相似度和它与的相似度做比较，如果Ci与的距离大于Ci与SP中的所有显著正方形的距离，我们将Ci作为一个新的显著正方形加入到SP中，并且赋权值为1，记为，其中表示sp,i所代表的权重，在初始时赋值为1；否则，Ci将被聚类到在SP集合中距离它最近显著正方形中，并且该显著正方形的权值加1，在直方图空间中，其中，m表示稀疏直方图的中心个数，S表示SP集合中每个显著正方形在直方图空间中向量表示的平均。
4.根据权利要求1所述的一种表示超像素以及度量超像素之间相似性的方法，其特征在于，所述的对于两个超像素P和Q之间的相似度进行度量如下：
在上式中，p和q分别代表超像素P和Q中的显著正方形，和分别代表p和q对应的带权显著正方形的集合，SP和SQ分别代表p和q对应的显著正方形集合，Hp以及Hq代表与p和q相关的稀疏直方图，ωp和ωq分别代表相应的显著正方形的权重，Z是归一化因子，表示为：
Ba(Hp,Hq)是巴氏因子，表示为：
由此得到：Sim(P,Q)最大值为1，Sim(P,Q)值越大表示两个超像素之间的相似性越高，其中，Hp(b)和Hq(b)表示Hp和Hq直方图中第b个区间的值，b表示区间的索引下标。

一种表示超像素以及度量超像素之间相似性的方法
技术领域
[0001] 本发明涉及一种图像处理和图像分析的方法。特别是涉及一种基于超像素的算法应用的表示超像素以及度量超像素之间相似性的新方法。
背景技术
[0002] 超像素是在一幅图中在感知上有意义的不规则区域，超像素经常通过将相似的相邻像素合并而产生。在超像素级别的应用中一个重要的问题是怎样可靠的测量两个超像素之间的相似度。当前大部分超像素相关的工作主要集中于超像素的产生，或者超像素在不同的计算机视觉问题中的应用。相比较规则的图像区域，超像素具有以下点特征：(1)不规则性，一幅图片的超像素具有不同的大小和形状。(2)分离—合并多样化，一个相同的物体在两幅不同的图片中可能得到不同数目的具有不同大小、形状以及空间连通性的超像素。
(3)多特征性，大部分超像素算法产生的超像素多为一致性区域，但是由于参数设置、算法失效等原因，会存在包含多个一致性区域的超像素。当前对于超像素间相似性的测量，仍然是将超像素简单地当做一般的图像区域，简单的使用现有的区域特征来表示，如区域直方图，区域协方差，GMM和SPM。即使这些方法在某些应用中该方法表现良好，但其忽略了超像素中的某些特征而这些特征将会导致在测量超像素级别相似度时使用的一般图像区域特征失效。
发明内容
[0003] 本发明所要解决的技术问题是，提供一种能够更好地匹配超像素的特性、精确地捕获超像素的细节信息，以及合理地处理超像素分离与合并的多样性的表示超像素以及度量超像素之间相似性的方法。
[0004] 本发明所采用的技术方案是：一种表示超像素以及度量超像素之间相似性的方法，包括两个阶段，第一阶段，进行超像素BoS构建：对于给定的输入图像，获取超像素建立超像素金字塔、提取最大内接正方形、显著正方形求解、建立超像素BoS描述符；第二阶段，基于超像素BoS模型的超像素相似度计算，在获得超像素BoS模型描述符的基础上，对于两个超像素P和Q之间的相似度进行度量，其中，BoS表示利用最大内接正方形对超像素进行描述、构建和相似度度量的一种方法。
[0005] 所述的第一阶段进行超像素BoS构建包括如下步骤：
[0006] 1)提取超像素建立超像素金字塔：通过标准SLIC算法产生第1层超像素；给定第i层的超像素Pi，通过检测第i+1层中超像素Pi+1的初始种子与超像素Pi的从属关系来产生第i+1层的超像素Pi+1；在第i+1层中，每一个初始种子产生的超像素只包含具有和种子具有相同标签的像素，使得第i+1层超像素Pi+1的边界严格落在第i层中产生该超像素的超像素的边界内；
[0007] 2)提取超像素内最大内接正方形：将BoS模型建立在超像素金字塔中的第一层超像素中，对于金字塔第1层中的所有超像素，使用它在金字塔中的所有子超像素以及它本身作为提取最大内接正方形的源区域，在源区域中通过距离变换近似地提取最大内接正方形，具体是找到具有最大距离值的像素点，并且以该点作为中心，以该像素点到达边界的最短距离值为半径作圆，再作出圆的内接正方形，该内接正方形就是该区域的最大内接正方形，在剩余的区域内继续提取的最大内接正方形，从而递归地提取出一定数量的最大内接正方形；
[0008] 3)正方形区域的表达：将正方形区域划分为一个均匀分布的同心带，每一个带区域都使用一个量化的颜色直方图H描述，该颜色直方图H将RGB三个颜色通道都划分为16等分，这样，该颜色直方图H一共拥有4096个分布中心，每一个显著正方形的同心带都用H来表示，将显著正方形的所有同心带从内到外拼接成一个中心点更大的直方图，再经过归一化处理形成了一个更大的稀疏直方图；
[0009] 4)显著正方形区域求解：对于一个超像素P，通过步骤1)～步骤3)，得到候选的最大内接正方形CP，对所有候选的内接正方形依照面积大小使用降序排序，得到如下序列：
[0010] CP＝{C0，…，Cn}
[0011] 通过自验证聚类方法从CP中得到显著正方形SP；
[0012] 5)建立超像素BoS模型描述符：一个超像素P的BoS模型是一个带权显著正方形的集合：
[0013] 其中，
[0014] SP表示一个显著正方形的集合， |SP|为超像素P中显著正方
形的个数；
[0015] WP是一个权重向量，代表了显著正方形的重要程度，它表示为：
[0016]
[0017] 步骤4)所述的通过自验证聚类方法从CP中得到显著正方形SP是，首先，令S0＝C0，表示将面积最大的候选正方形当做一个显著正方形，并将它的权值赋值为1，同时定义表示距离SP最远的显著正方形，对于CP中的候选正方形Ci，我们将它与SP中的每一个显著正方形的相似度和它与的相似度做比较，如果Ci与的距离大于Ci与SP中的所有显著正方形的距离，我们将Ci作为一个新的显著正方形加入到SP中，并且赋权值为1，记为，其中表示sp,i所代表的权重，在初始时赋值为1；否则，Ci将被聚类到在SP集合中距离它最近显著正方形中，并且该显著正方形的权值加1，在直方图空间中，其中，m表示稀疏直方图的中心个数，S表示SP集合中每个显著正方形在直方图空间中向量表示的平均。
[0018] 所述的对于两个超像素P和Q之间的相似度进行度量如下：
[0019]
[0020] 在上式中，p和q分别代表超像素P和Q中的显著正方形，和分别代表p和q对应的带权显著正方形的集合，SP和SQ分别代表p和q对应的显著正方形集合，Hp以及Hq代表与p和q相关的稀疏直方图，ωp和ωq分别代表相应的显著正方形的权重，Z是归一化因子，表示为：
[0021]
[0022] Ba(Hp,Hq)是巴氏因子，表示为：
[0023]
[0024] 由此得到：Sim(P,Q)最大值为1，Sim(P,Q)值越大表示两个超像素之间的相似性越高，其中，Hp(b)和Hq(b)表示Hp和Hq直方图中第b个区间的值，b表示区间的索引下标。
[0025] 本发明的一种表示超像素以及度量超像素之间相似性的方法，可以更好地匹配超像素的特性、精确地捕获超像素的细节信息，以及合理地处理超像素分离与合并的多样性。
本发明所给出的统一的超像素描述以及相似性度量的方法，可以使得计算机视觉等相关领域中基于超像素的特定应用算法，如图像分割、图像匹配等算法，更好地应对超像素的不规则性、分离—合并多样性以及多特征性的特征，从而得到更好的效果。
附图说明
[0026] 图1是本发明一种表示超像素以及度量超像素之间相似性的方法的流程图；
[0027] 图2是本发明BoS模型的直观示意图；
[0028] 图3是MSRM方法与本发明方法应用在图像分割上的结果比较，其中第一、五列表示带有用户标记的原始图像，第二、六列代表使用传统MSRM分割方法得到的结果，第三、七列代表使用基于BoS模型分割后的结果,即为本发明分割的结果，第四、八列代表标准分割结果；白色模糊效果的区域代表背景区域，清晰显示的区域代表前景区域；
[0029] 图4a是本发明的方法与其他算法的正确率的比较折线图；
[0030] 图4b是本发明的方法与其他算法的查全率的比较折线图；
[0031] 图4c是本发明的方法与其他算法的F1-measure的比较折线图；
[0032] 图4a、图4b、图4c中带有圆圈的线表示基于BoS模型的分割，带有方框的线表示传统分割；
[0033] 图5是本发明的验证尺度不变性示意图，其中，横坐标表示放缩因子，纵坐标表示相似度统计量，每一个放缩因子对应着图的上短横表示最大值，下短横表示最小值，圆点表示期望，矩形框表示方差，虚线表示众数；
[0034] 图6是本发明的验证BoS模型的旋转不变性示意图，其中，横坐标表示旋转因子，纵坐标表示相似度统计量，每一个旋转因子对应着图的上短横表示最大值，下短横表示最小值，圆点表示期望，矩形框表示方差，虚线表示众数。
具体实施方式
[0035] 下面结合实施例和附图对本发明的一种表示超像素以及度量超像素之间相似性的方法做出详细说明。
[0036] 本发明的一种表示超像素以及度量超像素之间相似性的方法，对图像首先提取超像素，进而提取其BoS模型，并设计了基于BoS模型的度量方法，在保证算法较高正确率前提下，使得计算机视觉等领域中基于超像素的特定应用算法，如图像分割、图像匹配等，可以更好地应对超像素的不规则性、分离—合并多样性以及多特征性的特征。
[0037] 本发明的一种表示超像素以及度量超像素之间相似性的方法，包括超像素BoS模型的构建和基于BoS模型的超像素相似度计算两个阶段。如图1所示：
[0038] 第一阶段，进行超像素BoS构建：对于给定的输入图像，获取超像素建立超像素金字塔、提取最大内接正方形、显著正方形求解、建立超像素BoS描述符，包括如下步骤：
[0039] 1)提取超像素建立超像素金字塔：通过标准SLIC算法[1]产生第1层超像素；给定第i层的超像素Pi，我们通过检测第i+1层中超像素Pi+1的初始种子与超像素Pi的从属关系来产生第i+1层的超像素Pi+1；在第i+1层中，每一个初始种子产生的超像素只包含具有和种子具有相同标签的像素，使得第i+1层超像素Pi+1的边界严格落在第i层中产生该超像素的超像素的边界内；
[0040] 2)提取超像素内最大内接正方形：为了保留超像素的特性，将BoS模型建立在超像素金字塔中的第一层超像素中，对于金字塔第1层中的所有超像素，使用它在金字塔中的所有子超像素以及它本身作为提取最大内接正方形的源区域，在源区域中通过距离变换[1]
近似地提取最大内接正方形，由于距离图像表示每一个像素点到达区域边界的最短距离，故具体是仅仅需要找到具有最大距离值的像素点，并且以该点作为中心，以该像素点到达边界的最短距离值为半径作圆，再作出圆的内接正方形，该内接正方形就是该区域的最大内接正方形，在剩余的区域内继续提取的最大内接正方形，从而递归地提取出一定数量的最大内接正方形；
[0041] 3)正方形区域的表达：将正方形区域划分为一个均匀分布的同心带，每一个带区域都使用一个量化的颜色直方图H描述，该颜色直方图H将RGB三个颜色通道都划分为16[2]
等分，这样，该颜色直方图H一共拥有4096个分布中心，每一个显著正方形的同心带都可以用H来表示，将显著正方形的所有同心带从内到外拼接成一个中心点更大的直方图，再经过归一化处理形成了一个更大的稀疏直方图；
[0042] 4)显著正方形区域求解：对于一个超像素P，通过步骤1)～步骤3)，得到候选的最大内接正方形CP，对所有候选的内接正方形依照面积大小使用降序排序，得到如下序列：
[0043] CP＝{C0，…，Cn}
[0044] 通过自验证聚类方法从CP中得到显著正方形SP；首先，令S0＝C0，表示将面积最大的候选正方形当做一个显著正方形，并将它的权值赋值为1，同时定义表示距离SP最远的显著正方形，对于CP中的候选正方形Ci，我们将它与SP中的每一个显著正方形的相似度和它与的相似度做比较，如果Ci与的距离大于Ci与SP中的所有显著正方形的距离，我们将Ci作为一个新的显著正方形加入到SP中，并且赋权值为1，记为，其中表示sp,i所代表的权重，在初始时赋值为1；否则，Ci将被聚类到在SP集合中距离它最近显著正方形中，并且该显著正方形的权值加1，在直方图空间中，其中，m表示稀疏直方图的中心个数。
[0045] 5)建立超像素BoS模型描述符：一个超像素P的BoS模型是一个带权显著正方形的集合：
[0046] 其中，
[0047] SP表示一个显著正方形的集合， |SP|为超像素P中显著正方
形的个数；
[0048] WP是一个权重向量，代表了显著正方形的重要程度，它表示为：
[0049]
[0050] 第二阶段，基于超像素BoS模型的超像素相似度计算，在获得超像素BoS模型描述符的基础上，对于两个超像素P和Q之间的相似度进行度量。具体如下：
[0051]
[0052] 在上式中，p和q分别代表超像素P和Q中的显著正方形，Hp以及Hq代表与p和q相关的稀疏直方图，ωp和ωq分别代表相应的显著正方形的权重，Z是归一化因子，表示为：
[0053]
[0054] Ba(Hp,Hq)是巴氏因子，表示为：
[0055]
[0056] 由此得到：Sim(P,Q)最大值为1，Sim(P,Q)值越大表示两个超像素之间的相似性越高。
[0057] 本发明的一种表示超像素以及度量超像素之间相似性的方法，给出了一套完整的统一的超像素描述以及相似性度量的方法，该方法可以更加合理地表示超像素，并且精确地度量超像素之间的相似性。相比较现行的区域描述符，该方法可以更好地匹配超像素的特性、精确地捕获超像素的细节信息，以及合理地处理超像素分离与合并的多样性。使得计算机视觉领域中基于超像素的特定应用算法，如图像分割、图像匹配等，可以更好地应对超像素的不规则性、分离—合并多样性以及多特征性。
[0058] 参考文献：
[0059] [1].R.Achanta,A.Shaji,K.Smith,A.Lucchi,P.Fua,and S.Susstrunk,“SLIC superpixels compared to state-ofthe-art superpixel methods,”IEEE TPAMI,vol.34,no.11,pp.2274–2282,2012
[0060] [2].J.F.Ning,L.Zhang,D.Zhang,and C.K.Wu,“Interactive image segmentation by maximal similarity based region merging,”Pattern Recognition,vol.43,no.2,pp.445–456,2010.

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
1	CN102663757A	2012-09-12	2012-04-20	基于核传递的半自动图像分割方法无效专利	西安电子科技大学
2	CN103093470A	2013-05-08	2013-01-23	一种具有尺度无关特性的快速多模态图像协同分割方法无效专利	天津大学
3	CN101483771A	2009-07-15	2008-08-06	提升帧速率的方法与装置失效专利	奇景光电股份有限公司