著录项信息
专利名称 | 基于视频的双参数管道内壁全景图像模型与生成方法 |
申请号 | CN201110157867.4 | 申请日期 | 2011-06-13 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2011-11-02 | 公开/公告号 | CN102231806A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | H04N5/265 | IPC分类号 | H;0;4;N;5;/;2;6;5查看分类表>
|
申请人 | 山东大学 | 申请人地址 | 山东省济南市历下区经十路17923号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 山东大学 | 当前权利人 | 山东大学 |
发明人 | 杨承磊;牛传;秦学英;钟凡 |
代理机构 | 济南圣达知识产权代理有限公司 | 代理人 | 王吉勇 |
摘要
本发明涉及一种基于视频的双参数管道内壁全景图像模型与生成方法,其通过前进式相机拍摄管道内壁图像,将拍摄的图像输入至计算机,由计算机进行处理,然后输出管道内壁的全景图。该过程分为图像采集阶段和全景图构建阶段。针对所得到的视频质量较差的特点,将相机模型进行简化。由于图像的质量可能被亮度变化,镜头模糊和相机不规则运动影响,为得到无缝清晰的全景图,基于马尔可夫随机场建立代价函数,通过置信度算法优化代价函数来自动消除图像拼接中的接缝,得到分辨率统一的高清晰度全景图像。本发明可用于地质工程中岩层结构的探测,或者用作医学图像分析中病变器官纹理的恢复。
1.一种基于视频的双参数管道内壁全景图像模型与生成方法,其特征在于,其采用相机在管道中做前进式或后退式的拍摄,相机运动包括沿管道中轴的平移和绕光轴的旋转,获得输入视频后,采用马尔可夫随机场优化的方法来构建全景图,无需相机定标和其他辅助设备,具体包括以下步骤:
1).相机在管道中做前进式或后退式的拍摄,相机运动包括沿管道中轴的平移和绕光轴的旋转;
2).将相机拍摄的视频输入计算机;
3).使用KLT算法对输入视频进行特征跟踪;
4).将相机模型简化,假定相邻帧间相机的运动由变焦以及绕光轴的转动组成,相机的运动轨迹与圆柱体的中轴线重合;
5).由跟踪到的特征点对求取变焦系数及旋转角度,从而求取全景图上像素在各帧的投影位置;
6).为全景图构建代价函数;
7).利用置信度传播算法求解代价函数,经过迭代,选出最优候选像素,自动消除图像拼接中的接缝,从而得到分辨率统一的高清晰度全景图像;
8).对得到的全景图进行亮度均衡;
9).工作结束。
2.根据权利要求1所述的基于视频的双参数管道内壁全景图像模型与生成方法,其特征在于:所述步骤4)中的将相机模型简化具体过程为:在投影几何中,一个空间点M和其对应的图像上点m之间的关系表示为
m=K[RT]M (1)
K是相机内部参数,相机外部参数由旋转矩阵R和平移矩阵T组成,对于一个前进式的相机模型,假设一个空间点M(X,Y,Z)在两个连续帧上有对应的图像点m(x,y)和m′(x′,y′),不失一般性,将第一帧的相机坐标系作为世界坐标系,相机位置作为坐标系原点,得到
k代表焦距,由(2)得到
对于连续的帧,相机的位移沿着光轴方向而相机的旋转围绕光轴,所以假设m′的位移是(0,0,t),其旋转角度为β,得到
从公式(4),得到下面这个式子:
上式中,[x″,y″]T是相对原图像只有旋转的图像,存在一个系数k′/k使得:
这说明相机模型被近似表示为只有旋转和变焦两个系数的模型,变焦系数为k′/k,而旋转角度为β,有:
3.根据权利要求1所述的基于视频的双参数管道内壁全景图像模型与生成方法,其特征在于:所述步骤5)中求取全景图上像素在各帧的投影位置具体方式为:
假设一个视频序列有N帧,N为大于等于2的整数,全景图从左到右由N-1个矩形窄条拼接而成,第i个矩形窄条用Ii表示,i为大于等于N的正整数;在每帧选择一个同样大小的圆,圆心在图像中心,第i帧上的圆记为Ci,圆Ci对应Ii第一列在第i帧的投影,圆Ci+1对应Ii最后一列在第i+1帧的投影圆;Ci在第i+1帧的投影为圆 则 和Ci+1之间的区域Si对应全景图中区域Ii在第i+1帧的投影;利用在第i+1帧投影的位置加上公式 得到Ii中像素在其他各帧的投影位置;公式(7)只有
两个未知数Δλ和β,所以对于特征点跟踪的精度要求比较低,使用KLT特征跟踪算法得到的特征点能够对这两个参数鲁棒的求解;对于Ii上的像素,称第i+1帧为它们的“源帧”,能够看到对于全景图上的像素,其在源帧的投影具有相似的分辨率。
4.根据权利要求1所述的基于视频的双参数管道内壁全景图像模型与生成方法,其特征在于:所述步骤6)中的构建代价函数具体为:
得到全景图上每个像素在各帧图像上投影的坐标之后,将问题归结为一个标号问题:
对于结果图上的每一个像素,将其看作一个节点,相邻节点间有一条边相连,每个像素在多幅图像上都有投影,每个投影对应节点的一个标号,假定节点集合为P,边的集合为E,建立一个无向网络图G=(P,E),L=(Li|i=1...N)是一个标号集,希望找到一个标号f(labeling)f:P→L,f将标号fp∈L分配给节点p∈P,
标号策略f的质量用一个代价函数来表示:
E是网络图上的边,Dt(·)与候选投影亮度相关,用于避免选择模糊的标号,Ds(·)用于约束某些像素选择特定的标号,使得全景图整幅图像尽量保持一致的分辨率,同时通过这一项解决由于使用变焦模型导致的累积误差问题,V(·)是光滑项,衡量了相邻像素之间的差异,保证拼接后图像的光滑性;
称节点p在源帧上投影的标号为“源标号”,记为 假设相邻节点p,q∈P,fp∈L,fq∈L,下面分别给出Dt(·),Ds(·)和V(·)的描述:
由于光照不均匀,图像中有些区域变得模糊或高亮,丢失细节,不希望采集落入这些区域的投影,第一项Dt(·)的目的在于避免选择在这些区域的标号,假定投影处的灰度值为g,认为灰度与255或0相差小于阈值μ的投影有可能出现了丢失细节,为了保证所选择的标号具有正常的亮度,将第一项定义为
对于本身接近白色或黑色的节点,因为其投影均为白色或黑色,Dt(·)不会影响最后结果图像;
函数第二项Ds(·)用于约束标号选择;假设全景图有M列,M为大于0的整数,对于全景图上的像素,每隔l列,l为小于M整数,要求该列像素的标号必须选取其源标号,并称这些列为″标准列″;这一项与V(·)相配合,会使得全景图中的像素拥有相似的分辨率,从而避免视差问题;将第二项定义为:
第三项V(fp,fq)的作用在于使全景图中临近标准列的像素选取与标准列相同的标号,同时在两个标准列之间的区域会选择一条最优接缝,来得到平滑的图像,对于光滑项的定义有两个原则:
1,对于相邻两节点,由于在同一帧图像中,光学特性最为相似,像素之间拥有最好的光滑性和一致性,则当它们来自同一帧有更高的优先权;
2,相邻节点标号不同,选择像素差异最小的标号,以保持图像的光滑性;
那么光滑项代价函数定义如下:
I(p,fp),I(q,fq)分别是相邻像素p,q标号为fp,fq时的像素值,而‖·‖代表一个合适的范数;
对于参数做如下设定:代价函数第一项的阈值设为15;为保证模糊标号不会被选择,将λ1设为10e6;对于标准列上的像素,若其选择源标号时亮度大于15并小于240时,希望它们选择源标号,否则选择亮度大于15并小于240的标号,令λ2=λ1/2;λ3设为1;用于获得第一个投影的圆半径设为95;全景图上每隔15列选定一列为标准列;置信度算法迭代次数为30。
基于视频的双参数管道内壁全景图像模型与生成方法\n技术领域\n[0001] 本发明涉及一种图像处理方法,尤其是一种基于视频的双参数管道内壁全景图像模型与生成方法。\n背景技术\n[0002] 根据图像拼接的方法不同,传统构建全景图算法可以分成三类。第一类方法采用固定的视点,原理在于选定一个参考平面,将其它图像对齐到参考平面,最后按照图像序列依次整幅拼接来构建全景图。最简单的例子把照相机固定在三角架上,令照相机绕其光心旋转来连续拍摄图像,然后在圆柱体,正方形或球体上[1-5]拼接成全景图。更一般相机运动也可以用这种方法来拼接,所处理的图像间的关系模型包括全局仿射变换[6-7],平面投影变换[8-9]等等。然而这种方法有其局限性:1)只能处理旋转幅度较小的图像,否则图像拼接时会产生畸变现象。2)无法处理相机前进运动或Zoom操作时全景图像的拼接。\n[0003] 第二类方法基于不同视点拍摄的图像创建全景图[10]。如A.Agarwala等人为了最小化多视点导致的视差问题,采用图割算法来为结果图像上的每个像素选择视点,他们的方法目的在于创建物体基本上在一个平面的比较长的街道的全景图,其针对的相机运动形式与本文不同。\n[0004] 最后一类方法基于视频序列创建全景图,这类方法需要在序列帧中提取窄条(strips)然后将窄条对齐来得到结果图像。相关的方法有扫推式全景图(pushbroom panoramas)[11],S.Peleg等提出 的自适 应拼 接模型[12-13],Zomet等 提出 的“x-slit”[14]。\n[0005] 在传统的拼接方法中,前进式摄像机运动容易出现问题。B.Rousso[13]等人提出了一种通过采集垂直于光流的窄条进行拼接的方法,这种方法可以应对相机的自由运动。\n之后他们提出另一种方法[15]通过将2维平面反投影到3维圆柱体来得到拼接图像,这种方法需要预先知道相机的内部参数,然而这一点在地质工程中往往很难满足。S.Peleg等人[12]总结了前人的方法,提出根据相机运动在图像上采集窄条(strips)并将其投影到流体上来得到全景图。他们的方法适用于大多数的相机模型,但是这种方法采用六个参数的仿射变换矩阵来对齐连续的图像,参数较多,对配准误差和光照变化非常敏感,同时当场景出现深度变化时,所拼接的图像会出现变形。对于这种方法,相邻窄条之间的差异,亮度的变化以及图像配准的错误都会导致结果图像的拼接错误。\n发明内容\n[0006] 本发明的目的是为克服上述现有技术的不足,提供一种利用图像拼接技术将一组图像序列转换为单个场景的表示,大大减少场景表示的数据量,增加了稳定性和适应性,通过置信度算法优化代价函数来自动消除图像拼接中的接缝,从而得到分辨率统一的高清晰度全景图像的基于视频的双参数管道内壁全景图像模型与生成方法。\n[0007] 为实现上述目的,本发明采用下述技术方案:\n[0008] 一种基于视频的双参数管道内壁全景图像模型与生成方法,其采用相机在管道中做前进式或后退式的拍摄,相机运动包括沿管道中轴的平移和绕光轴的旋转,获得输入视频后,采用马尔可夫随机场优化的方法来构建全景图,无需相机定标和其他辅助设备,具体包括以下步骤:\n[0009] 1).相机在管道中做前进式或后退式的拍摄,相机运动包括沿管道中轴的平移和绕光轴的旋转;\n[0010] 2).将相机拍摄的视频输入计算机;\n[0011] 3).使用KLT算法对输入视频进行特征跟踪;\n[0012] 4).将相机模型简化,假定相邻帧间相机的运动由变焦以及绕光轴的转动组成,相机的运动轨迹与圆柱体的中轴线重合;\n[0013] 5).由跟踪到的特征点对求取变焦系数及旋转角度,从而求取全景图上像素在各帧的投影位置;\n[0014] 6).为全景图构建代价函数;\n[0015] 7).利用置信度传播算法求解代价函数,经过迭代,选出最优候选像素,自动消除图像拼接中的接缝,从而得到分辨率统一的高清晰度全景图像;\n[0016] 8).对得到的全景图进行亮度均衡;\n[0017] 9).工作结束。\n[0018] 所述步骤4)中的将相机模型简化具体过程为:在投影几何中,一个空间点M和其对应的图像上点m之间的关系表示为\n[0019] m=K[RT]M (1)\n[0020] K是相机内部参数,相机外部参数由旋转矩阵R和平移矩阵T组成,对于一个前进式的相机模型,假设一个空间点M(X,Y,Z)在两个连续帧上有对应的图像点m(x,y)和m′(x′,y′),不失一般性,将第一帧的相机坐标系作为世界坐标系,相机位置作为坐标系原点,得到\n[0021] \n[0022] k代表焦距,由(2)得到\n[0023] \n[0024] 对于连续的帧,相机的位移沿着光轴方向而相机的旋转围绕光轴,所以假设m′的位移是(0,0,t),其旋转角度为β,得到\n[0025] \n[0026] 从公式(4),得到下面这个式子:\n[0027] \n[0028] \n[0029] \n[0030] \n[0031] 上式中,[x″,y″]T是相对原图像只有旋转的图像,存在一个系数k′/k使得:\n[0032] \n[0033] 这说明相机模型被近似表示为只有旋转和变焦两个系数的模型,变焦系数为k′/k,而旋转角度为β,有:\n[0034] \n[0035] 所述步骤5)中求取全景图上像素在各帧的投影位置具体方式为:\n[0036] 假设一个视频序列有N帧,N为大于等于2的正整数,全景图从左到右由N-1个矩形窄条拼接而成,第i个矩形窄条用Ii表示,i为大于等于N的正整数;如图2所示。我们在每帧选择一个同样大小的圆,圆心在图像中心,第i帧上的圆记为Ci。圆Ci对应Ii第一列在第i帧的投影,圆Ci+1对应Ii最后一列在第i+1帧的投影圆。Ci在第i+1帧的投影为圆则 和Ci+1之间的区域Si对应全景图中区域Ii在第i+1帧的投影。利用在第i+1帧投影的位置加上公式 我们可以得到Ii中像素在其他各帧\n的投影位置。公式(7)只有两个未知数Δλ和β,所以对于特征点跟踪的精度要求比较低,使用KLT特征跟踪算法(全称为Kanade-Lucas-Tomasi feature tracking algorithm(KLT)中文一般叫做KLT特征跟踪算法)得到的特征点能够对这两个参数鲁棒的求解。对于Ii上的像素,称第i+1帧为它们的“源帧”,能够看到对于全景图上的像素,其在源帧的投影具有相似的分辨率。\n[0037] 所述步骤6)中的构建代价函数具体为:\n[0038] 得到全景图上每个像素在各帧图像上投影的坐标之后,将问题归结为一个标号问题:对于结果图上的每一个像素,将其看作一个节点,相邻节点间有一条边相连,每个像素在多幅图像上都有投影,每个投影对应节点的一个标号,假定节点集合为P,边的集合为E,建立一个无向网络图G=(P,E),L=(Li|i=1...N)是一个标号集,希望找到一个标号f(labeling)f:P→L,f将标号fp∈L分配给节点p∈P,\n[0039] 标号策略f的质量用一个代价函数来表示:\n[0040] \n[0041] E是网络图上的边,Dt(·)与候选投影亮度相关,用于避免选择模糊的标号,Ds(·)用于约束某些像素选择特定的标号,使得全景图整幅图像尽量保持一致的分辨率,同时通过这一项解决由于使用变焦模型导致的累积误差问题,V(·)是光滑项,衡量了相邻像素之间的差异,保证拼接后图像的光滑性;\n[0042] 称节点p在源帧上投影的标号为“源标号”,记为 假设相邻节点p,q∈P,fp∈L,fq∈L,下面分别给出Dt(·),Ds(·)和V(·)的描述:\n[0043] 由于光照不均匀,图像中有些区域变得模糊或高亮,丢失细节,不希望采集落入这些区域的投影,第一项Dt(·)的目的在于避免选择在这些区域的标号,假定投影处的灰度值为g,认为灰度与255或0相差小于阈值μ的投影有可能出现了丢失细节,为了保证所选择的标号具有正常的亮度,将第一项定义为\n[0044] \n[0045] 对于本身接近白色或黑色的节点,因为其投影均为白色或黑色,Dt(·)不会影响最后结果图像;\n[0046] 函数第二项Ds(·)用于约束标号选择。假设全景图有M列(M为大于0的整数),对于全景图上的像素,每隔l列,l为小于M的整数,要求该列像素的标号必须选取其源标号,并称这些列为″标准列″;这一项与V(·)相配合,会使得全景图中的像素拥有相似的分辨率,从而避免视差问题。将第二项定义为:\n[0047] \n[0048] 第三项V(fp,fq)的作用在于使全景图中临近标准列的像素选取与标准列相同的标号,同时在两个标准列之间的区域会选择一条最优接缝,来得到平滑的图像,对于光滑项的定义有两个原则:\n[0049] 1,对于相邻两节点,由于在同一帧图像中,光学特性最为相似,像素之间拥有最好的光滑性和一致性,则当他们来自同一帧有更高的优先权;\n[0050] 2,相邻节点标号不同,选择像素差异最小的标号,以保持图像的光滑性;\n[0051] 那么光滑项代价函数定义如下:\n[0052] \n[0053] I(p,fp),I(q,fq)分别是相邻像素p,q标号为fp,fq时的像素值,而‖·‖代表一个合适的范数;\n[0054] 对于参数做如下设定:代价函数第一项的阈值设为15;为保证模糊标号不会被选择,将λ1设为10e6;对于标准列上的像素,若其选择源标号时亮度大于15并小于240时,希望它们选择源标号,否则选择其他亮度大于15并小于240的标号,令λ2=λ1/2;λ3设为1;用于获得第一个投影的圆半径设为95;全景图上每隔15列选定一列为标准列;置信度算法迭代次数为30。\n[0055] 本发明与S.Peleg等人的方法相比较,其优点在于:\n[0056] 本发明通过简化相机模型,只需要求取两个参数,大大增加了稳定性和适应性。由于图像的质量可能被亮度变化,镜头模糊和相机不规则运动影响,为得到无缝清晰的全景图,我们将该拼接归结为一个标号问题,基于马尔可夫随机场建立代价函数,通过置信度算法优化代价函数来自动消除图像拼接中的接缝,从而得到分辨率统一的高清晰度全景图像。本发明不需要相机内部参数,得到具有高清晰度高分辨率的管道内壁拼接图像。本发明除了可以直接用于地质工程中岩层结构的探测,还可用作医学图像分析中病变器官纹理的恢复如基于内窥镜在食道拍摄的视频恢复食道纹理。\n附图说明\n[0057] 图1是方法的流程图;\n[0058] 图2是求取投影的示意图;\n[0059] 图3(a)是全景图;图3(b)-图3(d)与视频序列中几帧的对比图像;\n[0060] 图4为长度为7900帧的视频序列得到的全景图。\n具体实施方式\n[0061] 下面结合附图和实施例对本发明进一步说明。\n[0062] 如图1所示,一种基于视频的双参数管道内壁全景图像模型与生成方法,如图1所示,方法如下:\n[0063] 1)相机在管道中做前进式或后退式的拍摄,相机运动包括沿管道中轴的平移和绕光轴的旋转;\n[0064] 2)将相机拍摄的视频输入计算机;\n[0065] 3)使用KLT算法对输入视频进行特征跟踪;\n[0066] 4)将相机模型进行简化,假定相邻帧间相机的运动由变焦以及绕光轴的转动组成,相机的运动轨迹与圆柱体的中轴线重合;\n[0067] 5)由跟踪到的特征点对求取变焦系数及旋转角度,从而求取全景图上像素在各帧的投影位置;\n[0068] 6)为全景图构建代价函数;\n[0069] 7)利用置信度传播算法求解代价函数。经过迭代,我们选出最优候选像素,自动消除图像拼接中的接缝,从而得到分辨率统一的高清晰度全景图像;\n[0070] 8)对得到的全景图进行亮度均衡;\n[0071] 9)工作结束;\n[0072] 例子:\n[0073] 通过以上方法可以有效获得地质剖面的整体结构。比较图3(a)的全景图和图3(b-d)视频序列中三帧图像。可以看到在结果图中,对于孔洞内壁上的各种特征都得到了很好的恢复。此外,为进一步说明该方法的有效性,在图3和图4中分别给出两段视频的全景图。图4为长度为7900帧的视频序列得到的全景图。原始大小为15033×360像素,篇幅所限,全景图分成三段,由上到下排列。
法律信息
- 2018-07-10
未缴年费专利权终止
IPC(主分类): H04N 5/265
专利号: ZL 201110157867.4
申请日: 2011.06.13
授权公告日: 2013.01.30
- 2013-01-30
- 2011-12-14
实质审查的生效
IPC(主分类): H04N 5/265
专利申请号: 201110157867.4
申请日: 2011.06.13
- 2011-11-02
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |