著录项信息
专利名称 | 一种基于相似性度量的图像多目标检测方法 |
申请号 | CN201210299415.4 | 申请日期 | 2012-08-21 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2013-01-02 | 公开/公告号 | CN102855473A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06K9/00 | IPC分类号 | G;0;6;K;9;/;0;0;;;G;0;6;T;7;/;0;0查看分类表>
|
申请人 | 中国科学院信息工程研究所 | 申请人地址 | 北京市海淀区闵庄路甲89号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 中国科学院信息工程研究所 | 当前权利人 | 中国科学院信息工程研究所 |
发明人 | 徐克付;张闯;谭建龙;郭莉 |
代理机构 | 北京轻创知识产权代理有限公司 | 代理人 | 杨立 |
摘要
本发明涉及一种基于相似性度量的图像多目标检测方法,该方法具体步骤:步骤一:提取目标样本库中每幅图像的特征点,计算出每幅图像的BOF词袋向量,从而构成所述目标样本库的BOF向量集合;步骤二:利用目标样本库的BOF向量集合构建所述目标样本库的M-Tree索引;步骤三:将待检测图像在M-tree索引中进行多目标检测,并将检测果返回给用户;该方法利用BOF向量进行目标检测,具有很好的鲁棒性,对目标形变,遮挡,光照变化不敏感;可以一次检测多个目标,不需要重复检测,可以实现高效的在线多目标检测;该方法可广泛用于网络信息安全、图像多目标检测,视频多目标跟踪等多个领域。
1.一种基于相似性度量的图像多目标检测方法,其特征在于,该方法具体步骤如下:
步骤一:提取目标样本库中每幅图像的特征点,计算出每幅图像的BOF词袋向量,从而构成所述目标样本库的BOF向量集合;
步骤二:利用所述目标样本库的BOF向量集合构建所述目标样本库的M—tree索引;
步骤三:将待检测图像在M-tree索引中进行多目标检测,并将检测结果返回给用户;
所述将待检测图像在M-tree索引中进行多目标检测,并将检测结果返回给用户,步骤如下:
1)根据需要定义一个固定尺寸的滑动窗口;
2)所述滑动窗口在待检测图像上按照一定规则进行滑动,得到待检测图像块;
3)计算所述待检测图像块的BOF向量;
4)将所述待检测图像块的BOF向量在所述M-tree索引中进行匹配;
5)利用相似性度量方法检测所述M-tree索引中是否存在与所述待检测图像块相似的目标,如果存在,执行步骤6),否则,返回步骤2);
6)将检测到的相似目标图像以及其在待检测图像中的位置返回给用户。
2.根据权利要求1所述一种基于相似性度量的图像多目标检测方法,其特征在于,所述图像特征点的提取是利用sift尺度不变特征变换算法进行的。
3.根据权利要求1所述一种基于相似性度量的图像多目标检测方法,其特征在于,所述计算每幅图像的BOF向量,步骤如下:
1)选取一个具有代表性的图像库,并计算该图像库的所有特征点的聚类类中心,即特征词典;
2)计算待计算BOF向量的图像的特征点和步骤1)中所述的聚类类中心之间的欧几里得距离;
3)找到离待计算BOF向量的图像的特征点最近的类中心,计算该类中心的频数,并将频数加1;
4)重复步骤2)、3),直到完成待生成BOF向量的图像的所有的特征点的频数计算,得到该图像的频数直方图,将所述频数直方图向量化即得到该图像的BOF向量。
4.根据权利要求1所述一种基于相似性度量的图像多目标检测方法,其特征在于,所述一定规则是按照自左向右,自上而下的方向滑动,每次向右或者向下滑动的距离为一个常量。
一种基于相似性度量的图像多目标检测方法\n技术领域\n[0001] 本发明涉及一种图像检测方法,尤其涉及一种基于相似性度量的图像多目标检测方法。\n背景技术\n[0002] 图像目标的匹配和检测一直是计算机视觉中一个非常重要的领域。在图像目标的检测中,检测方法主要有基于图像局部特征的检测方法和基于滑动窗口的检测方法。其中,基于图像局部特征的检测方法包括以下步骤:特征检测,特征识别,以及模型匹配。然而,基于滑动窗口的检测方法则是通过不同大小的窗口对输入图像进行扫描,并判断所扫描的图像块之中是否含有目标对象。\n[0003] 这些算法已经比较成熟并且可以达到实时检测,但是这些方法在应用到多目标检测的时候存在扩展性问题。基于图像局部特征的检测方法在检测多个目标时,需要分别将每个目标图像的特征点与待检测图像的特征点进行匹配,分别找到每个目标匹配的位置,这样会导致匹配时间随目标数量的增加呈线性增加的趋势;基于滑动窗口的检测方法在检测多个目标时,需要将待检测图像子块分别与每个目标图像进行匹配,分别判断是否是目标位置,这样匹配时间也会随目标数量的增加线性增加。\n[0004] 由上所述,现有基于图像局部特征的检测方法和基于滑动窗口的检测方法的检测时间会随着待检测样本目标数量的增加线性增加。对于大量的图像目标,检测效率很低,不适合应用以上方法。在检测的过程中,用户希望系统能够具有很好的检测速度,能够在大规模的目标图像数据里很快的检测到目标。\n发明内容\n[0005] 本发明所要解决的技术问题是提供一种基于相似性度量的图像多目标检测方法,该方法可一次检测多个目标,且效率高,快速、准确。\n[0006] 本发明解决上述技术问题的技术方案如下:一种基于相似性度量的图像多目标检测方法,其特征在于,该方法具体步骤如下:\n[0007] 步骤一:提取目标样本库中每幅图像的特征点,计算出每幅图像的BOF词袋向量,从而构成所述目标样本库的BOF向量集合;\n[0008] 步骤二:利用所述目标样本库的BOF向量集合构建所述目标样本库的M—Tree索引;\n[0009] 步骤三:将待检测图像在所述M-Tree索引中进行多目标检测,并将检测果返回给用户。\n[0010] 本发明的有益效果是:本发明所述的一种基于相似性度量的图像多目标检测方法,该方法利用BOF向量构建M-Tree索引进行目标检测,具有很好的鲁棒性,对目标形变,遮挡,光照变化不敏感;可以一次检测多个目标,不需要重复检测,可以实现高效的在线多目标检测;该方法可广泛用于网络信息安全、图像多目标检测,视频多目标跟踪等多个领域。\n[0011] 在上述技术方案的基础上,本发明还可以做如下改进。\n[0012] 进一步,所述图像特征点的提取是利用sift尺度不变特征变换算法进行的。\n[0013] 进一步,所述计算每幅图像的BOF向量,步骤如下:\n[0014] 1)选取一个具有代表性的图像库,并计算该图像库的所有特征点的聚类类中心,即特征词典;\n[0015] 2)计算待计算BOF向量的图像的特征点和步骤1)中所述的聚类类中心之间的欧几里得距离;\n[0016] 3)找到离待计算BOF向量的图像的特征点最近的类中心,计算该类中心的频数,并将频数加1;\n[0017] 4)重复步骤2)、3),直到完成待生成BOF向量的图像的所有的特征点的频数计算,得到该图像的频数直方图,将所述频数直方图向量化即得到该图像的BOF向量。\n[0018] 进一步,所述将待检测图像在M-tree索引中进行多目标检测,步骤如下:\n[0019] 1)根据需要定义一个固定尺寸的滑动窗口;\n[0020] 2)所述滑动窗口在待检测图像上按照一定规则进行滑动,得到待检测图像块;\n[0021] 3)计算所述待检测图像块的BOF向量;\n[0022] 4)将所述待检测图像块的BOF向量在所述M-Tree索引中进行匹配;\n[0023] 5)利用相似性度量方法检测所述M-Tree索引中是否存在与所述待检测图像块相似的目标,如果存在,执行步骤6),否则,返回步骤2);\n[0024] 6)将检测到的相似目标图像以及其在待检测大图像中的位置返回给用户。\n[0025] 进一步,所述一定规则是按照自左向右,自上而下的方向滑动,每次向右或者向下滑动的距离为一个常量。\n附图说明\n[0026] 图1为本发明涉及的一种基于相似性度量的图像多目标检测方法的总流程图;\n[0027] 图2为本发明涉及的计算每幅图像BOF向量步骤的流程图;\n[0028] 图3为本发明涉及的待检测图像在M-tree索引中进行多目标检测步骤的流程图;\n[0029] 图4为本发明涉及的滑动窗口在待检测图像上滑动的示意图。\n[0030] 附图中,各标号所代表的部件列表如下:\n[0031] 1、待检测图像,2、滑动窗口。\n具体实施方式\n[0032] 以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。\n[0033] 如图1所示为本发明涉及的一种基于相似性度量的图像多目标检测方法的总流程图;图2为本发明涉及的计算每幅图像BOF向量步骤的流程图;图3为本发明涉及的待检测图像在M-tree索引中进行多目标检测步骤的流程图;图4是为本发明涉及的滑动窗口在待检测图像上滑动的示意图。如图1、2、3、4所示,一种基于相似性度量的图像多目标检测方法的具体步骤如下:\n[0034] 由用户提供目标样本库和待检测图像。\n[0035] 步骤一:提取目标样本库中每幅图像的特征点,计算出每幅图像的BOF词袋向量,从而构成所述目标样本库的BOF向量集合;计算每幅图像的BOF向量的步骤如下:\n[0036] 1)选取一个具有代表性的图像库,并计算该图像库的所有特征点的聚类类中心,即特征词典;\n[0037] 2)计算待计算BOF向量的图像的特征点和步骤1)中所述的聚类类中心之间的欧几里得距离;\n[0038] 3)找到离待计算BOF向量的图像的特征点最近的类中心,计算该类中心的频数,并将频数加1;\n[0039] 4)重复步骤2)、3),直到完成待生成BOF向量的图像的所有的特征点的频数计算,得到该图像的频数直方图,将所述频数直方图向量化即得到该图像的BOF向量。\n[0040] 步骤二:利用所述目标样本库的BOF向量集合构建所述目标样本库的M—Tree索引;\n[0041] 步骤三:将待检测图像在所述M-tree索引中进行多目标检测,并将检测果返回给用户;检测具体步骤如下:\n[0042] 1)根据需要定义一个固定尺寸的滑动窗口2;\n[0043] 2)所述滑动窗口2在待检测图像1上按照一定规则进行滑动,得到待检测图像块;\n[0044] 3)计算所述待检测图像块的BOF向量;\n[0045] 4)将所述待检测图像块的BOF向量在所述M-Tree索引中进行匹配;\n[0046] 5)利用相似性度量方法检测所述M-Tree索引中是否存在与所述待检测图像块相似的目标,如果存在,执行步骤6),否则,返回步骤2);\n[0047] 6)将检测到的相似目标图像以及其在待检测大图像中的位置返回给用户。\n[0048] 其中,所述一定规则是按照自左向右,自上而下的方向滑动,每次向右或者向下滑动的距离为一个常量。\n[0049] 以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
法律信息
- 2022-07-29
未缴年费专利权终止
IPC(主分类): G06K 9/00
专利号: ZL 201210299415.4
申请日: 2012.08.21
授权公告日: 2016.03.02
- 2016-03-02
- 2013-08-21
实质审查的生效
IPC(主分类): G06K 9/00
专利申请号: 201210299415.4
申请日: 2012.08.21
- 2013-01-02
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2006-05-03
|
2005-10-24
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |