著录项信息
专利名称 | 一种目标检测方法 |
申请号 | CN201010114137.1 | 申请日期 | 2010-02-10 |
法律状态 | 暂无 | 申报国家 | 中国 |
公开/公告日 | 2010-08-11 | 公开/公告号 | CN101799875A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06K9/66 | IPC分类号 | G06K9/66;G06T7/00查看分类表>
|
申请人 | 华中科技大学 | 申请人地址 | 湖北省武汉市武汉东湖新技术开发区关山大道1号软件产业三期A3栋***
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 武汉中科通达高新技术股份有限公司 | 当前权利人 | 武汉中科通达高新技术股份有限公司 |
发明人 | 罗大鹏;桑农;黄锐;王岳环;唐奇伶;高峻;高常鑫;笪邦友 |
代理机构 | 华中科技大学专利中心 | 代理人 | 朱仁玲 |
摘要
本发明公开了基于维数递增弱线性回归树的目标检测方法,其步骤为:①准备训练样本集(xi,yi),i=1,……,N,xi表示训练样本的特征值集合,yi为样本类别,N为训练样本数,N为自然数;②初始化训练样本权重为其中t为自然数,初始化时t=1;③对样本集合进行循环计算,选定循环次数T,T为自然数每次循环都得到一个线性回归树作为弱分类器。等到T次循环完成后,再将T个弱分类器合成一个强分类器;④使用该强分类器对数字图像中的各个区域进行分类,从而判断是否为目标区域,完成目标检测。本发明方法提出采用线性回归树作为弱分类器,即每个弱分类器不再只含有一个特征,而是用线性回归树将多个特征进行有机的组合,提高了分类器的分类能力,当训练出的分类器用于图像中的目标检测时可以获得较高的检测率及较快的检测速度。
一种目标检测方法
技术领域
[0001] 本发明属于模式识别领域,具体涉及一种目标检测的方法。
背景技术
[0002] 目标检测一直是模式识别研究领域的重点。近年来随着人们安全意识的逐渐提高,公共场所的监控摄像头越来越多,2009年全世界在视频监控领域的投入是1.7万亿美元。在美国一个机场大约要安装2000多个摄像机。由于摄像机数量太多,从摄像机采集到的数据一般不能得到很好的监控甚至根本没有人员监控。其作用往往只是作为事发之后的追查手段,而不能及时对即将发生的事件进行预警。如果不能做到事件的实时发现和处理,那么监控摄像头的作用就大打折扣了。因此,如何进行自动的视频分析,尽量减少人工干预,已经成为目前亟待解决的问题。自动视频分析包括三个关键步骤:对感兴趣的运动目标进行检测,对检测到的目标进行跟踪,通过跟踪自动分析特定目标的行为,理解场景中正在发生的事件。因此,目标检测在相关的应用中扮演着关键的角色
[0003] 近来,基于机器学习的目标检测方法研究逐渐受到了国内外学者的重视,其中采用Adaboost算法(该算法引自“Robust real-time object detection”P.Violaand M.Jones Intl.J.Computer Vision,57(2):137-154,2004)训练的分类器在正面人脸的检测中获得了巨大的成功,但是对许多应用来说,目标姿态存在较大变化,此时采用Adaboost训练的分类器由于其有限的分类能力难以得到较好的检测效果。例如视频中的行人检测,由于人体的成像自由度较大,因此检测率较低。此外,视频目标检测对实时性要求较高,因此组成强分类器的弱分类器个数就不能太大。而且,为了减小训练分类器的时间,训练样本的个数以及每个样本的特征数也不能太多,相应的对有限样本数以及特征数情况下分类器的分类能力提出了较高的要求。
[0004] 有学者提出在用Adaboost训练分类器的过程中,强分类器每添加一个新的弱分类器都会在保证分类误差下降的基础上去掉一个对减小分类误差贡献不大的弱分类器,称为Floatboost,这种方法由于加入了这种回溯机制可以用更少的弱分类器组成强分类器,达到更小的分类误差。但是,Floatboost训练分类器的速度太慢,其所耗费的时间是Adaboost的5倍。还有些学者提出扩展特征集合,通过增大样本尺寸或者混合多种特征进行分类器的训练,从而提高其分类能力。但是这种方法增加了训练分类器的复杂程度。现有技术中还存在采用构造分类树学习训练样本的方法,因为分类树在训练过程中不断的划分训练样本的空间,从而可以针对各个样本子空间进行分类器的训练,不需要在整个训练过程中都要面对所有的训练样本,采用的是分而治之的分类策略,相应的提高了分类器对训练样本的分类能力。但是这种方法产生的分类器对训练样本过分拟合,导致其泛化能力不强。众所周知用Adaboost训练的分类器即使弱分类器个数很多也很少产生过分拟合的情况。本发明充分的利用了Adaboost的这一特点,提出将线性回归树作为Adaboost的弱分类器,即组合多个线性回归树从而提高分类器的分类能力。
发明内容
[0005] 本发明提出的基于维数递增弱线性回归树的目标检测方法按照下述步骤进行:
[0006] (1)准备训练样本集(xi,yi),i=1,……,N,其中N为训练样本数,N为自然数,且整个训练样本集都属于样本空间S。
[0007] (2)初始化训练样本权重为 其中t为自然数,初始化时t=1。
[0008] (3)对样本集合进行循环计算,每次循环得到一个线性回归树作为弱分类器(在本实施例中也称为弱线性回归树),循环次数为T(T为自然数),循环过程为:
[0009] (3.1)采用Adaboost算法对带权重的训练样本进行学习,获得弱分类器ht,可表示为:
[0010]
[0011] (3.2)将ht转化为一维线性回归器作为弱线性回归树的根节点
[0012]
[0013] (3.3)由根节点划分训练样本空间S得到子空间,并在子空间中计算第二层节点线性回归器,再用第二层节点线性回归器进一步划分子空间,依此类推构造一个弱线性回归树Lt(x),如图2;
[0014] (3.4)计算Lt(x)的分类误差:
[0015] p为一个弱线性回归树中叶子节点个数;
[0016] (3.5)计算Lt(x)的权重αt:
[0017]
[0018] (3.6)更新训练样本权重 其中xi为训练样本集中的一
个样本,Ct为归一化常数,并且
[0019] (4)将T次循环获得的弱线性回归树组合成一个强分类器:
[0020]
[0021] (5)使用该强分类器H(x)遍历待检测的图像,逐一提取与上述训练样本同样大小的区域计算其特征值集合,从而可用强分类器对其进行分类,判断是否为目标区域,完成目标检测。
[0022] 本发明提出采用线性回归树作为弱分类器,即每个弱分类器不再只含有一个特征,而是用线性回归树将多个特征进行有机的组合。并且本方法将分类树划分样本空间的思路引入到弱分类器的训练中,即线性回归树的每个节点都是一个线性回归器,可以对分到该节点的正副样本进行划分。从而,即获得了较强的分类能力,又充分避免了对训练样本的过分拟合。
附图说明
[0023] 图1为本发明流程图;
[0024] 图2示出了本发明中维数递增的弱线性回归树结构图;
[0025] 图3示出了本方法与传统的基于Adaboost目标检测方法的对比图;
[0026] 图3a-3c是Adaboost的检测结果,
[0027] 图3d-3f是本发明的方法的检测结果;
[0028] 图4是本发明与传统的Adaboost、Floatboost的ROC曲线比较;
具体实施方式
[0029] 下面结合附图和具体实施例对本发明作详细说明:
[0030] (1)设输入N个训练样本(xi,yi),i=1,……,N,N为训练样本数,N为自然数,且整个训练样本集都属于样本空间S,这些训练样本在本发明中就是相同大小的图像块,一般尺寸为25×25,若图像块中含有待检测的目标则为正样本,没有则为负样本。xi表示训练样本的特征值集合,集合中的一个元素表示一个特征值,图像块的特征有很多种类型,如矩形特征、梯度方向直方图特征等。特征类型不同,其特征值个数也不同,本发明中采用的是梯度方向直方图特征。yi为样本类别
[0031]
[0032] (2)初始化训练样本权重为, 其中t为自然数,初始化时t=1。
[0033] (3)对上述训练样本的集合进行循环计算,循环次数为T(T为自然数),每次循环都得到一个线性回归树作为弱分类器(在本实施例中也称为弱线性回归树)。等到T次循环完成后,再将T个弱分类器合成一个强分类器,其中T越大分类器精度越好,理论上随着T增大可以达到任意高的精度,一般情况50次左右就可以得到接近90%的正确率。每次循环过程为:
[0034] (3.1)采用Adaboost算法对训练样本集中的样本进行学习得到一个弱分类器。
[0035] 由于每次循环都是为了构造一个线性回归树,而线性回归树的每个节点均为一个线性回归器,由式(1)和式(2)可知,一般的弱分类器是可以转换为线性回归器的,因此必须先得到一个弱分类器,而生成弱分类器的方法有很多如:神经网络方法、Adaboost方法、支持向量机(SVM)和隐马尔可夫模型(HMM)等。本发明中采用Adaboost算法获得弱分类器。设弱分类器为:
[0036]
[0037] 其中ht表示弱分类器的分类结果,只能是±1,为1表示弱分类器分类结果为正样本,为-1表示弱分类器分类结果为负样本。 为分类阈值,fi为输入该弱分类器的特征值,即训练样本集中每个样本的第i个特征值;。
[0038] (3.2)将弱分类器ht转化为线性回归器作为根节点的线性回归器。
[0039] 式(1)中的 可以看成是一维线性回归器的回归系数,则该线性回归器的系数矩阵为 而输入该线性回归器的特征值矩阵X为[fi 1]。可得:
[0040]
[0041] 因此可以用Adaboost算法挑选特征fi及其相应的阈值 根据式(2)将Adaboost的弱分类器转化为根节点线性回归器。
[0042] (3.3)构造一个线性回归树。
[0043] 通过根节点线性回归器将整个样本空间S划分成左右两个样本子空间,由子空间的样本构造弱线性回归树第二层节点线性回归器。其中输入上述第二层节点线性回归器的样本特征矩阵X增加了一个特征维fj,样本类别矩阵Y为子空间内的样本类别组成:
[0044] 其中j≠i (4)
[0045] 其中,X在根结点的特征值矩阵[fi 1]上增加了一个特征维fj,样本类别矩阵Y为子空间内的样本类别组成,
[0046] 相应的其线性回归器的系数矩阵可通过式(5)计算出来。
[0047]
[0048] 将X的每一行与 相乘,由乘积是否大于零得到该线性回归器对子空间样本的分类结果H(xi),根据样本的真实类别可计算分类误差:
[0049]
[0050] 其中ωkt为第k个样本权重,M为分到该叶子节点的样本数,M∈{1,...N}。找到最小的分类误差对应的fj即为该节点在根节点基础上增加的那一维特征。以此类推,每个子节点线性回归器均是在其父节点线性回归器基础上增加一个使其分类误差下降最大的特征而形成的,从而生长成弱线性回归树。当发现子节点的分类误差相对于父节点误差变化小于0.01时,该分支停止生长,获得一个叶子节点,当所有的分支都停止生长,则得到一个弱线性回归树Lt(x),如图2;
[0051] (3.4)将每个叶子节点的分类误差求和即得到该弱线性回归树Lt(x)的总分类误差
[0052] p为一个弱线性回归树中叶子节点个数 (7)
[0053] (3.5)由Lt(x)的分类误差可计算该弱线性回归树的权重:
[0054]
[0055] (3.6)更新训练样本权重 其中xi为训练样本集中的一
个样本,Ct为归一化常数,并且
[0056] (4)将T次循环获得的弱线性回归树组合成一个强分类器:
[0057]
[0058] (5)使用该强分类器H(x)遍历待检测的图像,逐一提取与上述训练样本同样大小的区域计算其特征值集合,从而可用强分类器对其进行分类,判断是否为目标区域,完成目标检测。
法律信息
- 2019-02-19
专利权的转移
登记生效日: 2019.01.24
专利权人由湖北安泰泽善科技有限公司变更为武汉中科通达高新技术股份有限公司
地址由430000 湖北省武汉市东湖新技术开发区软件园东路1号1.2期光谷企业公馆B1栋1-3层01室变更为430000 湖北省武汉市武汉东湖新技术开发区关山大道1号软件产业三期A3栋10层
- 2018-08-28
专利权的转移
登记生效日: 2018.08.09
专利权人由武汉中科通达高新技术股份有限公司变更为湖北安泰泽善科技有限公司
地址由430074 湖北省武汉市东湖新技术开发区关山大道1号光谷软件园C3栋10层变更为430000 湖北省武汉市东湖新技术开发区软件园东路1号1.2期光谷企业公馆B1栋1-3层01室
- 2015-01-07
专利权人的姓名或者名称、地址的变更
专利权人由武汉中科通达高新技术股份有限公司变更为武汉中科通达高新技术股份有限公司
地址由430074 湖北省武汉市东湖新技术开发区关山大道1号软件产业三期A3栋10层变更为430074 湖北省武汉市东湖新技术开发区关山大道1号光谷软件园C3栋10层
- 2014-10-29
专利权的转移
登记生效日: 2014.09.30
专利权人由华中科技大学变更为武汉中科通达高新技术股份有限公司
地址由430074 湖北省武汉市洪山区珞喻路1037号变更为430074 湖北省武汉市东湖新技术开发区关山大道1号软件产业三期A3栋10层
- 2011-11-30
- 2010-09-29
实质审查的生效
IPC(主分类): G06K 9/66
专利申请号: 201010114137.1
申请日: 2010.02.10
- 2010-08-11
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2009-12-23
|
2009-03-30
| | |
2
| |
2008-07-30
|
2008-01-25
| | |
3
| |
2008-08-13
|
2008-02-28
| | |
4
| |
2008-10-29
|
2008-06-05
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |