著录项信息
专利名称 | 一种快速人脸检测方法 |
申请号 | CN200610165331.6 | 申请日期 | 2006-12-18 |
法律状态 | 暂无 | 申报国家 | 中国 |
公开/公告日 | 2008-06-11 | 公开/公告号 | CN101196984 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06K9/00 | IPC分类号 | G;0;6;K;9;/;0;0;;;G;0;6;K;9;/;6;2查看分类表>
|
申请人 | 北京海鑫科金高科技股份有限公司 | 申请人地址 | 北京市丰台区南四环西路186号四区4号楼6层
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 北京海鑫科金高科技股份有限公司 | 当前权利人 | 北京海鑫科金高科技股份有限公司 |
发明人 | 张进;杨振华;刘晓春;丁晓青 |
代理机构 | 北京国林贸知识产权代理有限公司 | 代理人 | 刁玉生 |
摘要
本发明涉及一种快速人脸检测方法,使用一个人脸检测装置,该装置包括一个数字信号处理器,该数字信号处理器配置有先入先出存储器、同步动态随机存储器、可擦写存储器、复杂可编程逻辑器件、视频解码器、摄像装置、定位算法软件及数据;计算机、电视信号显示器;快速人脸检测方法是,系统初始化,采集包含人脸图像的模拟视频信号,模拟视频信号转换数字信号作为输入图像,图像归一化处理,进行图像积分计算,人脸特征结构预处理分析,CS-ADAboost分类器判断,进而进行精确后处理保存检测结果,整帧处理结束,检测结果输出。本发明能克服一定程度的光照和姿态对检测的影响,快速准确的实现人脸检测功能。
1.一种快速人脸检测方法,其特征在于:使用一个人脸检测装置,该装置包括一个数字信号处理器,该数字信号处理器配置有先入先出存储器、同步动态随机存储器、可擦写存储器、复杂可编程逻辑器件、视频解码器、摄像装置、人脸检测算法软件及数据;计算机、电视信号显示器;人脸检测的步骤是:
A、启动所述人脸检测装置,系统运行,系统初始化,将固化在可擦写存储器中的人脸检测算法软件装载入数字信号处理器中运行;
B、启动摄像装置采集可能包含人脸图像的模拟视频信号;
C、模拟视频信号经视频解码器处理后变成数字视频信号;然后将该数字视频信号作为人脸检测的输入图像送入数字信号处理器;
D、将输入数字信号处理器的图像进行尺度归一化处理;
E、进行图像积分计算,依次从左到右从上到下取20*20像素窗口积分图像;
F、进行人脸特征结构预处理分析,将20*20像素窗口分为上下对称的两部分并分别统计像素均值,如果上部分像素均值小于下部分像素均值,则进行分类器分析,否则立即停止该窗口的分析,进行下一个20*20像素窗口分析;
G、采用训练好的CS-ADAboost多层人脸分类器对20*20像素窗口判断,如果通过CS-ADAboost多层人脸分类器所有层的判断,则认为该窗口包含人脸,记下位置P(X0,Y0)和尺度C0;否则抛弃该窗口,不进行后续处理:
H、以P(X0,Y0)位置为中心,选择在x,y两个方向的正负2个像素间的25个位置用CS-ADAboost多层人脸分类器判断,搜索得到最佳位置P(X1,Y1),以P(X1,Y1)为基准,以当前尺度C0为中心,在[1.2*Co,0.64*C0]间以C0*0.04为步长选取不同尺度的图像用CS-ADAboost多层人脸分类器逐一判断,搜索得到最佳尺度C1;
I、保存检测结果,整帧处理结束;
J、视频信号输出,检测结果输出。
技术领域\n本发明涉及计算机图像识别与处理技术领域,特别是指基于数字信号处理器(Digital Signal Processor,DSP)的快速人脸检测方法。\n技术背景\n人脸检测(Face Detect ion)是指在指定图象中确定所有人脸(如果存在)的位置和大小的过程。作为人脸识别这一智能信息处理中的一项关键技术,人脸检测近年来已成为模式识别与计算机视觉领域内一项受到普遍重视、研究十分活跃的课题。\n人脸检测的研究可以追溯到上个世纪六、七十年代,经过几十年的曲折发展已日趋成熟。但是早期的人脸检测主要针对具有简单背景的人脸图象,因此人脸检测难度并未受到重视。近几年随着对公共安全的关注,要求自动人脸识别系统能够对一般环境图象具有一定的适应能力,由此所面临的一系列问题使得人脸检测开始作为一个独立的课题受到研究者的重视。今天,人脸检测的应用背景已经远远超出了人脸识别系统的范畴,在基于内容的检索、数字视频处理、视觉监测等方面有着重要的应用价值。\n人脸检测研究具有重要的实用价值和学术价值。人脸是一类具有相当复杂的细节变化的自然结构目标,此类目标的检测问题的挑战性在于:(1)人脸由于姿态、外貌、表情、肤色等不同,具有模式的可变性。(2)通常情况下人脸上可能存在眼镜、胡须等附属物,并且这些成分的变化很多,比如形状,颜色,大小等;或人脸可能部分被别的物体遮挡住.(3)作为三维物体的人脸的影像不可避免地受由光照(光谱,光源分布,强度)和相机特质(感应器,镜头)产生的影响。因此,成功构造出实用的人脸检测系统,将为解决其它类似的复杂模式检测问题提供重要的启示。\n分析国内外公开的人脸检测技术资料,已经有一些方法来实现人脸检测,例如基于知识的方法,基于不变特征的方法,基于外观的学习方法。中国专利200510086248.5公开本一种复杂背景图像中的鲁棒人脸检测方法,该方法是基于外观的CS-ADAboost方法。\n发明内容\n本发明的目的在于提供一种快速人脸检测方法,该方法能克服一定程度的光照和姿态对成像的影响,可以快速准确的实现人脸检测任务。\n本发明的目的是由下述技术方案实现的:一种快速人脸检测方法,使用一个人脸检测装置,该装置包括一个数字信号处理器,该数字信号处理器配置有先入先出存储器、同步动态随机存储器、可擦写存储器、复杂可编程逻辑器件、视频解码器、摄像装置、定位算法软件及数据;计算机、电视信号显示器;人脸检测的步骤是:\nA、启动所述人脸检测装置,系统运行,系统初始化,将固化在可擦写存储器中的人脸检测算法软件装载入数字信号处理器中运行;\nB、启动摄像装置采集可能包含人脸图像的模拟视频信号;\nC、模拟视频信号经视频解码器处理后变成数字视频信号;然后将该数字视频信号作为人脸检测的输入图像送入数字信号处理器;\nD、将输入数字信号处理器的图像进行尺度归一化处理;\nE、进行图像积分计算,依次从左到右从上到下取20*20像素窗口积分图像;\nF、进行人脸特征结构预处理分析,将20*20像素窗口分为上下对称的两部分并分别统计像素均值,如果上部分像素均值小于下部分像素均值,则进行分类器分析,否则立即停止该窗口的分析,进行下一个20*20像素窗口分析;\nG、采用训练好的CS-ADAboost多层人脸分类器对20*20像素窗口判断,如果通过CS-ADAboost多层人脸分类器所有层的判断,则认为该窗口包含人脸,记下该位置P(X0,Y0)和尺度C0;否则抛弃该窗口,不进行后续处理;\nH、以P(X0,Y0)位置为中心,选择在x,y两个方向的正负2个像素间的25个位置用CS-ADAboost多层人脸分类器判断,搜索得到最佳位置P(X1,Y1),以P(X1,Y1)为基准,以当前尺度C0为中心,在[1.2*C0,0.64*C0]间以C0*(0.04为步长选取不同尺度的图像用CS-ADAboost多层人脸分类器逐一判断,搜索得到最佳尺度C1;\nI、保存检测结果,整帧处理结束;\nJ、视频信号输出,检测结果输出。\n本发明与已有技术相比具有如下优点:\n本发明增加了基于人脸特征结构的预处理分析和精确后处理步骤,使得算法更加实用和快速。\n附图说明\n以下结合附图及实施例对本发明作进一步说明。\n图1、本发明使用的人脸检测装置原理框图\n图2、本发明的人脸检测流程图\n图3、本发明的数字信号处理器外设配置原理框图\n具体实施方式\n实施例一:\n参见图1、图2,一种快速人脸检测方法,使用一个人脸检测装置,该装置包括一套软硬件处理系统,其中硬件主要包含:中央处理单元(CPU),存储器单元和输入输出单元三大模块;各个模块间通过总线连接,实现各种数据和程序交换,输入单元连接摄像装置,并进行控制信号输入;输出单元可以连接电视机、计算机,并进行控制信号输出。软件主要包含基于改进的CS-ADAboost的人脸检测算法软件和操作系统:其中操作系统负责实时管理人脸检测程序和数据的输入输出同步。参见图3,本实施例中,中央处理单元是一个数字信号处理器2(Digital Signal Processor,DSP,其型号是TMS320DM642),该数字信号处理器配置有先入先出存储器5(First In First Out,FIFO,其型号是16C550)、同步动态随机存储器3(SDRAM,其型号是MT48LC8M32)、可擦写存储器4(FLASH,其型号是AM29LV160DB)、复杂可编程逻辑器件8(CPLD,其型号是XC9536XL);所述数字信号处理器的以太网接口(EMAC)与以太网收发器7(Ethernet Transceiver,其型号是DP83846)连接,实现了RJ45以太网络接口,可以将人脸检测结果通过以太网络实现网络输出;所述数字信号处理器的信号输入端连接一个视频解码器1(Video decoder,其型号是TVP5150),该视频解码器的视频输入端连接摄像装置用于图像数据采集;所述复杂可编程逻辑器件的控制端连接一个视频编码器9(Video enoder,其型号是SAA7105)用于视频输出;所述先入先出存储器与一个通用异步串行收发接器6(UART,其型号是MAX3243)、DB9接口依次连接,人脸检测结果也可以RS232串口协议形式从DB9接口输出。\n本实施例中,所述的摄像装置可以是摄像头、数码相机、数字摄像机中的一种。所述的摄像装置还可以是能够采集模拟视频信号的电子器件。\n本实施例中,所述的人脸检测装置匹配有人脸检测算法软件及数据,该软件及数据存放在可擦写存储器中,可擦写存储器中还存放DSP程序代码。\n本实施例中的数字信号处理器是一种特别适合于进行数字信号处理运算的微处理器,该微处理器是美国德州仪器(Texas Instruments,Ti)公司生产的专用高性能多媒体处理器,其主要应用是实时快速地实现各种数字信号处理算法。基于这种数字信号处理器设计的软件系统具有灵活、精确、稳定性好、抗干扰强、设备尺寸小、造价低、速度快等突出优点,非常适用于场地受限、稳定性要求高的应用领域。\n快速人脸检测的步骤是:\nA、启动所述人脸检测装置,系统运行,系统初始化,将固化在可擦写存储器中的人脸检测算法软件装载入数字信号处理器中运行;\nB、启动摄像装置采集可能包含人脸图像的模拟视频信号,本实施例采用摄像头;\nC、模拟视频信号经视频解码器处理后变成数字视频信号;然后将该数字视频信号作为人脸检测的输入图像送入数字信号处理器;\nD、将输入数字信号处理器的图像进行尺度归一化处理;\nE、进行图像积分计算,依次从左到右从上到下取20*20像素窗口积分图像;\nF、进行人脸特征结构预处理分析,将20*20像素窗口分为上下对称的两部分并分别统计像素均值,如果上部分像素均值小于下部分像素均值,则进行分类器分析,否则立即停止该窗口的分析,进行下一个20*20像素窗口分析;\nG、采用训练好的CS-ADAboost多层人脸分类器对20*20像素窗口判断,如果通过CS-ADAboost多层人脸分类器所有层的判断,则认为该窗口包含人脸,记下该位置P(X1,Y0)和尺度C0;否则抛弃该窗口,不进行后续处理;所述多层人脸分类器是利用AdaBoost算法设计的CS-ADAboost分类器;\nH、以P(X0,Y0)位置为中心,选择在x,y两个方向的正负2个像素间的25个位置用CS-ADAboost多层人脸分类器判断,搜索得到最佳位置P(X1,Y1),以P(X1,Y1)为基准,以当前尺度C0为中心,在[1.2*C0,0.64*C0]间以C0*0.04为步长选取不同尺度的图像用CS-ADAboost多层人脸分类器逐一判断,搜索得到最佳尺度C1;\nI、保存检测结果,整帧处理结束;\nJ、视频信号输出,检测结果输出。\n本实施例中,人脸检测初始化主要包括:分配必要的内存和参数设置,装载经CS-ADAboost训练好的系数。\n输入图像归一化,对原始输入图像按照一定尺度Ci={q0,q1,q2…qi…qn},连续双线性插值,插值图像和原始图像间的对应关系是:\nG(x,y)=F(x/qi,y/qi)\n根据上式,插值图像中的点(x,y)对应于输入图像中的点(x/qi,y/qi),由于x/qi,y/qi取值一般不为整数,故需要根据附近已知象素来插值F(x/qi,y/qi)的数值,这里采用双线性插值方法.直至插值结果图像小于20*20为止(Ci的确定与图像大小相关),得到一系列尺度上的待检测图像;基于检测速度和精度的考虑,我们推荐使用q=1.25。\n图像积分计算,对所有插值结果图像按照以下公式积分,得到2幅积分图像\n\n\n本实施例输入图像归一化,积分图像计算的内容可以参见中国专利200510086248.5公开的说明书的有关记载,在此不作详细描述。\n基于人脸特征结构的预处理分析,对每幅插值图像的每个20*20窗口进行以下处理:人脸的眼睛和眉毛是人脸上最为稳定的特征器官,相比人脸上其他器官也是颜色较黑的部分,基于这个判断我们将20*20窗口分为上下对称的两部分并分别统计像素均值,如上部分均值小于下部分均值,则进行分类器分析,否则立即停止该窗口的分析,进行下一个20*20窗口分析。实践证明,这种提前截至的预处理步骤具有简单、高效的特点,大大提高了检测速度。\n粗搜索(CS-ADAboost多层人脸分类器判断),采用训练好的CS-ADAboost多层人脸分类器对20*20窗口判断:如果通过CS-ADAboost多层人脸分类器所有层的判断,则认为该小窗口包含人脸,记下该位置P(X0,Y0)和尺度C0;否则抛弃该小窗口,不进行后续处理。\n精确搜索(后处理),经过分类器确认的人脸位置只是粗略在某一个尺度上的大致的人脸位置,需要进一步分析确定最准确位置和尺度.方法如下:以P(X0,Y0)位置为中心,选择在x,y两个方向的正负2个象素间的25个位置用CS-ADAboost多层人脸分类器判断;搜索得到最佳位置P(X1,Y1).以P(X1,Y1)为基准,以当前C0为中心,在[1.2*C0,0.64*C0]间以C0*0.04为步长选取不同尺度的图像用CS-ADAboost多层人脸分类器判断,搜索得到最佳尺度C1.实践证明,经过该步骤处理的人脸位置和尺度都更准确,更符合人眼的判断。\n整帧处理结束,输出最终结果:P(X1,Y1)和C1。
法律信息
- 2022-11-15
专利权的转移
登记生效日: 2022.11.02
专利权人由北京海鑫科金高科技股份有限公司变更为北京海鑫智圣技术有限公司
地址由100070 北京市丰台区南四环西路186号四区4号楼6层变更为100070 北京市丰台区南四环西路186号四区4号楼3层7单元(园区)
- 2019-12-06
专利权的转移
登记生效日: 2019.11.15
专利权人由北京海鑫高科指纹技术有限公司变更为北京海鑫科金高科技股份有限公司
地址由100070 北京市丰台区南四环西路186号四区4号楼2层变更为100070 北京市丰台区南四环西路186号四区4号楼6层
- 2019-09-10
专利权的转移
登记生效日: 2019.08.22
专利权人由北京海鑫科金高科技股份有限公司变更为北京海鑫高科指纹技术有限公司
地址由100038 北京市海淀区北小马厂华天大厦609室变更为100070 北京市丰台区南四环西路186号四区4号楼2层
- 2010-05-19
- 2008-08-06
- 2008-06-11
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2006-05-24
|
2005-12-15
| | |
2
| |
2006-02-08
|
2005-08-19
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |