资源预览内容
第1页 / 共13页
第2页 / 共13页
第3页 / 共13页
第4页 / 共13页
第5页 / 共13页
第6页 / 共13页
第7页 / 共13页
第8页 / 共13页
第9页 / 共13页
第10页 / 共13页
亲,该文档总共13页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
1附件 5:本科生毕业论文(设计)外文资料译文论文题目: 人脸识别技术 .学生姓名: 叶瑜 年级(学号): .二级学院: 信息工程学院 专业:计算机科学与技术 指导教师: 袁贞明 职称: .填表日期: 年 月 日2杭 州 师 范 学 院 教 务 处 制外文资料翻译(不少于 4000 外文印刷字符)1所译外文资料:作者:Do-Joon Jung, Chang-Woo Lee, Yeon-Chul Lee, Sang-Yong Bak, Jong-Bae Kim, Hyun Kang, Hang-Joon Kim.书名(或论文题目):PCA-Base Real-Time Face Detection and Tracking. Jul, Phuket, Thailand, 出 版 社(或刊物名称):International Technical Conference on Circuits/Systems, Computers and Communications (ITC-CSCC02),出版时间(或刊号):Jul. 16-19, 2002, Vol. 1.所译页码:615-6182译成中文:摘要:这篇文章提出了复杂背景条件下,实现实时人脸检测和跟踪的一种方法。这种方法是以主要成分分析技术为基础的。为了实现人脸的检测,首先,我们要用一个肤色模型和一些动作信息(如:姿势、手势、眼色)。然后,使用 PAC 技术检测这些被检验的区域,从而判定人脸真正的位置。而人脸跟踪基于欧几里德(Euclidian)距离的,其中欧几里德距离在位于以前被跟踪的人脸和最近被检测的人脸之间的特征空间中。用于人脸跟踪的摄像控制器以这样的方法工作:利用平衡/倾斜(pan/tilt)平台,把被检测的人脸区域控制在屏幕的中央。这个方法还可以扩展到其他的系统中去,例如电信会议、入侵者检查系统等等。1、引言视频信号处理有许多应用,例如鉴于通讯可视化的电信会议,为残疾人服务的唇读系统。在上面提到的许多系统中,人脸的检测喝跟踪视必不可缺的组成部分。在本文中,涉及到一些实时的人脸区域跟踪【13】。一般来说,根据跟踪角度的不同,可以把跟踪方法分为两类。有一部分人把人脸跟踪分为基于识别的跟踪喝基于动作的跟踪,而其他一部分人则把人脸跟踪分为基于边缘的跟踪和基于区域的跟踪【4】。基于识别的跟踪是真正地以对象识别技术为基础的,而跟踪系统的性能是受到识别方法的效率的限制。基于动作的跟踪是依赖于动作检测技术,且该技术可以被分成视频流(optical flow)的(检测)方法和动作能量(motionenergy)的(检测)方法。基于边缘的(跟踪)方法用于跟踪一幅图像序列的边缘,而这些边缘通常是主要对象的边界线。然而,因为被跟踪的对象必须在色彩和光照条件下显示出明显的边缘变化,所以这些方法会遭遇到彩色和光照的变化。此外,当一幅图像的背景有很明显的边缘时,(跟踪方法)很难提供可靠的(跟踪)结果。当前很多的文献都涉及到的这类方法时源于 Kass et al.在蛇形汇率波动【5】的成就。因为视频情景是从包含了多种多样噪音的实时摄像机中获得的,因此许多系统很难得到可靠的人脸跟踪结果。许多最新的人脸跟踪的研究都遇到了最在背景噪音的问题,且研究都倾向于跟踪未经证实的人脸,例如臂和手。在本文中,我们提出了一种基于 PCA 的实时人脸检测和跟踪方法,该方法是利用一个如图 1 所示的活动摄像机来检测和识别人脸的。这种方法由两大步骤构成:人脸检测和人脸跟踪。利用两副连续的帧,首先检验人脸的候选区域,并利用 PCA 技术来判定真正的人脸区域。然后,利用特征技术(eigentechnique)跟踪被证实的人脸。2.人脸检测在这一部分中,将介绍本文提及到的方法中的用于检测人脸的技术。为了改进人脸检测的精确性,我们把诸如肤色模型【1,6】和 PCA【7,8】这些已经发表的技术结合起来。2.1 肤色分类检测肤色像素提供了一种检测和跟踪人脸的可靠方法。因为通过许多视频摄像机得到的一幅 RGB图像不仅包含色彩还包含亮度,所以这个色彩空间不是检测肤色像素【1,6】的最佳色彩图像。通过9亮度区分一个彩色像素的三个成分,可以移动亮度。人脸的色彩分布是在一个小的彩色的色彩空间中成群的,且可以通过一个 2 维的高斯分部来近似。因此,通过一个 2 维高斯模型可以近似这个肤色模型,其中平均值和变化如下:m=( , ) 其中 , (1)rgrN1irg1Ni (2)图表 1 显示了来自 200 副肤色图像的肤色模型的平均值和变化。图标 1.肤色平均值和变化参数 参数值 r 117.588 g 79.064rr24.132gr -10.085rg -10.085gg 8.748一旦建好了肤色模型,一个定位人脸的简单方法是匹配输入图像来寻找图像中人脸的色彩群。原始图像的每一个像素被转变为彩色的色彩空间,然后与该肤色模型的分布比较。2.2 动作检测虽然肤色在特征的应用种非常广泛,但是当肤色同时出现在背景区域和人的皮肤区域时,肤色就不适合于人脸检测了。利用动作信息可以有效地去除这个缺点。为了精确,在肤色分类后,仅考虑包含动作的肤色区域。结果,结合肤色模型的动作信息导出了一幅包含情景(人脸区域)和背景(非人脸区域)的二进制图像。这幅二进制图像定义为 ,其中 It(x,y)和 It-1(x,y)分别是当前帧和前面那帧中像素(x,y)的亮度。St 是当前帧中肤色像素的集合,(斯坦)t 是利用适当的阈限技术计算出的阈限值【9】。作为一个加速处理的过程,我们利用形态学(上)的操作(morpholoical operations)和连接成分分析,简化了图像 Mt。2.3 利用 PCA 检验人脸因为有许多移动的对象,所以按序跟踪人脸的主要部分是很困难的。此外,还需要检验这个移动的对象是人脸还是非人脸。我们使用特征空间中候选区域的分量向量来为人脸检验问题服务。为了减少该特征空间的维度,我们把 N 维的候选人脸图像投影到较低维度的特征空间,我们称之为特征空间或人脸空间【7,8】。在特征空间中,每个特征说明了人脸图像中不同的变化。图一10为了简述这个特征空间,假设一个图像集合 I1,I 2,I 3,I M,其中每幅图像是一个 N 维的列向量,并以此构成人脸空间。这个训练(测试)集的平均值用 A 来定义。用 iI 1iI1IA 来计算每一维的零平均数,并以此构成一个新的向量。为了计算 M 的直交向量,其中该向量是用来最佳地描述人脸图像地分布,首先,使用 C i irYY r (4)来计算协方差矩阵 Y 1Mi12 M。虽然矩阵 C 是 NN 维的,但是定义一个 N 维的特征向量和 N 个特征值是个难处理的问题。因此,为了计算的可行性,与其为 C 找出特征向量,不如我们计算Y TY中 M 个特征向量 vk和特征值k, 所以用 u k 来计算一个基本集合,其中 k1,M。关于这 M 个特征向量,选定 M 个Yv*重要的特征向量当作它们的相应的最大特征值。对于 M 个训练(测试)人脸图像,特征向量 W iw 1,w 2,w M用 w ku kT i,k=1,,M(6)来计算。为了检验候选的人脸区域是否是真正的人脸图像,也会利用公式(6)把这个候选人脸区域投影到训练(测试)特征空间中。投影区域的检验是利用人脸类和非人脸类的检测区域内的最小距离,通过公式(7)来实现的。Min(|W kcandidateW face|,|WkcandidateW nonface|),(7)其中 Wkcandidate是训练(测试)特征空间中对 k 个候选人脸区域,且 Wface,W nonface分别是训练(测试)特征空间中人脸类和非人脸类的中心坐标,而|表示特征空间中的欧几里德距离(Euclidean)3.人脸跟踪在最新的人脸检测中,通过在特征空间中使用一个距离度量标准来定义图像序列中下一幅图像中被跟踪的人脸。为了跟踪人脸,位于被跟踪人脸的特征向量和 K 个最近被检测的人脸之间的欧几里德距离是用 objarg kmin|WoldW k|,k1,K,(8)来计算的。在定义了人脸区域后,位于被检测人脸区域的中心和屏幕中心之间的距离用distt(face,screen)Face t(x,y)Screen(height/2,width/2),(9)来计算,其中Facet(x,y)是时间 t 内被检测人脸区域的中心,Screen(height/2,width/2)是屏幕的中心区域。使用这个距离向量,就能控制摄像机中定位和平衡/倾斜的持续时间。摄像机控制器是在这样的方式下工作的:通过控制活动摄像机的平和/倾斜平台把被检测的人脸区域保持在屏幕的中央。在表 2 自己品母国。参数表示的是活动摄像机的控制。用伪代码来表示平衡/倾斜处理的持续时间和摄像机的定位。表 2,摄像机控制参数持续时间 定位(平衡/倾斜)无 0 秒(0 度)近 0.5 秒(3.1 度)远 1 秒(6.2 度)上,下,左,右,上左,上右,下左,下右计算平和/倾斜持续时间和定位的伪代码:Procedure Duration(x,y)BeginSigd=None;Distance= ;2IF distance thencloseSigd=Close;ELSEIF distance thenfarSigd=fat;Return(Sig d);End Duration;Procedure Orientation(x,y)BeginSigo=None;IF x thenAdd “RIGHT” to Sigo;ELSEIF x thenyAdd “up”to Sigo;ElSEIF x)=(r,g)的条件概率,也给出了一幅皮肤图像中像素 p(C(-)|skin)。使用贝叶斯规则,我们可以把像素变换为这个色彩向量的皮肤条件概率,p(skin|C(-)。这就允许我们构造一个概率图像,图像中每个像素用它的皮肤投影概率来代替。如图 4 所示。肤色概率的重心表示人脸位置的估算值。有限的矩形表示(人脸)大小的估算值。使用一般的概率论,通过对被检测的有限域和理想的宽度、长度的比较,可以计算出一个确定因素。在大量的测试结果中,通过手工选择,可以得到平均宽度、长度和协方差矩阵。1(图 4,图像中人脸的皮肤概率。)3.3 相关性跟踪利用色彩(肤色)来检测人脸是快速和可靠的,但是不是一直都准确的。利用眨眼检测人脸是准确的,但是这要求捕捉到的图像对中有眨眼的情况。可以用相关性来完善这两种方法,同时,当头部移动时,可以保持人脸在图像中的中央。(energy)规格化的相关性跟踪表明:它在附加高斯噪音的条件下最为适合5。在人脸检测的情况下,主要噪音既不是高斯的也不是附加的。但是,当加入其他检测过程时,相关性跟踪提供了一种便宜、相对可靠且形式上可被分解的方法。相关性跟踪从眨眼检测开始着手。相关性模板是从眼睛的估算位置得到。从合作者的动作的预期速度中可以估算每个跟踪器的搜索区域,其中合作者的动作在每一帧的像素中度量。如果帧的速率保持得相当高5,那么这个(估算)值保持在很小的范围内。每个参考模板是一个小的邻近区,W(m,n),它的大小 x,
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号