人脸识别文献综述

阅读: 评论:0

文献综述
1 引言
在计算机视觉和模式识别领域,人脸识别技术(Face Recognition Technology,简称FRT)是极具挑战性的课题之一。近年来,随着相关技术的飞速发展和实际需求的日益增长,它已逐渐引起越来越多研究人员的关注。人脸识别在许多领域有实际的和潜在的应用,在诸如证件检验、银行系统、军队安全、安全检查等方面都有相当广阔的应用前景。人脸识别技术用于司法领域,作为辅助手段,进行身份验证,罪犯识别等;用于商业领域,如银行信用卡的身份识别、安全识别系统等等。正是由于人脸识别有着广阔的应用前景,它才越来越成为当前模式识别和人工智能领域的一个研究热点。
虽然人类能够毫不费力的识别出人脸及其表情,但是人脸的机器自动识别仍然是一个高难度的课题。它牵涉到模式识别、图像处理及生理、心理等方面的诸多知识。与指纹、视网膜、虹膜、基因、声音等其他人体生物特征识别系统相比,人脸识别系统更加友好、直接,使用者也没有心理障碍。并且通过人脸的表情/姿态分析,还能获得其他识别系统难以获得的一些信息。
自动人脸识别可以表述为:对给定场景的静态或视频序列图像,利用人脸数据库验证、比对或指认校验场景中存在的人像,同时可以利用其他的间接信息,比如人种、年龄、性别、面部表情、语音等,以减小搜索范围提高识别效率。自上世纪90年代以来,人脸识别研究得到了长足发展,国内外许多知名的理
工大学及TT公司都成立了专门的人脸识别研究组,相关的研究综述见文献[1-3]。
本文对近年来自动人脸识别研究进行了综述,分别从人脸识别涉及的理论,人脸检测与定位相关算法及人脸识别核心算法等方面进行了分类整理,并对具有典型意义的方法进行了较为详尽的分析对比.此外,本文还分析介绍了当前人脸识别的优势与困难。
2 人脸识别相关理论雷锋帽
图像是人们出生以来体验最丰富最重要的部分,图像可以以各种各样的形式出现,我们只有意识到不同种类图像的区别,才能更好的理解图像.要建立一套完整的人脸识别系统(Face Recognetion System,简称FRS),必然要综合运用以下几大学科领域的知识:
2。1 数字图像处理技术
数字图像处理又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程,数字图像处理最早出现于20世纪50年代,当时的电子计算机己经发展到一定水平,人们开始利用计算机来处理图形和图像信息。数字图像处理作为一门学科大约形成于20世纪60年代初期。与人类对视觉机理研究的历史相比,数字图像处理是一门相对年轻的学科,但在其短短的历史中,它却以不同程度的成功使用于几乎所有与成像有关的领域。
连杆机会
鞋帮加工目前,数字图像处理技术己被广泛应用于办公自动化、工业机器人、地理数据处理、医学数据处理、地球资源遥感、交互式计算机辅助设计等领域,尤其在机器视觉应用系统中成为关键技术之一。一般的图像都是模拟图像,对于模拟图像只能采用模拟处理方式进行处理,计算机不能接受和处理模拟信号,只有将连续的模拟信号变换为离散的数字信号,或者说将模拟图像变换为数字图像才能接受。数字图像处理就是对给定的数字图像进行某些变换的过程.对含有噪声的图像,要除去噪声、滤去干扰,提高信噪比;对信息微弱的图像要进行灰度变换等增强处理;对已经退化的模糊图像要进行各种复原的处理;对失真的图像要进行几何校正等变换。除此之外,图像的合成,图像的边缘提取与分割,图像的编码、压缩与传输,图像的分析等技术也属于图像处理的内容.由此可见,图像处理就是为了达到改善图像的质量,将图像变换成便于人们观察和适于机器识别的目的[4]
。 2。2 神经网络
变速箱取力器人工神经网络是一门以对大脑的生理研究成果为基础,以用机器模拟大脑的某些生理与机制,实现某方面功能为目的的学科[6]。研究神经网络,特别是神经学习的机理,对认识和促进人自身发展有特殊的意义。
神经网络有许多具有非线性映射能力的神经元组成,神经元之间通过权系数连接。网络的信息分布式就存在连接系数中,使网络具有很高的容错性和鲁棒性.神经网络技术已经被有效地用到组合优化、图
像处理、模式识别、自动控制等方面。基于神经网络技术的人脸识别方法是人脸识别研究领域中的一大重要分支。 2。3 模式识别
模式识别[7],就是通过计算机用数学技术方法来研究模式的自动处理和判读。这门学科使用计算机的方法实现人的模式识别能力,即对各种事物或现象进行分析、描述、判别和识别。在人脸识别中,如果是个人识别,则每一个人就是一个模式,预先存在数据库里的图像就是样本;如果是性别识别、种族识别或年龄识别,则不同的性别、种族或年龄就构成一个模式;如果是表情识别,则不同的表情就是一个模式。人脸识别重在讨论个人识别,人脸识别的最终目的就是利用人脸图像确定待识别的人究竟与数据库里的哪个人是同一个人,这是一个“是谁”的问题;或要判断这个人与库里的某个人是不是同一个人,这是一个“认识或不认识”的问题。
图像识别是指对视觉图像目标按其物理特征进行分类,属于模式识别的范畴。图像识别系统的基本结构如图1所示.
图1 图像识别系统的基本结构
结果
2.4 计算机视觉
在客观世界中,人类通过视觉识别文字和周围环境,感知外界信息。人们75%的信息量都来自视觉,因此让计算机或机器人具有视觉,是人工智能的重要环节,也是人类多年以来的梦想。在信号处理理论与高性能计算机出现后,这种希望正在逐步实现.用计算机实现对视觉信息的处理形成了一门新兴的学科--计算机视觉.
计算机视觉是一门用计算机来实现人的视觉功能,实现客观三维世界的识别的学科。计算机视觉的最终目标是模拟人类的视觉能力,理解并解释周围的世界,其研究的一个关键内容是图像的识别。
3 人脸检测与定位
人脸检测与定位是自动人脸识别系统首先需要解决的关键问题,也即检测图像中是否有人脸存在,若有,则将其从背景中分割出来并确定其在图像中的位置。在某些可以控制拍摄条件的场合,如警察拍摄罪犯照片时将人脸限定在标尺内,此时的人脸定位由于己经具备了人脸位置的先验知识而相对比较简单;证件照(身份证、护照等)由于背景相对简单,定位也比较容易.但在通常情况的实际应用中,
人脸在图像中的位置预先未能得知,人脸检测与定位将受到以下因素的制约:(1)人脸在图像中的位置、角度和尺度不同以及光照的变化;(2) 发型、眼镜、胡须以及人脸的表情变化等;(3) 图像中的噪声影响。因此从某种程度上说,人脸检测与定位甚至比人脸模式的识别更为关键.按照人脸检测技术的发展历程,本文依据采用的主要技术方法将人脸检测分为以下四种类型:基于特征检测的方法、基于肤检测的方法、基于模板匹配的方法、基于外观统计学习的方法。
3。1 基于特征检测的方法
基于特征的人脸检测方法依据人脸的面部几何特征、纹理特征、肤特征进行人脸和非人脸的判别,见下表:
表1 基于特征的人脸检测与关键特征定位算法
3.2 基于肤检测的方法
利用人脸肤信息进行人脸检测曾经一度成为人脸检测领域的研究热点,涌现了大量的学术文献,Lee等[14]最早利用人脸肤信息进行人脸定位;Saber[15]利用肤、人脸形状及几何对称信息实现人脸检测和面部特征的抽取;Jones[16]利用大量的样本图像对肤检测问题进行了分析,并建立了人脸肤的统计模型用于人脸检测,收到了较好的检测效果;Terrillon[17]使用高斯模型和混合高斯模型在不同度空间建立肤模型进行人脸检测,并进行了对比分析,结果发现混合高斯模型比一般高斯模型具有更好的泛化能力;Hadid[18]基于Skin-Locus建立肤模型,提取彩人脸区域实现人脸检测,但需要在固定成像参数下才保证有良好的性能,鲁棒性有待提高;Martinkauppi[19]对Skin—Locus理论进行了细致分析,发现人脸肤在各种光照条件下可以用两个二次或者多次多项式进行拟合;Comanieiu[20]采用Mean—Shift算法进行局部搜索实现人脸的检测与跟踪,该算法提高了人脸的检测速度,对遮挡和光照的鲁棒性较好,但对于复杂背景和多个人脸目标的检测不够鲁棒;Hsu[21]采用光照补偿的办法克服光照问题,从一定程度上解决了偏、复杂背景和多人脸目标的检测问题,对人脸的位置、尺度、旋转、姿态和表情等变化具有较好的鲁棒性;Sobottka和Pitas[22]结合肤(HSV)和人脸的形状信息来定位人脸和进行面部特征的提取;Terrillon[23]等利用高斯模型对肤象素进行聚类,并采用神经网络对二值图像的几何距进行学习实现人脸检测;Garcia和Tziritas[24]采用量化肤区域合并结合小波分析实现人脸检测.
总的说来,基于肤检测的方法鲁棒性的提高依赖于肤模型的质量,在背景相对简单的情况下可以获得良好的检测效果;但在复杂背景中,尤其是背景中存在较多的类肤区域时,检测质量将急剧下降.而且,肤模型在不同人种之间会存在较大的差异,因而很难建立一个通用性很强的人脸肤统计模型.因此,基于肤检测的人脸检测方法的应用受到一定限制。
3.3 基于模板匹配的方法
基于模板匹配的方法首先需要人工定义一组标准或参数化的人脸模式(通常为正面),称之为模板。对于给定输入图像,通过计算其与标准模板的相关系数并根据相关系数判断是否为人脸,详见表2。这种人脸检测方法实现简单,但是由于人脸尺度、姿态和形状的不确定性,基于模板的人脸检测方法通常达不到很高的准确率.
表2 基于模板匹配的人脸检测方法
卫生香3.4 基于统计学习的方法
与上述方法不同,基于统计学习的方法主要采用大量的人脸与非人脸样本对检测分类器进行训练,将人脸检测转化为二类模式分类问题。
Propp等人是最早采用神经网络[34]进行人脸检测的学者之一,他们通过构造一个4层(两个隐藏层)神经网络实现人脸检测,但没有相关检测性能的报道;后人在他们的基础上通过优化神经网络结构提出了时延神经网络(TDNN),自组织映射神经网络(SOM)、卷积神经网络(CNN)、概率决策神经网络(PDBNN)。Feraud 等人通过构造自协商神经网络(SNNN)[35]进行非线性主元分析,可以检测正面到左右60度旋转的人脸,他们的方法后来被Listen和Multrak采用。
Sung、Rowley、Lin&Kung 等[36]采用K-mean聚类算法在特征空间建立“人脸”和“非人脸"族,采用自举(bootstrap)方法首先建立一个仅使用人脸样本和少量非人脸样本训练的初始神经网络分类器对一
组图像进行训练,将误检的非人脸样本加入非人脸样本库;然后训练新的分类器,如此不断迭代,直到收集到足够多的非人脸样本,这种方法后来被许多学者所采用.
Carleson、Yang等[37]人提出的SNoW(Sparse Network of Winnows)学习方法,对检测不同特征、表情、姿态和光照条件下的人脸收到了较好的效果.其实质就是采用Winnow算法进行权值更新的稀疏神经网络;H。Schneiderman[38]提出的基于后验概率估计的方法,先对样本进行小波变换,然后对这些特征进行统计,通过统计计算训练样本的直方图求得人脸与非人脸的概率分布实现人脸检测。
不同于传统基于经验风险最小化的分类器,如贝叶斯分类器、神经网络分类器等,支持向量机分类器(SVM)以基于结构风险最小化原理最小化泛化误差,通过构造最优分类超平面实现模式分类。在这一领域,Osuna等人最早提出采用SVM分类器进行人脸检测,并提出了针对大规模数据集的SVM训练算法.实验结果显示基于SVM的人脸检测速度比早先Sung等人提出的神经网络人脸检测快足足30倍。
Nefian[39]等人采用隐马尔可夫模型(Hidden Markov Models简称HMM)检测人脸.HMM是一种双重的随机过程,采用节点表示状态,有向边表示状态之间的转移。因此适合描述信号统计特性。Nefian等通过检测区域中的每个子区域,采用K-L变换系数作为观测矢量,通过B—W和维特比算法获得HMM的模型参数,依据区域观测序列的输出概率判决是否为人脸。
3。5 AdaBoost算法训练器
康柏研究院的Viola[40]在2001国际计算机学术年会上发表的论文标志着人脸检测技术开始走向实用。他们通过综合AdaBoost[41,42,43]和Cascade算法实现了实时人脸检测,使得人脸检测开始迈向实用化的道路。而且首次引入了“积分图像"( Integal Image)的概念,大大加快了检测过程中特征的计算速度。利用Adaboost 学习算法提高一个简单分类器(弱分类器)的性能,理论上最终形成的强分类器的训练错误率接近零,而且推广性好。Viola在他的实验中定义了180000种矩形特征,通过实验选择一小部分特征形成一个有效的分类器。
继Viola等提出用于人脸检测的AdaBoost算法之后,许多学者对他们的算法进行了继承和发展。首先,Lienlxart等人提出了新的旋转Haar-Like特征,可以用于旋转人脸的快速检测,同时提出了一些其他的Boosting法:如Discrete AdaBoost, Real AdaBoost, Gentle AdaBoost等。
Froba在AdaBoost算法基础上提出了基于灰度图像的正面和平面内旋转人脸实时检测系统,在EOM ( Edge Orientation Matching)的基础上进行扩展,引入SNoW算法进行校验,得到一个更为鲁棒的系统.
国内的李子清在AdaBoost算法基础上提出了FloatBoost算法,实现多视角人脸检测,通过从粗到精、从简单到复杂的金字塔型的人脸检测;与传统的Adaboost算法相比,能在提高人脸检测速度的同时提高检测精度。
Liu提出了基于Kullback—Leibler Boosting ( KLB)算法的分类器,解决了传统AdaBoost算法存在的弱分类器的最优组合以及最优分类器和特征的选择问题。Viola本人也对AdaBoost算法进行了改进,提出了不对称AdaBoost算法,用于快速图像检索和人脸检测。
总的说来,基于Boosting和Cascade算法的系统在速度方面具有很大的优越性,通过Haar—Like特征训练一些弱分类器,再组合成一个强分类器。如何在提高检测精度的同时不降低检测速度,可以从以下方面综合考虑:采用更优的特征描述方法,综合AdaBoost和强分类器。保安接线排
3.6 多种方法的结合
人脸检测与精确定位是一个颇具挑战性的研究课题,一些效果较好的人脸检测系统并不只是采用上述的某种方法,而是将多种方法有机地融合。主流的方法大多是基于统计学习的,因此受学习样本的影响较大,不同样本集合对算法的性能也有一定影响。复杂背景中正面人脸检测已经有了比较好的结果,多姿态人脸检测仍然是目前的研究重点,虽然取得了一些进展,但如何利用人脸的深度信息解决姿态和光照问题还有待进一步研究。
4 人脸的识别方法
识别人脸主要依据那些在不同个体之间存在较大差异而对于同一个人则比较稳定的特征。具体的特征
形式随识别方法的不同而不同。早期研究较多的静态人脸识别方法有基于几何特征的人脸识别方法和基于相关匹配的人脸识别方法.目前,静止图像的人脸识别方法主要有三个研究方向:一是基于统计的识别方法,包

本文发布于:2023-06-04 23:51:27,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/4/126430.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:人脸   检测   进行   图像   方法
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图