基于深度学习的人脸识别算法研究

阅读: 评论:0

基于深度学习的人脸识别算法研究鼓芯
杨涵
【期刊名称】《《电子设计工程》》
【年(卷),期】2019(027)019
【总页数】5页(P155-159)
【关键词】伞齿轮传动人脸识别; 深度学习; 深度置信网络; 局部二值模式
【作 者】杨涵
轮椅电机【作者单位】四川川大智胜软件股份有限公司 四川成都610000
【正文语种】中 文
【中图分类】TP391.41
卡口摄像头
近年来,人脸识别技术快速发展,逐渐成为了生物特征识别、模式识别、机器视觉等领域中的研究热点之一。其被广泛应用于众多行业,具有较高的研究价值[1]。目前,已经出现了诸多较为成熟的人脸识别的算法,例如LBP、PCA、ANN等效果良好。尽管人脸有较为显著的特征,但人脸特征在不同条件下例如光线变化不同、姿态不同、遮挡部分不同和面部表情不同会受到影响,导致类间间距小、类内间距大的问题。随着深度学习发展地逐渐成熟,众多专家学者开始关注深度学习并致力于对其进行研究。从国内外的研究方向可以看出,利用深度学习方法解决人脸识别问题也逐渐成为热点。例如,SAE、DBN、CNN等,可在传统方法的基础上使得人脸识别的准确率有较大提高。本文在传统方法的基础上加入了深度学习方法,提出了一种局部二值模式和深度置信网络结合的人脸识别算法。不仅在非限定条件下有较好的表现能力,且识别准确率也有大幅提高。
1 人脸识别系统
1.1 人脸识别原理
人脸识别的原理是依据生物生理特征,在原始图像上根据人脸检测算法得到人脸区域,再根据特征提取算法提取人脸特征,最后根据这些特征对人脸图像进行身份识别认证。人脸
识别的大体流程,如图1所示。
1.2 人脸识别预处理
在进行人脸识别前,需要对图像进行预处理,使后续步骤更为便捷,主要有以下操作:
图1 人脸识别框图
1)直方图均衡化。直方图均衡化的主要思想是:将原始图像中比较集中的灰度区间映射到整个图像的不同灰度范围中。具体而言,直方图均衡化的实质是将图像进行非线性拉伸,重新分配图像的像素值,使在一定灰度范围内图像各个像素值的个数大体相同[2]。处理后原先随机分布的图像直方图,会变成均匀分布的直方图样。
锅巴生产设备2)平滑处理。图像平滑处理是在保证图像细节完整的前提下,进行平滑去噪的一种图像处理方法。平滑处理的优点在于平滑效果越好,图像质量改善越好,且不会损坏图像的重要特征信息[3]。
1.3 人脸识别存在的问题
尽管人脸识别技术给生产、生活带来了便利之处。但在实际生产应用中,人脸识别还存在一些需要解决的问题,大致可分为以下几点:
1)姿态问题:人脸处在一个三维立体的空间中,当人脸随着头部上下左右转动时会导致人脸信息不同,也可能造成人脸信息不全的情况。此外,不同方向的投影也会使得图像的面部特征产生较大差别。因此,如何有效提取特征尤为重要。而姿态的选择与处理也是较为重要的环节。
2)表情问题:与指纹识别不同,人脸存在表情的变化,如:哭、笑、发怒等不同的表情所体现的特征也会不同,均会对人脸识别的准确性产生影响。因此,为避免表情对人脸识别造成误差,对特征的提取提出了较高的要求。
3)光照问题:现实生活中光线的强弱变化,会对图像产生影响,光线不同会削弱人脸的一些固有特征。因此,对正确判别影响较大。所以,由光照引起的影响因素是目前亟待解决的重要问题。尤其是当人脸图片分辨率过低或由于其他原因损毁严重时,即使已经过图像增强和平滑等预处理过程,仍难以得到较高的识别率。
4)遮挡问题:在图像获取的过程中,人脸图像有时存在部分遮挡,可对图像的完整性造成影响,进而对人脸识别的准确性产生影响。
5)其他问题:除了以上几种情况,在人脸图像识别的过程中,也可能存在其他问题,如动态目标辨认或者人脸尺度大小变化等。现有的提取特征方法有:通过人眼、口或鼻等重要器官基于几何特点的方法,作为关键点辨认;如利用卷积神经网络进行辨别的基于神经网络的方法;如采取主成分分析来进行人脸特征的提取,将获取的特征向量投影到特征子空间中以获取欧氏距离,从而比对相似程度。
2 人脸识别算法
2.1 传统人脸识别算法
1)主成分分析(PCA)
该方法的核心思想是假设存在人脸图像的区域是一个随机变量,再采用K-L变换得到正交K-L基。其中特征值越大的基,包含的人脸信息越多。因此,PCA方法也被称为特征脸方法[4]。将多个包含人脸信息的特征基进行线性组合,便可完整的描述出人脸图像特征,从而
实现特征提取及降维处理。即PCA算法中人脸识别的过程是将人脸图像数据映射到由特征基组成的子空间,并通过分类算法对不同特征的人脸分类,最终实现了人脸识别。PCA模型框图,如图2所示。
图2 PCA模型框图
2)局部二值模式(LBP)
随着对LBP算子研究的逐渐深入,该方法己应用于图像内容识别方向,也可较好的应用于人脸识别方向[5]。BP算子在人脸识别中的实现原理为,选取一块像素3×3大小的邻域,将图像中心像素的值和周围的8个像素点的值进行对比,如中心点的像素值比周围邻域像素值大,则邻域值记为1,否则记为0。具体实现过程,如图3所示。
屋顶融雪装置用具体公式表示如下:
图3 LBP算子实现过程
式(1)中(xc,yc)代表该邻域的中心像素,ic表示为图像中心像素的值,ip代表的是图像邻域范围内其他像素点的值。h(x)的具体表示如下:
3)BP神经网络
BP神经网络的原理是先利用前向传播计算网络输出,计算输出部分的误差。然后利用反向传播算法向前估计输出层与前一层的误差,一直向前进行误差的更迭[6]。再根据层与层之间的误差估计来不断调整各层的连接权值,最后利用调整好的连接权值重新计算输出误差,直到输出的误差达到要求或者迭代次数达到提前设定的较大值为止。具体的BP神经网络模型图,如图4所示。神经网络的学习规则就是通过不断地反向传播和修正权值、阈值,使误差降低至最小。但不断迭代的缺点是计算成本较高,若样本数据维数过大,将会导致计算成本较大。因此,为解决维数导致的计算量过大问题,通常会采用降维的预处理方式,从而实现降低数据计算量以及去掉兀余数据的目的。
图4 BP神经网络模型图
图4中的,这是一个以 S型函数作为激励函数的人工神经元。
正则化神经网络代价函数(多分类):
BP神经网络的执行过程如下:
①前向传播
对于一个给定的输入,可通过前向传播计算出假设函数的输出。此循环进行多次前向传播计算,一个输入便可得到神经网络中每一个神经元的激励值[7]。
②反向传播
定义神经网络的总误差为
要使总误差E最小,则要调整权重,每层的权重更新为:
因此,权重的更新方式为:
其中,1≤i≤K。对于多类别分类,使用神经网络相当于最后一层有K个逻辑回归分类器。神经网络中正则化则是让从输入层到输出层之间每两层的映射权重矩阵Θ(j)内的每一个元素均保持在较小的数。

本文发布于:2023-06-19 02:43:41,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/3/144187.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:图像   人脸   人脸识别
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图