从工业革命、电气革命、数字革命到智能时代,我们已经步入了人类赋予机器智慧的新时代。过去一年,全面屏、人脸解锁和屏下指纹已然成为手机圈中最热的三大技术,然而当差异化越来越小之时,又驱动着新的创新技术诞生,而AI正成为各大手机厂商新的竞争点,人工智能一跃而起成为手机圈中的“香饽饽”。 纵观当下,人工智能被广泛应用于机器人、语音识别、图像识别等领域,移动互联网时代信息传播效率的飞速提升让人们真正看到了AI技术改变人类未来生活方式的可能性。
在人工智能大赛道中,人脸识别是其中发展较为成熟的应用领域。同时,人脸识别是符合国家政策趋势、惠及民生的领域,国家863计划、国家科技支撑计划、自然科学基金都会拔出了专款资助人脸识别的相关研究。在国家政策的支持和完善下,人脸识别技术将会被推向更广阔的日常领域。
如今,“刷脸”已经成了人们生活中的日常事务,从移动支付、解锁手机到学校、公司、小区门禁等,都运用到了人脸识别技术。人脸
识别技术产品已广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗及众多企事业单位等领域。
人脸识别在手机端行业中,掀起了人脸识别解锁技术热潮,各大手机厂商也蜂拥挤入,其中最有影响力的便是iPhone X的Face ID。面对日益激烈的行业竞争,如何在强敌林立之下到自身的立足之地,创新、突破技术显得尤为重要,在这一点上,旷视科技Face++凭借其核心的人脸识别技术,成为行业中的“佼佼者”。
峰会现场
日前,由手机报在线举办的AI手机产业峰会在深圳圆满落幕。据了解,旷视科技Face++副总裁敖翔莅临本次峰会,并以“手机人脸识别的新进展”为主题,深入讲述了公司的跨模态人脸识别和人像光效两大技术。
跨模态人脸识别技术
跨模态人脸识别技术在生活中已得到真实应用,在最近的vivo X21的发布会上,vivo X21为提升人脸解锁的性能和场景宽度选择,再度与旷视科技Face++合作,并在原有的人脸识别解锁方案上增加了景深技术和近红外技术,实现了2PD全像素双核单摄红外人脸解锁。
vivo X21在摄像头方面,其前置摄像头类似红外发射器,可做到全天候刷脸,晚上一点光线都没有的情况下也可以刷脸。此外,在红外方面,传统的红外方案是一个红外发射器、一个红外接收器,还有 滤菌器一个主摄像头。据敖翔介绍,旷视为vivo提供了一个更大胆、更厉害的方案,即一个发射器和一个主摄像头,主摄像头可以感受红外,基本上是全通的摄像头。敖翔表示,相比传统的红外方案,这项方案具有三个明显优势:
1、方案易用,只有一个发射器和一个主摄像头,模组结构简单、利于集成。
149aa
2、用户体验非常好,不受光线影响,任何光线环境下都可以解锁,良好的用户体验也将使vivo X21具有更大的市场优势。
3、硬件成本优势,体现在传感器较少,本身有前置摄像头。但这一点既是优势,然而也存在很大的风险。
解扰而事实上,这个方案的实现非常困难,如何将红外的人脸识别和RGB人脸识别相融合,并且做到无缝转换和融合,这是难点所在。
旷视科技副总裁敖翔(现场图)
风险点在于IR数据存量少。对Face++来说,RGB识别不是问题,其RGB的图像数据很多,里面有几千万张脸,就算是现场采集人脸
二氧化钼
也可以采集到几万、几十万张。但就IR识别而言,对整个行业来说存量的IR数据很少,且IR每个镜头不一样,所以用特定模组采,采的IR数据就很少。在IR数据特别少的情形下,同时做RGB识别,又做IR识别,这是一个挑战,尤其对做人脸识别这种非常精密的识别来说是非常大的挑战。
pbcl2Face++成功地将跨模态人脸识别技术运用到vivo X21上,这是在手机产业界上非常完美的一次运用,旷视科技采用神经网络里面一种流行的办法——Domain Transfer Learning域迁移学习,从而解决了该项技术上的难题,可以说是学术界的重大技术突破。
如何实现跨模态人脸识别技术
对于如何实现跨模态人脸识别技术,敖翔做出了深入阐述:“首先需要做的是RGB训练。根据现有的模型和高精度人脸识别网络结构,从中获取参数;接下来,将网络直接平移过去做新的网络,所有的参数保留,这相当于给RGB信号做预训练,从而得到大量数值化参数,再用少量红外数据去微调网络,经过巧妙的网络设计和训练技巧,进而得到高精度红外和红外相对比的算法。”