全面解析深度学习人脸识别VS传统人脸识别

2019-04-09

传统的人脸识别和深度学习的人脸识别

● 传统的人脸识别(上一代的学习方法都是浅层学习)识别准确率最多也就能到70%,而应用深度学习技术的人脸识别系统准确率全天候平均能达到90%之多。

● 传统人脸识别只能通过双眼特征这样的简单属性做人脸识别,可识别的人脸属性过少。而应用深度学习技术的人脸识别系统采用全局人脸特征检索,对人脸全局特征进行建模分析,而不局限于人眼局部特征,因此采用深度学习人脸识别算法准确率已超过人眼极限。

● 从直观效果上讲,传统人脸识别算法模型简单无法准确识别戴口罩、戴帽子、戴眼镜等各种轻微的装饰,而深度学习的人脸识别系统不但能识别戴口罩、戴帽子、戴眼镜等常规装饰,还能够识别假胡须、假发、大墨镜等各种伪装,即便嫌疑人蓄意伪装,深度学习下的人脸识别算法也能够精准的对在逃的目标嫌疑人实现精准布控。

● 传统人脸识别算法通常识别时间长,识别时还必须正面摄像机,实用性不高。而应用深度学习的人脸识别系统,能够在人海中迅速检索出人脸并抓怕,即便使行人故意躲避,左右旋转30度,俯仰15度依然能够精准识别,大幅度提升了人脸识别的实用性。

深度学习将改变几乎所有产业,对深度学习的应用,未来很难想象有多少令人兴奋的尝试还会发生在安防行业。当前主要的三类不同的人脸检测方法:以VJ人脸检测器为代表的传统方法,基于深度网络的现代方法,以及将传统的人脸检测技术和深度网络相结合的方法。下文将对他们进行全面的解析。

深度学习给目标检测带来的变革

人脸检测作为一种特定类型目标的检测任务,一方面具有其自己鲜明的特点,需要考虑人脸这一目标的特殊性,另一方面其也和其它类型目标的检测任务具有一定的共性,能够直接借鉴在通用目标检测方法上的研究经验。

目标检测任务作为一个分类问题,其不仅受益于计算机视觉领域相关技术的不断发展,在机器学习领域的研究进展同样也对目标检测任务具有推波助澜的作用。事实上,从2006年开始逐步蔓延开的深度学习大爆发给目标检测的研究带来了强劲的助推力,使得通用的目标检测以及各种特定类型目标的检测任务得到了跨越式地发展。

从神经网络到深度学习

用深度学习的人脸识别系统,早期需要把现实的图像抽象成一系列数据进行学习及了解人脸的特征,在构建了一套最基本的人工智能学习算法后,提供大量人脸及非人脸照片,包括同样的人脸在不同光线、表情、角度的照片,让计算机去适应辨别、学习。

从“深度学习”这一字面上可以看到,神经网络改头换面重出江湖,关键在一个“深”字上。神经网络是一种受大脑结构启发而设计出的层级模型,其由一系列按照一定规则相连接的节点组成,形成一种层次化的结构。最简单的一个神经网络只包含3层:输入层、隐层(和外部的输入、输出没有直接关联)和输出层,相邻两层之间的节点通过有向边相连接,其中每条边对应有一个权值。

早期的神经网络一般层数比较少(如3层的浅层网络),因为多层的深度网络学习起来非常困难,在各种任务上难以取得令人满意的表现,这一状况直到 2006 年才被打破。在2006年,机器学习领域的泰斗 Geoffrey E.Hinton 教授在《科学》杂志上发表了题为《Reducing the Dimensionality of Data with Neural Networks》的论文,这一工作为深度网络的学习提供了一种有效的解决方案:采用无监督的方式对网络进行逐层预训练,从而打开了学习深度网络的大门。在接下来的几年中,人们对深度网络的热情已经高涨到了无以复加的地步,有关设计和学习深度网络的各种问题也逐一被解决,从初始化方式到优化方法,从激活函数到网络结构,科研工作者们对此产生了全方位的研究,使得深度网络的训练能够做得又快又好。

检测精度的大跃进

随着越来越多的检测器开始采用深度网络,人脸检测的精度也开始大幅地提升。在2014年,学术界在FDDB上取得的最好检测精度是在100个误检时达到84%的检测率,达到这一精度的是JointCascade 人脸检测器。到2015年,这一纪录被FacenessNet 打破,在100个误检时,检测率接近88%,提升了几乎4个百分点。不仅如此,如今的最好记录已经达到了100个误检时99.7%的检测率,检测率达到 99%以上的公司还不止一家,并且这些结果都是通过基于深度网络的人脸检测器所获得的。

在大幅提升人脸检测精度的同时,深度学习实际上还降低了包括人脸检测技术在内的各种目标检测技术的门槛,几乎到了只要采用深度网络就能获得不错的检测精度的地步;在精度方面,相比于基于非深度学习方法的检测器,基于深度学习方法的检测器在起点上就要高出一截。

传统人脸检测技术和 CNN 的结合

VJ人脸检测器自提出以来,启发和影响了后续的大量工作,所引入的积分图、AdaBoost方法、级联结构等至今仍在各种各样的检测器中以不同的形式被使用。传统的人脸检测技术优势在于速度,而在精度上则相比基于深度网络的方法要略输一筹,在这种情况下,一个自然的想法就是:能否将传统的人脸检测技术和深度网络(如CNN)相结合,在保证检测速度的情况下进一步提升精度?

吸取传统人脸检测技术中的精华,借鉴深度学习研究的最新成果,在对问题的深刻思考和理解上,探寻旧瓶装新酒的最佳模式,这是一条值得去继续探索的道路。