汇总成应用层下的人脸识别系列文章（三）-MTV学习库

1. 人脸对比型

人脸比对类型可分为四种类型，即：人脸1:1、人脸1:n、人脸1:N、人脸M:N。

人脸识别应用围绕这四种比较方法展开。下面将依次介绍各种比较类型。

1. 脸部1:1

人脸1:1一般用于证人验证，可以简单理解为：证明你就是那个人。

例如：乘坐火车、飞机、进出境、到银行办卡时，通常需要验证持身份证人是否为同一人。

如下图所示，系统只需读取二代身份证中的人脸照片，并与现场抓拍的人员照片进行比对即可。

人脸1:1又称静态人脸比对，同样具有合作的特点。完成比对，用户需要携带身份证并积极配合采集人脸。

2. 面 1:n

人脸1:n：将一张人脸照片与人脸数据库中的多张人脸进行一一比较。人脸数据库中有多少张脸就需要进行多少次比较——平台收集“我”的照片。拍照后，它会从海量人像数据库中找到与当前用户人脸数据相匹配的图像，并进行匹配，找出“我是谁”。

Face 1:n也称为动态人脸比对。

比对照片是从动态视频中获得的，具有非合作的特点——整个比对过程是不可感知的，不需要人的合作。这两个特点让“面1：n”能够被警方快速实施追捕逃犯，但难度却远高于“面1：1”。（通常会受到光照和面部姿势变化的影响——比如侧脸、低头、逆光，这些都会大大增加面部的漏报率。）

人脸1:n中“n”的大小（人脸库照片的数量）会影响人脸识别的准确率和比对速度，因此比对人脸库的大小会设置得比较小。

3.面1：N

人脸1:N也叫静态大库检索：即以人脸图片和人脸相似度作为搜索条件，在人脸数据库中搜索与其相似（相似度大于设定阈值）的图片——类似于百度。图片搜索。

实际的检索过程是进行N次人脸比较，并留下分数大于阈值的结果。

Face 1:N的人脸数据库规模比Face 1:n大很多，最多可以支持1亿张人脸搜索，所以这里的N是大写的。

4. 面 M:N

Face M:N实际上是两个人脸数据库的比较。

例如：人脸库A有M张脸，人脸库B有N张脸。如果要查看人脸库A和人脸库B中有多少个相同的人，需要将人脸库A中的M张脸与人脸库B中的N张脸一一比较，相当于M的1:N相加面孔。的结果。

M:N人脸常用于惯犯筛查和身份核对。

例如：办案人员在处理三抢劫一盗窃等案件时，一般来说，80%的案件都是惯犯。因此，通过线索所在地的路人数据库与惯犯数据库进行M:N的人脸比对和碰撞，可以快速识别犯罪嫌疑人，找出侦查方向。

二、人脸比对要素 1、人脸数据

人工智能算法的演进必须有数据的支撑。

使用大量标记数据来训练模型，可以将识别准确率从 70% 提高到 99%。客观准确的数据是人工智能应用的必要条件。

获取人脸数据的五种方式：

监控摄像头、手机摄像头等各类摄像头：拍摄的视频和照片是原始人脸数据的主要来源。在项目中，此类摄像机往往通过RTSP、FTP等协议进行连接，以获取实时视频流或图像流。 NVR/DVR等视频存储设备：存储大量视频资源，可以通过ONVIF协议连接此类设备获取数据。第三方企事业单位人员信息数据库：如公安八大信息资源数据库、企业员工信息数据库等。此类数据获取难度较大，会涉及到第三方平台对接，存在以下问题：还必须考虑机密性和网络安全。互联网开放数据集：FDDB、LFW、Face等常用人脸数据集提供高质量的标注数据，可用于算法测试和模型训练。网络爬行：通过编写或使用免费的网络爬行程序自动从万维网上爬取图像。它们广泛用于互联网上的数据收集。 2.人脸比对数据库

人脸比对库提供人脸识别的比对模板——人脸1:n、人脸1:N、人脸M:N必须有人脸比对库才能进行比对。

系列的第二篇文章《应用层下的人脸识别（二）：人脸数据库》详细介绍了建立人脸数据库的方法。

3. 比较阈值

比较阈值：人脸比较的相似度。

人脸比较结果以相似度值的形式呈现。在进行人脸比较之前，需要设置相似度阈值。如果大于该阈值，则判定两张照片可能是同一个人。

比对阈值对人脸识别的准确率和漏报率影响很大。比较阈值设置得越高，准确率越高，但漏报率也会增加。比较阈值没有固定标准，应根据应用场景灵活调整。

例如：刷脸支付更注重比对准确度，因此需要提高门槛；而公安嫌疑人的人脸识别需要减少误报，因此需要适当降低门槛。

4. 芯片

人工智能的三要素是算法、算力和数据，而芯片决定了算力。

深度学习工程（训练）和（推测）两个关键环节需要大量的计算能力，普通CPU无法满足计算需求。

高性能GPU、TPU、FPGA、ASIC等加速芯片的陆续推出，极大地提高了计算速度，也推动了算法的发展。

在1:n、1:N、M:N人脸比对中GPU是不可或缺的。但部分人脸的1:1计算不需要大量的计算量，不需要使用加速芯片。通过GPU加速，亿级人脸检索可秒级返回结果。

5.人脸算法

人脸算法的效果决定了人脸识别的上限，也是人脸比对最关键的要素。随着深度学习技术的普及，各大公司的面部算法效果之间的差距越来越小。

目前主流的人脸识别算法可以分为以下四类：

基于人脸特征点的识别算法基于整张人脸图像的识别算法基于模板的识别算法基于神经网络的识别算法

2018年11月20日公布了被誉为业界黄金标准的全球人脸识别算法测试（FRVT）结果（如下图）：

排名前五的算法全部被中国拿下：

虽然人脸算法在各种数据集的测试中具有较高的准确率，但对于商业应用来说还远远不能令人满意。

目前仍有许多缺陷需要解决，例如：

姿势问题：

人脸识别主要基于人的面部表征特征。 “如何识别姿势引起的面部变化？” 成为该技术的难点之一。

姿势问题涉及：头部围绕三维垂直坐标系中的三个轴旋转引起的面部变化。其中，垂直于图像平面的两个方向的深度旋转会导致面部信息的部分丢失。这使得姿势问题成为人脸识别中的技术问题。

关于姿势的研究相对较少。目前大多数人脸识别算法主要针对正面和准正面人脸图像。当发生俯仰或左右变化时，人脸识别算法的识别率也会急剧下降。

图像质量问题：

人脸图像的来源可能多种多样，并且由于采集设备的不同，所获取的人脸图像的质量也不同。

尤其是对于那些分辨率低、噪声大、质量差的人脸图像（如手机摄像头拍摄的人脸图像、远程监控拍摄的图像等），“如何进行有效的人脸识别？” 是一个需要注意的问题。

需要进一步研究高分辨率图像对人脸识别算法的影响。

现在，我们在进行人脸识别时，一般都会使用相同尺寸、分辨率非常接近的人脸图像，因此图像质量问题基本上可以得到解决。但面对现实中更加复杂的问题，仍然需要不断优化和处理。

遮挡问题：

对于非合作情况下的人脸图像采集，遮挡问题是一个非常严重的问题。

尤其是在监控环境中，被监控对象经常佩戴眼镜、帽子等配饰，使得采集到的人脸图像很可能不完整，影响后续的特征提取和识别，甚至影响人脸检测算法。失败的。

当面部特征被遮挡时，人脸算法的表现并不是很好。

目前遮挡识别效果良好的算法可以稳定识别遮挡在20%以内、块大小在30*30以下的人脸。

样本缺失问题：

基于统计学习的人脸识别算法是目前人脸识别领域的主流算法，但统计学习方法需要大量的训练。

由于人脸图像在高维空间中的分布是不规则流形分布，因此能够获得的样本仅采样了人脸图像空间的很小一部分。对于“如何解决小样本下的统计学习问题？”，还需要进一步研究。

以上是该系列的第三篇文章——《应用层下的人脸识别（三）：人脸比对》的相关内容。

欢迎大家添加公众号“阳春百洁”继续与我交流图像识别相关问题。

给这篇文章的作者打赏

相关文章

如何在电脑版上玩传奇单机版玩法大揭秘

（炉石传说）本周新版本对局样本数量不够

徐静蕾解读这个“复杂”的自己