您的位置  > 互联网

汇总成应用层下的人脸识别系列文章(三)

1. 人脸对比型

人脸比对类型可分为四种类型,即:人脸1:1、人脸1:n、人脸1:N、人脸M:N。

人脸识别应用围绕这四种比较方法展开。 下面将依次介绍各种比较类型。

1. 脸部1:1

人脸1:1一般用于证人验证,可以简单理解为:证明你就是那个人。

例如:乘坐火车、飞机、进出境、到银行办卡时,通常需要验证持身份证人是否为同一人。

如下图所示,系统只需读取二代身份证中的人脸照片,并与现场抓拍的人员照片进行比对即可。

人脸1:1又称静态人脸比对,同样具有合作的特点。 完成比对,用户需要携带身份证并积极配合采集人脸。

2. 面 1:n

人脸1:n:将一张人脸照片与人脸数据库中的多张人脸进行一一比较。 人脸数据库中有多少张脸就需要进行多少次比较——平台收集“我”的照片。 拍照后,它会从海量人像数据库中找到与当前用户人脸数据相匹配的图像,并进行匹配,找出“我是谁”。

Face 1:n也称为动态人脸比对。

比对照片是从动态视频中获得的,具有非合作的特点——整个比对过程是不可感知的,不需要人的合作。 这两个特点让“面1:n”能够被警方快速实施追捕逃犯,但难度却远高于“面1:1”。 (通常会受到光照和面部姿势变化的影响——比如侧脸、低头、逆光,这些都会大大增加面部的漏报率。)

人脸1:n中“n”的大小(人脸库照片的数量)会影响人脸识别的准确率和比对速度,因此比对人脸库的大小会设置得比较小。

3.面1:N

人脸1:N也叫静态大库检索:即以人脸图片和人脸相似度作为搜索条件,在人脸数据库中搜索与其相似(相似度大于设定阈值)的图片——类似于百度。 图片搜索。

实际的检索过程是进行N次人脸比较,并留下分数大于阈值的结果。

Face 1:N的人脸数据库规模比Face 1:n大很多,最多可以支持1亿张人脸搜索,所以这里的N是大写的。

4. 面 M:N

Face M:N实际上是两个人脸数据库的比较。

例如:人脸库A有M张脸,人脸库B有N张脸。 如果要查看人脸库A和人脸库B中有多少个相同的人,需要将人脸库A中的M张脸与人脸库B中的N张脸一一比较,相当于M的1:N相加面孔。 的结果。

M:N人脸常用于惯犯筛查和身份核对。

例如:办案人员在处理三抢劫一盗窃等案件时,一般来说,80%的案件都是惯犯。 因此,通过线索所在地的路人数据库与惯犯数据库进行M:N的人脸比对和碰撞,可以快速识别犯罪嫌疑人,找出侦查方向。

二、人脸比对要素 1、人脸数据

人工智能算法的演进必须有数据的支撑。

使用大量标记数据来训练模型,可以将识别准确率从 70% 提高到 99%。 客观准确的数据是人工智能应用的必要条件。

获取人脸数据的五种方式:

监控摄像头、手机摄像头等各类摄像头:拍摄的视频和照片是原始人脸数据的主要来源。 在项目中,此类摄像机往往通过RTSP、FTP等协议进行连接,以获取实时视频流或图像流。 NVR/DVR等视频存储设备:存储大量视频资源,可以通过ONVIF协议连接此类设备获取数据。 第三方企事业单位人员信息数据库:如公安八大信息资源数据库、企业员工信息数据库等。此类数据获取难度较大,会涉及到第三方平台对接,存在以下问题:还必须考虑机密性和网络安全。 互联网开放数据集:FDDB、LFW、Face等常用人脸数据集提供高质量的标注数据,可用于算法测试和模型训练。 网络爬行:通过编写或使用免费的网络爬行程序自动从万维网上爬取图像。 它们广泛用于互联网上的数据收集。 2.人脸比对数据库

人脸比对库提供人脸识别的比对模板——人脸1:n、人脸1:N、人脸M:N必须有人脸比对库才能进行比对。

系列的第二篇文章《应用层下的人脸识别(二):人脸数据库》详细介绍了建立人脸数据库的方法。

3. 比较阈值

比较阈值:人脸比较的相似度。

人脸比较结果以相似度值的形式呈现。 在进行人脸比较之前,需要设置相似度阈值。 如果大于该阈值,则判定两张照片可能是同一个人。

比对阈值对人脸识别的准确率和漏报率影响很大。 比较阈值设置得越高,准确率越高,但漏报率也会增加。 比较阈值没有固定标准,应根据应用场景灵活调整。

例如:刷脸支付更注重比对准确度,因此需要提高门槛; 而公安嫌疑人的人脸识别需要减少误报,因此需要适当降低门槛。

4. 芯片

人工智能的三要素是算法、算力和数据,而芯片决定了算力。

深度学习工程(训练)和(推测)两个关键环节需要大量的计算能力,普通CPU无法满足计算需求。

高性能GPU、TPU、FPGA、ASIC等加速芯片的陆续推出,极大地提高了计算速度,也推动了算法的发展。

在1:n、​​1:N、M:N人脸比对中GPU是不可或缺的。 但部分人脸的1:1计算不需要大量的计算量,不需要使用加速芯片。 通过GPU加速,亿级人脸检索可秒级返回结果。

5.人脸算法

人脸算法的效果决定了人脸识别的上限,也是人脸比对最关键的要素。 随着深度学习技术的普及,各大公司的面部算法效果之间的差距越来越小。

目前主流的人脸识别算法可以分为以下四类:

基于人脸特征点的识别算法 基于整张人脸图像的识别算法 基于模板的识别算法 基于神经网络的识别算法

2018年11月20日公布了被誉为业界黄金标准的全球人脸识别算法测试(FRVT)结果(如下图):

排名前五的算法全部被中国拿下:

虽然人脸算法在各种数据集的测试中具有较高的准确率,但对于商业应用来说还远远不能令人满意。

目前仍有许多缺陷需要解决,例如:

姿势问题:

人脸识别主要基于人的面部表征特征。 “如何识别姿势引起的面部变化?” 成为该技术的难点之一。

姿势问题涉及:头部围绕三维垂直坐标系中的三个轴旋转引起的面部变化。 其中,垂直于图像平面的两个方向的深度旋转会导致面部信息的部分丢失。 这使得姿势问题成为人脸识别中的技术问题。

关于姿势的研究相对较少。 目前大多数人脸识别算法主要针对正面和准正面人脸图像。 当发生俯仰或左右变化时,人脸识别算法的识别率也会急剧下降。

图像质量问题:

人脸图像的来源可能多种多样,并且由于采集设备的不同,所获取的人脸图像的质量也不同。

尤其是对于那些分辨率低、噪声大、质量差的人脸图像(如手机摄像头拍摄的人脸图像、远程监控拍摄的图像等),“如何进行有效的人脸识别?” 是一个需要注意的问题。

需要进一步研究高分辨率图像对人脸识别算法的影响。

现在,我们在进行人脸识别时,一般都会使用相同尺寸、分辨率非常接近的人脸图像,因此图像质量问题基本上可以得到解决。 但面对现实中更加复杂的问题,仍然需要不断优化和处理。

遮挡问题:

对于非合作情况下的人脸图像采集,遮挡问题是一个非常严重的问题。

尤其是在监控环境中,被监控对象经常佩戴眼镜、帽子等配饰,使得采集到的人脸图像很可能不完整,影响后续的特征提取和识别,甚至影响人脸检测算法。 失败的。

当面部特征被遮挡时,人脸算法的表现并不是很好。

目前遮挡识别效果良好的算法可以稳定识别遮挡在20%以内、块大小在30*30以下的人脸。

样本缺失问题:

基于统计学习的人脸识别算法是目前人脸识别领域的主流算法,但统计学习方法需要大量的训练。

由于人脸图像在高维空间中的分布是不规则流形分布,因此能够获得的样本仅采样了人脸图像空间的很小一部分。 对于“如何解决小样本下的统计学习问题?”,还需要进一步研究。

以上是该系列的第三篇文章——《应用层下的人脸识别(三):人脸比对》的相关内容。

欢迎大家添加公众号“阳春百洁”继续与我交流图像识别相关问题。