纽豪斯年度报告:人脸门禁产品技术白皮书

2019-04-12 · 作者:房叔话安防

[导读]本白皮书将从人脸门禁产品应用场景分类、产品类型分级、主要功能划分、产品形态、硬件、软件、测试检验方法、行业解决方案、未来发展趋势多个章节进行论述。

人脸门禁产品技术白皮书(2019版)

编写单位:

广东中科人人智能科技有限公司

广东赛翼智能科技有限公司

AI智道

发布:

AI智道

编委会:

王海增  广东中科人人智能科技有限公司董事兼总经理

纽豪斯  AI智道主笔

周  鹿   广东赛翼智能科技有限公司副总经理

彭国标  广东赛翼智能科技有限公司研发总监


前言

无感通行一定是未来出入口控制系统的发展趋势,无闸机、无需人员配合即可便利通行,但又能保障系统的安全性。人工智能(AI)技术给无感通行带来无限的可能性。

近30年来对整个安防系统,乃至整个弱电系统来说,发生革命性技术突破的当属视频监控技术,其核心就来源于AI技术中的计算机视觉技术。如今的监控技术可以广泛应用于监控、门禁、车辆出入、访客、消费、考勤、电梯控制、入侵报警,人脸识别技术应用就是典型场景代表,人脸识别+门禁、人脸识别+电梯、人脸识别+停车场,而人脸门禁就是其中最典型的革新应用之一,正是本白皮书要深入予以探讨的。

无感通行整体解决方案就是系统全面支持多种出入控制方式:刷门禁卡、刷身份证、刷银行卡、刷二维码、指纹识别、指静脉识别、支付宝、微信、Apple Pay、虹膜、人脸识别、声纹识别等,全部支持,或者最少支持2种以上的设备才是未来技术的主流。

AI智道联合人人智能、赛翼智能发布本人脸门禁产品技术白皮书,用于促进行业的技术发展和技术进步,共同开拓全新的门禁市场,集合行业力量,整合多种资源,逐步建立起优高效的产业生态。

本白皮书将从人脸门禁产品应用场景分类、产品类型分级、主要功能划分、产品形态、硬件、软件、测试检验方法、行业解决方案、未来发展趋势多个章节进行论述。本书可供门禁系统从业者、人工智能从业者、专家、安防从业者、设计院、政府相关部门、学生、工程商、集成商等相关人士阅读、参考。


概述


系统概述

人脸门禁系统是人工智能技术在出入口通行领域的典型场景应用,目前正处于用人脸识别技术代替传统IC卡的升级换代时期。门禁系统和建筑智能化系统的出入口通行系统经过多年的发展已经有了稳定成熟的以IC卡为主的技术体系,系统封闭、行业缺乏统一标准、用户体验和用户交互流程差异很大的一些局限。尤其是门禁卡和人员弱关联,代打卡、冒名顶替时有发生,存在很大的安全隐患,只认卡不认人。而人脸识别技术是人工智能在视觉识别领域发展最快的技术之一,非常好的解决了人员身份鉴别和权限统一的问题。当然新生事物也有一定的局限性,比如存在技术和产品的结合尚未形成统一标准、各个厂商自成系统难于兼容等问题。为了更好的让用户理解人脸门禁产品的应用优势和局限、指导厂商逐步建立逐步一致的人脸门禁的产品定义和功能描述,减少重复开发和技术概念混乱,AI智道(公众号:AIoWord)联合人人智能、赛翼智能等厂家制定本人脸门禁产品技术白皮书,用于建立行业统一的技术共识。本白皮书采用在线发布、图书出版、共同更新维护的形式,集合行业力量,逐步建立统一高效的人脸门禁产品体系,促进行业的发展。


门禁系统

门禁系统(Access Control System)又被称为出入管理控制系统,是安全防范管理系统的重要组成部分。门禁系统集自动识别技术和安全管理措施为一体,涉及人工智能、电子、机械、生物识别、光学、计算机、控制、通讯等技术,主要解决出入口安全防范管理的问题,实现对人、物的出入控制和管理功能。常见的门禁系统有独立式密码门禁系统、非接触卡式门禁系统、生物识别门禁系统、手机APP门禁系统等,曾经应用最广泛的非接触卡式门禁系统逐渐被生物识别门禁系统所替代,尤其是人脸识别。

典型的联网门禁系统由门禁服务器、门禁管理软件、控制器、接口模块、读卡器、人证合一一体机、卡片、电锁、出门按钮、紧急玻璃破碎器和蜂鸣器等设备组成。读卡器包括指纹、声纹、人脸、虹膜、卡式多种类型。

门禁系统在国内外的应用是有一定区别的,门禁系统最早出现在国外,技术发展比较成熟,通常都是联网的总线式门禁系统,门禁系统包含考勤、在线巡更功能,可以集成报警系统,能够和视频监控系统进行联动;而国内的门禁系统一般被归入一卡通系统建设,而一卡通系统通常包括门禁系统、访客系统、考勤系统、巡更系统、消费系统、电梯管理系统和车辆出入管理系统,这个范围要较国外的门禁系统要大,功能就相对简单一些。随着AI技术的成熟,人脸门禁正在大行其道,正在改变整个市场格局。

门禁系统适用各种场所,如银行、酒店、机房、机要室、办公室、智能化小区、工厂等。在数字技术网络技术飞速发展的今天门禁技术得到了迅猛的发展。早已超越了单纯的门道及钥匙管理,它已经逐渐发展成为一套完整的出入管理系统。它在工作环境安全、人事考勤管理等行政管理工作中发挥着巨大的作用。如今的无感通行系统中不一定会存在实体“门”,也许“门”是通道闸机、“门”是电梯、或者根本就没有“门”(虚拟的)。

门禁系统从技术维度可分为:电子密码门禁系统、卡式门禁系统、指纹门禁系统、指静脉门禁系统、掌纹门禁系统、虹膜门禁系统、声纹识别门禁系统和人脸识别门禁系统等。

门禁系统分类

本白皮书聚焦在人脸识别门禁系统,故以此为主。


人脸识别技术

人脸识别(Face Recognition,FR)是一种基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。

人脸与人体的其它生物特征(指纹、虹膜等)一样与生俱来,它的唯一性和不易被复制的良好特性为身份鉴别提供了必要的前提,与其它类型的生物识别比较人脸识别具有如下特点:

  • 非强制性。用户不需要专门配合人脸采集设备,几乎可以在无意识的状态下就可获取人脸图像,这样的取样方式没有“强制性”;

  • 非接触性。用户不需要和设备直接接触就能获取人脸图像;

  • 并发性。在实际应用场景下可以进行多个人脸的分拣、判断及识别。

除此之外,还符合视觉特性:“以貌识人”的特性,以及操作简单、结果直观、隐蔽性好等特点。

人脸识别系统的研究始于20世纪60年代,80年代后随着计算机技术和光学成像技术的发展得到提高,而真正进入初级的应用阶段则在90年后期;最近几年随着以深度学习为主的人工智能技术进步,人脸识别技术得到了迅猛的发展。“人脸识别系统”集成了人工智能、机器识别、机器学习、模型理论、专家系统、视频图像处理等多种专业技术,是综合性比较强的系统工程技术。

人脸识别系统通常包括几个过程:人脸图像采集及检测、关键点提取、人脸规整(图像处理)、人脸特征提取和人脸识别比对。

人脸识别过程

  • 人脸图像采集。不同的人脸图像都能通过摄像镜头采集下来,比如静态图像、动态图像、不同的位置、不同表情等方面都可以得到很好的采集。当用户在采集设备的拍摄范围内时,采集设备会自动搜索并拍摄用户的人脸图像。

  • 人脸检测。人脸检测在实际中主要用于人脸识别的预处理,即在图像中准确标定出人脸的位置和大小。

  • 关键点提取(特征提取)。人脸识别系统可使用的特征通常分为视觉特征、像素统计特征、人脸图像变换系数特征、人脸图像代数特征等。人脸特征提取就是针对人脸的某些特征进行的。人脸特征提取,也称人脸表征,它是对人脸进行特征建模的过程。人脸特征提取的方法归纳起来分为两大类:一种是基于知识的表征方法;另外一种是基于代数特征或统计学习的表征方法。

  • 人脸规整(预处理)。对于人脸的图像预处理是基于人脸检测结果,对图像进行处理并最终服务于特征提取的过程。系统获取的原始图像由于受到各种条件的限制和随机干扰,往往不能直接使用,必须在图像处理的早期阶段对它进行灰度校正、噪声过滤等图像预处理。对于人脸图像而言,其预处理过程主要包括人脸图像的光线补偿、灰度变换、直方图均衡化、归一化、几何校正、滤波以及锐化等。

  • 人脸识别比对(匹配与识别)。提取的人脸图像的特征数据与数据库中存储的特征模板进行搜索匹配,通过设定一个阈值,当相似度超过这一阈值,则把匹配得到的结果输出。人脸识别就是将待识别的人脸特征与已得到的人脸特征模板进行比较,根据相似程度对人脸的身份信息进行判断。可分为1:1、1:N、属性识别。其中1:1是将2张人脸对应的特征值向量进行比对,1:N是将1张人脸照片的特征值向量和另外N张人脸对应的特征值向量进行比对,输出相似度最高或者相似度排名前X的人脸。

人脸识别的优势在于其自然性和不被被测个体察觉的特点。

  • 所谓自然性,是指该识别方式同人类(甚至其他生物)进行个体识别时所利用的生物特征相同。例如人脸识别,人类也是通过观察比较人脸区分和确认身份的,另外具有自然性的识别还有虹膜识别、语音识别、体形识别等,而指纹识别、虹膜识别等都不具有自然性,因为人类或者其他生物并不通过此类生物特征区别个体。

  • 不被察觉的特点对于一种识别方法也很重要,这会使该识别方法不令人反感,并且因为不容易引起人的注意而不容易被欺骗。人脸识别具有这方面的特点,它完全利用可见光获取人脸图像信息,不同于指纹识别或者虹膜识别需要利用手指接触的传感器采集指纹,或者利用红外线采集虹膜图像,这些特殊的采集方式很容易被人察觉,从而造成诸多不便。

人脸识别被认为是生物特征识别领域甚至人工智能领域最困难的研究课题之一。人脸识别的困难主要是人脸作为生物特征的特点所带来的。

  • 相似性。不同个体之间的区别不大,所有的人脸的结构都相似,甚至人脸器官的结构外形都很相似。这样的特点对于利用人脸进行定位是有利的,但是对于利用人脸区分人类个体是不利的。例如双胞胎现象,指胎生动物一次怀胎生下两个个体的情况。双胞胎一般可分为同卵双胞胎和异卵双胞胎两类。在人类社会,全世界双胞胎平均出生率为1∶89。对于人类的双胞胎现象,有些双胞胎面部存在差异,有些双胞胎甚至从面部特征来看相似度极高,对于人脸识别系统形成非常大的挑战,几乎从生物特征上很难区别出每个个体。

  • 易变性。人脸的外形很不稳定,人可以通过脸部的变化产生很多表情,而在不同观察角度,人脸的视觉图像也相差很大,另外,人脸识别还受光照条件(例如白天和夜晚,室内和室外等)、人脸的很多遮盖物(例如口罩、墨镜、头发、胡须等)、年龄等多方面因素的影响。

  • 易攻击性。随着数字拍照、视频合成技术等发展,越来越容易获得某个指定人的人脸信息或者合成人脸信息。更甚至随着对抗训练(Adversarial Training)的深度学习技术的发展,计算机可以合成高精度的任何人的人脸等生物特征信息。某些生成对抗网络训练的反人脸识别,身份欺骗成功率达99.5%,甚至成为许多人脸识别系统的克星。


产品的场景化分类分级模型

人脸识别门禁控制系统基于先进的人脸识别技术在门禁出入口领域的应用创新。相比钥匙门禁、IC卡门禁、指纹门禁、虹膜门禁等其它技术手段,人脸门禁如果有以下优势:

  • 人脸识别无卡进入,免去携带卡证的额外工作;

  • 高速准确方便快捷,人脸识别通常在1秒以内完成甚至可实现无感自然通行;

  • 照片记录可追溯验证;

同时人脸门禁也存在一些风险:

  • 对于高相似人脸或者双胞胎等存在一定的误识风险;

  • 人脸识别容易受到一些技术手段的攻击;

  • 人脸识别涉及到隐私权等风险。

总体来说人脸识别门禁是门禁系统的一次重大技术变革,将门禁智能通行带入了全新的AI时代。

本白皮书的关键内容,是对人脸门禁的产品应用场景、产品技术形态分为三类六等,树立了对人脸门禁产品应用和开发的技术指导,这也是本次白皮书重大的创新。这个分类办法结合了对门禁应用场景和人脸识别技术的深入调研需求提炼和技术分析,欢迎广大读者提出宝贵意见以便于编者修改完善。

人脸门禁产品技术形态分类

门禁通行的应用场景分为三类:

  • 强配合类。人脸与设备距离0.5米以内,人脸角度在15度以内,人脸比对模式为1:1人证比对或者<1000人的小型人脸库比对。如家庭人脸门锁、办公室小型人脸门禁、人脸考勤等。

  • 半配合类。人脸与设备的距离在0.5米-1.5米之间,人脸角度在30度以内,人脸比对库容量在10000人以内的中等规模人脸库。如智能建筑楼层人脸门禁、社区单元人脸门禁等。

  • 自然通行类。人脸与设备的距离在1米到3米之间,人脸角度在45度以内,人脸比对库容量在1万到10万人以内。如园区出入口人脸通行、公共交通人脸闸机等。

人脸门禁产品的技术等级划分为六级:

  • 第一级:学术级。人脸库容量在百人左右,准确度在60%以下,用于新技术的学术分析;

  • 第二级:娱乐级。人脸库容量在500人左右,准确度在60-85%之间,用于娱乐游戏出错无直接风险;

  • 第三级:消费级。人脸库容量在1000人以内,准确度在85-95%之间,用于个人领域或中小企业;

  • 第四级:商业级。人脸库容量在1千-1万之间,准确度在95-99%之间,用于中等规模企业应用;

  • 第五级:行业级。人脸库容量在1万到10万人左右,准确度在99-99.999%之间,用于超大规模企业或者公安、交通等海量人群应用;

  • 第六级:金融级。人脸库容量在10万人以上,准确度在99.999%以上,出错率低于十万分之一,可用于金融支付等应用领域。

总结:通过按三种类别、六个级别的细分应用,可以将人脸门禁产品的应用场景和产品技术特点较好区分出来,为后续产品应用和产品开发提供指导。


第一篇 应用场景分类


人脸门禁系统如果按照应用场景分类,可分为三类:强配合类、半配合类和自然通行类。


强配合类应用

强配合类应用主要应用于传统近红外人脸门禁、智能锁、柜和设备等。个人、家庭、中小企业的人脸识别门禁或者设备的应用,往往用户人脸库规模小、设备成本低、有时候需要设备提供电池供电的低功耗场景等应用需求,这种应用场景往往是强配合类应用。

强配合应用情况下,典型人脸库容量在50-1000人之间,在识别时需要将人脸距离设备在0.5米以内,人脸与设备之间的夹角在15度以内几乎完全正脸状态。强配合类应用的人脸识别技术精度要求有限、设备成本低、功耗低,往往适用于小规模场所。

关键参数:

  • 人脸库容量:1000人以下

  • 人脸识别距离:1米以内

  • 人脸检测比对搜索时间:<3秒

  • 人脸识别角度:15度以内,需要特意配合

人脸智能柜


半配合类应用

半配合类主要应用在建筑楼层通道门禁等场景。在企业楼层、办公室门禁、电梯、社区单元门口等应用场景下,通常是企业或者小区将人脸门禁代替传统的IC卡或钥匙门禁,适用采用半配合类人脸门禁。

半配合类的人脸门禁人脸库在10000人以内,门禁使用时人与设备的距离 在0.5米到1.5米之间,可以实现人脸与设备有一定的夹角如30度以内,甚至在理想情况下实现人到门开的不停留通行状态。

关键参数:

  • 人脸库容量:1万人以下

  • 人脸比对距离:0.5-1.5米

  • 人脸检测比对搜索时间:<1秒

  • 人脸识别角度:30度以内,半配合状态

人脸识别通道门禁


自然通行类

自然同行类就是人不用可以配合系统的应用,比如园区建筑出入口室内外应用及人脸自然签到。在住宅社区门口、大型建筑的出入口、大型演出或展会活动时,通常需要自然通行的人脸门禁产品。自然通行人脸门禁往往人脸库规模可达1万到10万人左右,人脸与设备的距离可在1到3米左右,而且能够适合室内和室外等各种的光线环境,人员通行能够做到完全的不停留通行和人脸比对分析。

关键参数:

  • 人脸库容量:1-10万人

  • 人脸识别距离:1-3米

  • 人脸检测比对搜索时间:<0.5秒

  • 人脸识别角度:45度以内,与通行路线一致,不影响自然通行状态

总结:人脸门禁应用的发展趋势是从强配合向半配合过渡、进而向自然通行发展的趋势,科技让生活服务变得越来越便利化。同时在强配合型应用领域从近红外的企业人脸识别,向家庭的人脸门锁扩展,但由于人脸门锁对人脸识别技术的抗攻击能力带来全新的挑战,人脸门禁的发展状态尚存在较多不确定因素。


第二篇 产品类型分级


人脸门禁产品的技术等级划分为六级:学术级、娱乐级、消费级、企业级、行业级、金融级。

第一级:学术级

学术级技术精度通常是指可重复的准确度在60%以下,用于原理检验和理论创新,往往不一定对应具体的产品。有些学术级技术可在实验室的理想条件下取得很高的人脸识别精度,但是在现实环境应用时由于光线、镜头、计算资源等多种原因往往无法复现实验室成果,甚至有些学术论文的理论成果也难以持续复现,学术级的往往不对应具体的量产产品。

第二级:娱乐级

人脸识别的某些细分功能在有些应用领域的成熟度不高,比如通过人脸识别来分析人的年龄、性别,甚至通过人脸识别来区分双胞胎或者脸部高相似人群等,人脸识别通常的成功概率低于85%以下,这样成熟度的技术通常用于做娱乐型产品。

例如用于人脸识别的属性分析或者娱乐游戏产品等。

第三级:消费级

人脸识别应用通常在中小规模人脸库如千人以内、中近距离如半米以内有较高的人脸识别精度时,人脸识别可用于家庭、商铺或中小企业等,作为消费级应用的产品。目前大量基于近红外技术的人脸考勤机、人脸门禁级通常是消费级产品 。

第四级:企业级

企业级人脸门禁产品通常用于中大规模的企业或者居民社区、行政单位的智能通行应用。人脸库容量通常在万人以内,人脸比对的反应时间通常在秒级,应用场景既涉及室内均匀光线又涉及到室外或建筑出入口的日光或强反差的光线情况。企业级人脸门禁是当前市场增长最迅猛的人脸门禁产品领域。

社区门禁主机

第五级:行业级

在公共安全、公共交通、大型园区、大型演唱会或展览活动等进行人脸识别比对或者公共安全的应用时,往往需要具有行业级人脸识别技术的产品。应用环境通常在室外牙大型建筑的多个出入口,设备需要联网分布式运行,用于解决数万甚至数十万人的智能通行需求。

第六级:金融级

人脸识别的生物精度的理论水平在万分之一的误差之内,但是金融支付通常要求系统的精度误差在百万分之一甚至更低水平,用于保障金融安全的人脸识别产品技术称为金融级安全的技术。目前来看人脸识别在金融支付领域还面临不少挑战有待克服。


总结:人脸识别的产品分为不同的技术成熟度等级,分别适应于不同的应用领域。从目前来看,人脸门禁正从消费级人脸门禁向企业级、行业级甚至金融级安全的人脸门禁的发展历程中。当前比较成熟的是用于万人库的企业级人脸门禁产品,也有少数数万人脸库的行业级产品已经开始出现。


第三篇 产品的主要功能


人脸门禁产品的主要功能包括人脸成像采集、人脸图像特征提取及人脸库比对管理、报警联动数据分析几个功能模块。每种功能模块涉及不同的业务特点。


人脸成像采集

不同的人脸图像通过摄像镜头采集得到,比如静态图像、动态图像、不同的位置、不同表情等,当采集对象在设备的拍摄范围内时,采集设备会自动搜索并拍摄人脸图像。影响人脸成像采集的主要因素是摄像头的性能指标和摄像头安装部署位置等因素。通常情况下人像采集涉及如下因素:

  • 图像大小。人脸图像过小会影响识别效果,人脸图像过大会影响识别速度。图像大小一定程度上在实际应用场景是人脸离摄像头的距离。

  • 图像分辨率。越低的图像分辨率越难识别。图像大小综合图像分辨率,直接影响摄像头识别距离。

  • 光照环境。摄像头成像需要一定的光照范围,过曝或过暗的光照环境都会影响人脸识别效果。这是影响人脸识别最重要的因素之一。通常可以采用自然补光和外部人工补光的方式来解决光照问题。

  • 模糊程度。人脸相对于摄像头的移动经常会产生运动模糊,导致影响检测和识别效果。

  • 遮挡程度。五官无遮挡、脸部边缘清晰的图像为最佳。而在实际场景中,很多人脸都会被帽子、眼镜、口罩等遮挡物遮挡。

  • 采集角度。人脸相对于摄像头角度为正脸最佳。但实际场景中往往很难抓拍正脸,会涉及到人脸与摄像头之间多少角度适宜于人脸采集的进行。


摄像机成像的几种参数

1.摄像头成像分辨率

人像采集的摄像头通常分为USB摄像头、MIPI摄像头和网络摄像头。其中USB和MIPI通常传输未经压缩的视频数据一般用于设备内近距离传输,网络摄像头通常传输压缩后的视频数据可以用于设备间的远距离传输。以下以网络摄像头为例描述摄像头的成像分辨率。

  • 720p。720P实际是指分辨率1280×720像素。计算一下就是1280×720=921600像素,720p或720i为百万像素分辨率,通常指百万网络摄像机。720P每路默认图像码流为3M,具体的速率和视频压缩的比率也高度相关。

  • 960p。960P实际是指分辨率1280×960像素。计算一下就是1280×960=1228800像素,一般都会叫960p或960i为130万像素分辨率,通常指130万像素的摄像机。960P每路默认图像码流为4M,具体的速率和视频压缩的比率也高度相关。

  • 1080p。1080P实际是指分辨率1920×1080像素。计算一下就是1920×1080=2073600像素,一般都会叫 1080p或1080i为200万像素分辨率,通常指200万像素的摄像机。1080P每路默认图像码流为5M,具体的速率和视频压缩的比率也高度相关。

  • 4K。4K指的是3840水平×2160垂直(16:9)像素的分辨率,支持120p、60p、59.94p、50p、30p、29.97p、25p、24p和23.976p,共9种帧率。4K每路默认图像码流为8M以上,具体的速率和视频压缩的比率也高度相关。

各种分辨率对比

2.光照强度

人脸若要被摄像机成像,首要条件是人脸接受到一定程度的光线即受到足够的光照强度。光照强度的标准属于是照度,照度是反映光照强度的一种单位,其物理意义是照射到单位面积上的光通量,照度的单位是每平方米的流明(Lm)数,也叫做勒克斯(Lux):1Lux=1Lm/平方米。上式中,Lm是光通量的单位,其定义是纯铂在熔化温度(约1770℃)时,其1/60平方米的表面面积于1球面度的立体角内所辐射的光量。

人脸检测要求人脸接受的光既不能太强也不能太弱,通常需要10-3000lux之间的亮度比较适宜,过亮或者过暗都能导致摄像杨对人脸成像效果的差异。

以下是各种环境照度值:(单位 lux)

场所/环境

光照度(Lux)

人脸成像难度

晴天

30000~130000

较难人脸成像

晴天室内

100~1000

适宜人脸成像

阴天

3000~10000

适宜人脸成像

阴天室外

50~500

适宜人脸成像

阴天室内

5~50

较难人脸成像

黄昏室内

10

较难人脸成像

日出日落

300

适宜人脸成像

黑夜

0.001~0.02

无补光通常无法成像

月夜

0.02~0.3

无补光通常无法成像

月圆

0.30~3

无补光通常无法成像

星光

0.0002~0.00002

无补光通常无法成像

阴暗夜晚

0.003~0.0007

无补光通常无法成像

夜间路灯

0.1

无补光通常无法成像

生产车间

10~500

适宜人脸成像

办公室

300~500

适宜人脸成像

餐厅

10~30

较难人脸成像

走廊

5~10

较难人脸成像

停车场

1~5

较难人脸成像

距60W台灯60cm桌面

300

适宜人脸成像

室内日光灯

100

适宜人脸成像

电视台演播室

1000

适宜人脸成像

黑白电视机荧光屏

120

适宜人脸成像

彩色电视机荧光屏

80

适宜人脸成像

阅读书刊所需照度

50~60

适宜人脸成像

3.宽动态

当在强光源(日光、灯具或反光等)照射下的高亮度区域及阴影、逆光等相对亮度较低的区域在图像中同时存在时,摄像机输出的图像会出现明亮区域因曝光过度成为白色,而黑暗区域因曝光不足成为黑色,严重影响图像质量。摄像机在同一场景中对最亮区域及较暗区域的表现是存在局限的,这种局限就是通常所讲的“动态范围”。

宽动态(WDR)技术是在非常强烈的对比下让摄像机看到影像的特色而运用的一种技术。WDR是Wide Dynamic Range 的缩写,意思是宽动态范围。当在强光源(日光、灯具或反光等)照射下的高亮度区域及阴影、逆光等相对亮度较低的区域在图像中同时存在时,摄像机输出的图像会出现明亮区域因曝光过度成为白色,而黑暗区域因曝光不足成为黑色,严重影响图像质量。摄像机在同一场景中对最亮区域及较暗区域的表现是存在局限的,这种局限就是通常所讲的“动态范围”。

宽动态范围是图像能分辨最亮的亮度信号值与能分辨的最暗的亮光信号值的比值。宽动态的表现方式以“倍数”或“dB”来表示。

宽动态最常见的形式是使用多次曝光方法,该方法包括捕获短时间内的两帧图像和一个长曝光速度。第一次曝光捕捉明亮区域场景中的细节,而后者则捕获场景中的暗部区域的细节。 然后将两个图像组合在一起,可以在同时呈现明亮和黑暗区域两个图像细节。通常的宽动态范围介于50~70dB之间,更高性能的宽动态范围从100~130dB之间。最先进的宽动态范围(又被称为第三代宽动态)被叫做"真WDR",通过捕获四个帧图像进行比较,以达到最佳效果。 相较于之前的两帧宽动态范围技术来说,帧数量的增加有助于解决图像中前景和背景之间的照明差异。

宽动态开启前    |   宽动态开启后

4.人脸成像角度

人脸成像的角度对应是人脸和镜头之间的三种角度:上下翻转pitch,左右翻转yaw,平面内旋转roll的角度。最理想情况下,摄像头与人脸之间的三种角度是:

上下翻转pitch:摄像头成像位置与人脸位置同高,这样上下翻转角度几乎为0。

左右翻转yaw:人脸正对摄像头,左右翻转角度在0-15度之间。

平面内旋转roll:人脸与摄像头的重力线相同,不涉及到脸的平面旋转。

人脸成像角度

但真实的摄像机成像时往往涉及到摄像头安装位置与人像的真实角度等问题,导致摄像机无法接近理想情况成像。

5.白平衡

在任意色温条件下,摄像机镜头所拍摄的标准白色经过电路的调整,使之成像后仍然为白色,使被拍摄到的图像的色彩能够精确的被反映出来,这样的过程称为白平衡。

白平衡(White Balance)只用于彩色摄像机,其用途是实现摄像机图像能精确反映景物状况,有手动白平衡和自动白平衡两种方式。

自动白平衡 

  • 连续方式:此时白平衡设置将随着景物色彩温度的改变而连续地调整,范围为2800~6000K。这种方式对于景物的色彩温度在拍摄期间不断改变的场合是最适宜的,使色彩表现自然,但对于景物中很少甚至没有白色时,连续的白平衡不能产生最佳的彩色效果。 

  • 按钮方式:先将摄像机对准诸如白墙、白纸等白色目标,然后将自动方式开关从手动拨到设置位置,保留在该位置几秒钟或者至图像呈现白色为止,在白平衡被执行后,将自动方式开关拨回手动位置以锁定该白平衡的设置,此时白平衡设置将保持在摄像机的存储器中,直至再次执行被改变为止,其范围为2300~10000K,在此期间,即使摄像机断电也不会丢失该设置。以按钮方式设置白平衡最为精确和可靠,适用于大部分应用场合。 

手动白平衡

  • 开手动白平衡将关闭自动白平衡,此时改变图像的红色或蓝色状况有多达107个等级供调节,如增加或减少红色各一个等级、增加或减少蓝色各一个等级。除次之外,有的摄像机还有将白平衡固定在3200K(白炽灯水平)和5500K(日光水平)等档次命令。

摄像机人脸成像的关键关系在于:视频或图片画面中“人脸”区域要有足够的成像光线、成像大小和成像的真实还原性例如无变形和白平衡等。

无论采用任何种类的摄像头,如果要进行有效的人脸成像,在整个画面中理想的人脸部分画面对应的典型参数是:

参数

过小指标

理想指标

过大指标

光照强度

低于50lux

50-3000lux

高于3000lux

人脸大小

低于50像素

50-1000像素

大于1000像素

人脸角度


上下角度、左右角度和平面旋转等角度均在0-30度以内

大于30度夹角

人脸真实性


人脸无明显变形
白平衡正常

白平衡偏差大

人脸变形严重


人脸检测性能

在静态画面和动态视频检测人脸的主要指标是处理一张照片人脸检测所需要花费的时间。衡量人脸检测结果通常需要几个指标:

1.输入画面大小

视频图像通常涉及CIF、D1、720P、1080P、2K、4K及以上等不同视频分辨率。

通常用于人脸识别的视频分辨率为720P和1080P。

2.检测速度

对指定分辨率图片完成一次人脸检测所需要的时间,直接的指标是人脸识别图像的处理帧率。

通常在1080P视频下要求每秒能完成10帧以上的视频检测,即相当于每100ms要完成一帧画面的人像检测。

3.检测数量

指在同一张视频图片中出现人人脸数量,和人脸抓拍的应用环境高度相关。人脸和比对环境下通常每个画面中只有1个人出现。人脸门禁、人脸通行环境要求每个画面能处理5个人脸。公共交通如车站、广场等通常要求每个画面处理多达30-50个人脸。

场景

单画面人脸数量

柜台、窗口或门口的应用,人证比对、人脸门锁、配合型人脸考勤或门禁

1人

建筑楼层、单元门、会场签到等应用,半配合型人脸门禁或人脸签到、人脸无感通行

5人

室外街道、商场或方城等应用,人脸布控、人脸计数

10-30人

4.检测精度

指在画面出现多个人脸时算法能够检测出人脸的数量与真实人脸数量的差距。

总结:人脸检测通常和设备的应用场景相关度较大,如嵌入式设备比如人脸锁或门禁、智能硬件往往只要求同一画面只做一个人脸的识别;智能建筑门禁通行或会场签到在同一画面往往要求3-10人的人脸检测;商场、车站或室外布控有时候需要同一画面实现10-50人的人脸检测处理。


活体判定

1.配合型活体检测

通常要求被检测的对象面对摄像机通过眨眼、张嘴、摇头、点头等组合动作,或者通过阅读指定数字或者词语,确保操作的为真实活体人脸。

2.无配合自然型活体检测

非配合式活体检测,不需要用户做任何动作,依靠摄像头在一定时间内抓取到人脸进行相关的算法判断是否是活体,避免利用照片、视频等非活体投机行为。

活体识别技术一直是人脸识别的一个技术重点,人脸活体识别技术和与之对抗的人脸活体欺诈技术都在迅猛发展,相当于矛和盾的关系。


人员注册管理

人脸门禁往往要求衔建立比对人员名单的人员库,这个过程称为人员注册。人员注册一般要求提供人员的基本信息如ID信息、姓名、所关联的权限区域、以及最关键的要提供人脸比对质量要求的清晰照片。人脸注册可以采用自助注册或者管理员批量处理的方式完成。


人脸特征提取和人脸库管理比对

1.人脸特征提取

人脸识别的一个关键环节就是把从视频图片里检测到的人脸照片通过深度学习或者其它的方法转型成一定的数据结构,这个过程称为人脸特征化。对一张人脸照片经过特征化以后往往形成128维的矩阵或者不同的特征向量,然后对代表人脸的特征向量进行存储管理、比对管理、检索管理等。

人脸识别的特征提取分为几种技术过程:

  • 几何特征。从面部点之间的距离和比率作为特征,识别速度快,内存要求比较小,对于光照敏感度降低。

  • 基于模型特征。根据不同特征状态所具有概率不同而提取人脸图像特征。

  • 基于统计特征。将人脸图像视为随机向量,并用统计方法辨别不同人脸特征模式,比较典型的有特征脸、独立成分分析、奇异值分解等。

  • 基于神经网络特征。利用大量神经单元对人脸图像特征进行联想存储和记忆,根据不同神经单元状态的概率实现对人脸图像准确识别。

当前比较主流的是基于神经网络的特征提取方法 。

2.人脸库比对和管理

根据实际应用的场景不同,人脸库可以分为以下几种容量:

  • 100人以内超小规模人脸库。主要用于个人、家庭或者中小企业环境,用于人脸门锁、人脸智能柜、中小企业人脸考勤等。

  • 2000人以内小规模人脸库。主要用于小型企业或社区单元楼的人脸门禁等应用。

  • 20000人以内中等规模人脸库。主要应用于中型企业、社区或者会场的人脸门禁、人脸签到等应用。

  • 50000人以内大规模人脸库。用于大型企业、园区、社区的人脸门禁或大型活动应用。

  • 50000人以上大规模人脸库。主要用于公安布控或者更大规模的人脸比对场景。


报警联动及数据分析

人脸门禁应用中,当完成人脸检测、人脸比对分析以后,通常涉及到人脸联动处理。按照对联动处理的响应速度,一般分为如下几种类型:

1.实时联动

人脸检测、人脸比对和结果的联动能够满足每秒完成5-10帧以上,普通人通常感觉不到人脸识别的延时过程,这种应用称为实时联动。

实时联动通常要求整体的处理时间在0.2秒内完成。

实时联动通常用于人脸自然通行或者会场签到等场景。

2.秒级联动

人脸门禁从接触到处理完成整个时间在1秒左右完成,普通人感受到延时但是可接受的状态。

秒级联动是人脸门禁主要的应用需求,应用于各类园区、建筑或者办公室门禁场所。

3.延时联动

如果从人脸出现到整体联动完成需要1秒以上的处理时间,通常称为延时联动。延时的大小和应用场景相关。比如商场零售的会员分析统计或者课堂的人脸签到经常要求在分钟级响应。

总结:人脸门禁的主要功能涉及:人脸检测采集、人员注册、人脸库管理和联动报警及数据分析。功能的实现往往涉及到不同的应用场景和产品形态的实现。通常来讲实现这些功能越有效、越便捷、越高的性价比,意味着更大的用户满意度。


第四篇 人脸门禁产品形态


组合型设备

实现人脸门禁的完整功能如果需要多个设备组合进行,就称为组合型人脸门禁设备。典型的人脸门禁组合型设备涉及以下几个部分:

人脸门禁的组成

摄像机用于采集视频信息,主机用于运行人脸识别、人脸库管理和注册服务的软件,客户端用于用户交互。几个设备之间通过网络进行连接。

组合型人脸门禁的典型设备是常见的监控摄像头和计算机主机组成,这些设备通常用于大型人脸库管理。组合型人脸门禁的优势是设备性能比较高,缺点是组网实施比较复杂导致系统可靠度低或者维护工作量大。


一体化设备

一体化人脸门禁设备是指人脸识别和比对通常在同一个设备内完成,不需要额外设备的配合。常见的一体化人脸门禁设备分为带屏幕的一体化门禁设备和不带屏幕的一体化人脸门禁设备。目前人脸门禁设备以一体化设备的占有率和增长速度最快。

1.带屏幕一体化人脸门禁设备

设备直接集成摄像头、屏幕、计算主板、联动报警等,在单个设备完成人脸采集、人脸注册、建库比对、联动门禁等功能。

2.不带屏幕人脸门禁设备

设备直接集成摄像头、计算主板、联动报警等,在单个设备完成人脸采集、人脸注册、建库比对、联动门禁等功能,但是不带屏幕输出,可以通过声光信号进行门禁联动。


联网型设备

1.局域联网

门禁设备之内通过局域网进行多台设备的联网管理,可以实现统一的用户注册、人脸库管理和权限管理等,称为局域网联网设备或称企业内网型联网。

局域网联网的门禁系统

2.互联网云联网

门禁设备之间如果通过互联网进行分布式的管理,客户端通过手机或电脑进行远程的管理,称为互联网云联网的门禁系统。

互联网联网的门禁系统

总结:人脸门禁的产品形态分为组合型产品、一体化产品,目前人脸门禁的主要产品为一体化门禁产品。一体化人脸门禁产品又通常以带屏幕的一体化人脸门禁产品为主,未来人脸门禁摄像机类型的产品也将有很大的成长空间。人脸门禁的组网分为企业内部的局域网产品和基于互联网的云联网产品为主。局域网人脸门禁组网通常为企业自己组建管理服务器和统一的集中管理端进行设备的管理。基于互联网的云联网人脸门禁是基于在互联网上的服务器进行互联网联网的设备管理,客户端既有电脑这样的传统设备,又可以采用手机移动客户端进行管理。


第五篇 一体化人脸门禁产品硬件


当前人脸门禁的主流产品是带屏幕的一体化人脸门禁产品,由于厂家众多、产品功能组件多样、产品性能指标差异较大,经常导致用户对人脸门禁产品的选择比较困难,也较难通过客观指标对人脸门禁进行设备评测。本章节把一体化人脸门禁的主要产品模块组成和主流技术方案进行对比分析,为产品制造商设计研发人脸门禁产品和用户选择人脸门禁产品提供技术规范参考。以下描述一体化门禁产品直接统称为门禁产品。


一体化门禁产品组成

一体化人脸门禁产品通常由摄像头模组、人体感应模块、补光模块、感应卡或键盘、主控板、显示屏、联动输出模块等组成。有些产品通过触摸屏取代键盘,或者直接省掉感应卡模块,均和产品设计定位相关。

图 一体化门禁产品组成


摄像头成像模组

摄像头成像模组是一体化人脸门禁产品的关键组件,关系着人脸识别成像的采集能力和适用范围。影响摄像头成像模组的主要技术参数是接口类型、感光范围、镜头数量等关键指标。

1.基本原理

摄像机成像原理图

摄像机组成

典型的摄像头模组由镜头、传感器、ISP模块、视频编码模块等组成。根据接口类型不同ISP或视频编码模块也可能集成在主控板上。

  • 镜头。主要参数是焦距、光圈和景深。关于焦距、光圈和景深涉及较多光学内容,此处不再展开。

  • 传感器sensor。决定了镜头的低照度和宽动态成像能力,决定着门禁设备是否在室外应用、室内应用等不同的适用范围。

  • 数字信号处理ISP。影响图像白平衡、变形纠正以及对焦控制等多种功能。

  • 图像编码。和摄像头模组的类型有关,USB和MIPI摄像头通常不进行视频压缩编码,网络摄像头涉及到视频压缩编码问题。

2.摄像头模组成像器件

人脸门禁整体上来看是高度集成化的产品,摄像头模组往往来源于电脑摄像头、手机摄像头或安防监控摄像头几种已有产品。根据摄像头的成像芯片来源不同,可以分为以下几种类型:

第一类:以电脑摄像头为主的室内成像摄像头模组

以笔记本电脑、台式机配套的桌面USB摄像头通常应用于桌面、前台等室内应用场景,被拍摄的人和设备之间的距离通常在1米以内,室内光线光亮稳定不存在较大变化,这种以电脑摄像头为主体的室内成像摄像头模组在人脸门禁中得到大量的应用。

以桌面电脑室内成像型摄像头模组的典型指标为:

  • 人脸检测距离:1米以内;

  • 人脸清晰度:以D1、720P或1080P为主;

  • 宽动态光线适应能力:要求光线在人脸部均匀,不具备光线宽动态的适应能力。

  • 低照度成像能力:适宜的成像照度为100-3000Lux,不具备低照度成像能力。

  • 适用范围:室内门禁或者环境良好情况下的人脸检测和识别。

第二类:以手机摄像头为主的宽动态成像模组

随着智能手机的发展,大量智能手机摄像头模组的成像能力得到了较大的提升,主流手机摄像头相对桌面USB摄像头在成像质量有了质的变化。这些摄像头通常是以MIPI接口摄像头为主,也有少数仍以USB接口方式存在。

以手机摄像头模组为主的带有一定程度的宽动态模组的典型指标为:

  • 人脸检测距离:0.5米-2米以内;

  • 人脸清晰度:以720P或1080P为主;

  • 宽动态光线适应能力:具有60db-80db的宽动态成像能力。

  • 低照度成像能力:能进行弱光线的成像,适宜的成像照度为30-3000Lux,初级的低照度成像。

  • 适用范围:有补光环境的室内或者楼层、单元门成像。

第三类:以安防监控摄像头芯片为主的低照度宽动态成像模组

安防摄像头通常以室外为主,而且要适应强光、夜晚弱光无光等多种场景,安防摄像头的专业级成像芯片已经具备较好的低照度宽动态成像能力。这类模组的典型指标为:

  • 人脸检测距离:0.5米-5米;

  • 人脸清晰度:以720P或1080P为主;

  • 宽动态光线适应能力:具有80db-100db的宽动态成像能力。

  • 低照度成像能力:能进行微光或弱光线的成像,适宜的成像照度为0.1-5000Lux。

  • 适用范围:园区、社区的室外人脸识别,建筑室外出入口的人脸识别应用。

3.摄像头接口类型

摄像头模组的接口类型和摄像头的体积、应用范围有较大的关系。主要有以下接口类型

A.USB

常见的电脑摄像头通常大部分USB摄像头。USB摄像头是目前应用最广泛的摄像头模组,具有市场占有率高、兼容性好等特点。

通用串行总线(英语:Universal Serial Bus,缩写:USB)是连接计算机系统与外部设备的一种串口总线标准,也是一种输入输出接口的技术规范,被广泛地应用于个人电脑和移动设备等信息通讯产品,并扩展至摄影器材、数字电视(机顶盒)、游戏机等其它相关领域。最新一代是USB 3.1,传输速度为10Gbit/s,三段式电压5V/12V/20V,最大供电100W ,新型Type C插型不再分正反。

USB是一种常用的pc接口,他只有4根线,两根电源两根信号,故信号是串行传输的,usb接口也称为串行口。

一般的排列方式是:红白绿黑从左到右。 

定义:

  • 红色-USB电源: 标有-VCC、Power、5V、5VSB字样

  • 白色-USB数据线:(负)-DATA-、USBD-、PD-、USBDT-

  • 绿色-USB数据线:(正)-DATA+、USBD+、PD+、USBDT+

  • 黑色-地线: GND、Ground

USB 1.0是在1996年出现的,速度只有1.5Mb/s(位每秒); 1998年升级为USB 1.1,速度也大大提升到12Mb/s,USB1.1是较为普遍的USB规范,其高速方式的传输速率为12Mbps,低速方式的传输速率为1.5Mbps(b是Bit的意思)。大部分MP3为此类接口类型。

USB2.0规范是由USB1.1规范演变而来的。它的传输速率达到了480Mbps,折算为MB为60MB/s,足以满足大多数外设的速率要求。USB 2.0中可以用USB 2.0的驱动程序驱动USB 1.1设备,像USB 线、插头等等附件也都可以直接使用。

USB 3.0由Intel、微软、惠普、德州仪器、NEC、ST-NXP等业界巨头组成的USB 3.0Promoter Group已经正式完成并公开发布。USB3.0的物理层采用8b/10b编码方式,理论速度也就4Gb/s,可广泛用于PC外围设备和消费电子产品。

B.MIPI

主流的智能手机摄像头是MIPI接口摄像头模组。MIPI摄像头常见于手机、平板中,支持500万像素以上高清分辨率。

MIPI(移动产业处理器接口)是Mobile Industry Processor Interface的缩写,是由MIPI联盟制定的移动设备接口规范。MIPI联盟是一个开放的会员制组织。2003年7月,由美国德州仪器(TI)、意法半导体(ST)、英国ARM和芬兰诺基亚(Nokia)4家公司共同成立。MIPI联盟旨在推进手机应用处理器接口的标准化。目前比较成熟的MIPI协议接口应用有DSI(显示接口)和CSI(摄像头接口)。MIPI是差分串口传输,速度快,抗干扰。主流手机模组用MIPI传输,传输时使用4对差分信号传输图像数据和一对差分时钟信号。

MIPI-CSI接口通常从COMS Sensor,Video Encoder和其它视频输出设备收集数据。

Camera Serial Interface,相机串行接口。CSI接口与DSI接口同属一门,都是MIPI(移动产业处理器接口联盟)制定的一种接口规范。分为如下协议:

CSI-1:CSI-1是相机最初的标准MIPI接口。它作为一种架构来定义相机和主处理器之间的接口。其继任者是MIPI CSI-2和MIPI CSI-3,两个标准仍在不断发展。

CSI-2:MIPI CSI-2 v1.0规范于2005年发布。它使用D-PHY或C-PHY(这两个标准均由MIPI联盟设定)作为物理层选项。该协议分为以下几个层次:

  • 物理层(C-PHY/D-PHY)

  • 车道合并层。

  • 低层协议层。

  • 像素到字节转换层

  • 应用程序层

CSI-3:MIPI CSI-3是一种高速双向协议,主要用于多层对等基于UniPro的M-PHY设备网络中摄像机和主机之间的图像和视频传输。它最初于2012年发布,并于2014年在1.1版本中重新发布。

出于EMI的原因,系统设计人员可以在每种M-PHY速度级别中选择两种不同的时钟速率(a和b)。M-PHY速度时钟频率比特率齿轮1G1A 1.25Gbits/sG1B 1.49Gbits/s齿轮2G2A 2.5Gbits/sG2B 2.9Gbits/s齿轮3G3A 5Gbits/s,G3B 5.8Gbits/s。


MIPI接口摄像头模组

C.RJ45网络接口

当前主流的安防监控用的摄像头大多数为网络接口摄像头。

网络摄像头模组通常是指采用以海思为代表的SOC方案,将视频采集、视频编码压缩、视频传输等调试集成到一体的摄像头模块。网络摄像头模组在安防领域应用非常广泛。

D.其它接口

摄像头模组还涉及LVDS、并行信号、模拟信号传输等多种接口方式,在人脸门禁中较少使用。

4.成像镜头数量

A,单目型

指单个摄像头进行视频采集和人脸检测。单目摄像头是当前数量最大的摄像头模组类型。

单目型镜头

B.可见光和近红外双目型

指采用双传感器进行视频采集,其中一个传感器为可见光传感器,用于采集人脸信息和比对成像;另一个传感器为近红外传感器,用于进行人脸的活体检测等功能。

可见光和近红外双目型镜头

C.双可见光双目型

双目成像(Stereo System):利用双摄像头拍摄物体,再通过三角形原理计算物体距离。指用两个可见光传感器用于摄像头成像,两个传感器和镜头均采用可见光,通过双目三维测量等方法进行人脸的活体检测。双目测距成像因为效率低、算法难、精度差、容易受到环境因素干扰。由两个单目相机组成(两个相机之间的距离叫“基线”是已知的),通过这个基线来估计每个像素的空间位置来测量物体与我们之间的距离,克服单目相机无法知道距离的缺点。双目相机测量到的深度范围和基线有关,基线距离越大,能够测量到的就越远。


双目立体视觉中间点三维重建

优点:可用于室内也可用于室外。

缺点:配置与标定较为复杂,其深度和精度受双目的基线或者分辨率所限,并且视差的计算非常消耗计算机资源,在现有的条件下,计算量是双目的主要问题之一。

D.双目结构光型

结构光(Structured Light):结构光投射特定的光信息到物体表面后,由摄像头采集。根据物体造成的光信号的变化来计算物体的位置和深度等信息,进而复原整个三维空间。

 Astra 3D传感器(来源于雷锋网)

总结:通过对摄像头模组的成像器件、接口类型、镜头数量等进行分析,当前主流的摄像头可以分为以下三种类别:


单目

双目

结构光

第一类 桌面级标准摄像头模组

USB接口

USB接口

USB接口

第二类 室内楼道宽动态摄像头模组

USB或MIPI接口

USB或MIPI接口


第三类 室内外出入口专用宽动态摄像头模组

USB、MIPI、网络接口

USB、MIPI、网络接口



人体感应模块

当人脸门禁在弱光或无光环境使用时,通常需要人体感应模块来探测是否有人靠近,然后实时启动补光模块进行补光和人脸识别。补充的技术典型有以下几种:

1.近红外人体感应器

人体感应类开关又叫热释人体感应开关或红外智能开关。它是基于红外线技术的自动控制产品,当人进入感应范围时,专用传感器探测到人体红外光谱的变化,自动接通负载,人不离开感应范围,将持续接通;人离开后,延时自动关闭负载。这样的感应器广泛应用于入侵报警系统中用于探测人员活动。

红外探测器

2.热释电红外传感器

人体辐射的红外线中心波长为9~10um,而探测元件的波长灵敏度在0.2~20um范围内几乎稳定不变。在传感器顶端开设了一个装有滤光镜片的窗口,这个滤光片可通过光的波长范围为7~10um,正好适合于人体红外辐射的探测,而对其它波长的红外线由滤光片予以吸收,这样便形成了一种专门用作探测人体辐射的红外线传感器。

热释电红外传感器

优点:本身不发任何类型的辐射,器件功耗很小,隐蔽性好。价格低廉。

缺点:容易受各种热源、光源干扰;被动红外穿透力差,人体的红外辐射容易被遮挡,不易被探头接收;环境温度和人体温度接近时,探测和灵敏度明显下降,有时造成短时失灵。

3.微波雷达

雷达微波对移动物体的探测具有较高的灵敏度,感应范围内即使微小的动作也能被感应器及时捕捉,如抬起或放下手臂、转身、弯腰等。微波感应能穿透玻璃和薄木门及小于10cm的墙体。不受环境、温度、灰尘等影响。微波感应没有方向性的差异,任何方向的运动均能被有效感应。

微波感应模块具有抗射频干扰能力强、不受温度、湿度、光线、气流、尘埃影响等优势。

微波雷达

总结:近红外、热释电和微波雷达进行人体探测各有优缺点,近红外和热释电灵敏度高成本低廉但是容易受到室外光的干扰,微波雷达体积小探测范围远但是功耗校对较大。综合来看微波雷达是比较成熟可靠的人体感应方案。


补光模块

当前采用的人脸识别补光模块通常使用高亮度的LED灯进行补光。LED补光灯已经是非常成熟的技术,是一种能够将电能转化为可见光的固态的半导体器件,它可以直接把电转化为光。LED的心脏是一个半导体的晶片,晶片的一端附在一个支架上,一端是负极,另一端连接电源的正极,使整个晶片被环氧树脂封装起来。LED补光模块的成熟度比较高差异也比较小,选择合适功率的补光模块即可。

发光二极管


主控板

主控板是人脸门禁计算的核心模块,通常的主控板CPU有以下几种计算类型:

  • FPGA架构

  • 专用加速芯片架构

  • X86架构

  • Arm架构

1.Arm主控

目前人脸门禁的主流主控芯片是以Arm为内核的各类嵌入式智能硬件设备芯片,主要芯片方案有瑞星微、全志、联发科、高通等多个厂商。由于厂商芯片种类繁多,对主控芯片按照芯片基于ARM架构的CPU指令集不同来进行划分,以利于对不同硬件进行性能的对比。

A.超低功耗、超低性能:嵌入式内核

采用Arm Cortex-M系列MCU,超低功耗、超长待机,适用于智能锁、智能猫眼等产品方案。嵌入式内核的CPU处理能力通常在数M或数十M FLOPS左右,性能较低,往往只适用于功耗和性能非常有限的视觉计算。ARM Cortex-M架构,依照市场需求区隔成M0至M4与M7的等级,Cortex-M0主打初阶8/16位应用,Cortex-M3主打中阶的16/32位应用,Cortex-M4主打高阶32位与DSC(数字信号控制)应用,而Cortex-M7则主打旗舰级的高阶自动化生产与IoT应用。

超低功耗、超低性能的嵌入式内核,在人脸识别领域一般仅支持30万-100万像素的人脸比对,人脸库容量要求100人以内,而且要求人脸要高度配合。属于标准理想人脸识别的应用状态。人脸识别算法通常是传统模型并非深度学习的模型。

B.低功耗、低性能:A7、A9内核

ARM Cortex-A7 MPCore处理器是 ARM 迄今为止开发的最有效的应用处理器,它显著扩展了 ARM 在未来入门级智能手机、平板电脑以及其他高级移动设备方面的低功耗领先地位。Cortex-A7 处理器是一种由ARM公司推出的基于ARMv7-A架构的高能效处理器,从2012年地开始被广泛用于低成本、全功能入门级智能手机。

该处理器与为其他Cortex-A系列处理器开发的程序完全兼容,并借鉴了高性能Cortex-A15处理器的设计,采用了包括虚拟化、大物理地址扩展 (LPAE) NEON 高级 SIMD 和 AMBA 4 ACE 一致性等全新技术。并着重考虑了性能与功耗间的平衡。采用了28nm工艺的单个Cortex-A7 处理器的能源效率是65nm工艺下的ARM Cortex-A8 处理器(被用于2010-2012年间的许多流行智能手机)的5倍,性能提升50%,而尺寸仅为后者的五分之一。 

Arm Cortex-A系列的低端CPU,A7、A9系列,通常提供单内核数十M FLOPS的算力,可用于深度学习模型经过大幅度优化的人脸算法,在小规模人脸库进行比对应用。A7、A9架构的芯片数量最多、应用广泛,但受限于芯片性能问题,往往无法实现复杂的算法计算,可用于完全配合型的人脸比对应用场景。

适用的深度学习模型如Resnet 18等低层的深度学习模型,适用人脸库容量通常在1000人以下。

C.中等性能:A12、A17和A53、A57内核 

基于arm Cortex-A系列的中端CPU,如32位的A12、A17或者64位的A53、A57,单内核可完成数百MFLOPS的计算性能,多核心并行可实现接近G FLOPS的处理能力,能够运行一些中等规模的深度学习模型如Resnet 34、Resnet 50,可应用于5000甚至10000人脸库的配合型人脸比对分析等。

Cortex-A17 MPCore处理器是目前Cortex-A系列中性能最高的处理器。Cortex-A17微架构和Cortex-A12完全相同,但是在Cortex-A12架构基础上改进了外部互联,引入了新的一致性总线AMBA4 ACE(原来是AMBA4 AXI),可以更快速地连接内存控制器,从而改善性能和能效。

而得益于这个新的总线,Cortex-A17 可以支持多核心 SoC 的完整内存一致性操作,能够参与 big.LITTLE 双架构混合方案,比如两个Cortex-A17搭配两个Cortex-A7。Cortex-A17将肩负起Cortex-A9下一代的重任,相比 Cortex-A9,Cortex-A17性能提升最多60%。

典型芯片如RK3288、MT6595等,典型设备如树莓派,Raspberry Pi Broadcom CM2708 ARM11 @1 GHz(OC): 316.56 MFLOPS。

D.高性能:A72、A73和A53、A57的混合结构内核

A72、A73是arm的高性能处理器,通过与A53、A57的大小核架构搭配,可实现高性能和低功耗的良好结合。Cortex-A73采用全尺寸ARMv8-A架构,最高可以达到2.8GHz主频,可以使用10nm、14/16nm工艺,而根据ARM官方介绍,当A73使用10nm工艺时,对比上代16nm工艺的A72,性能有30%的提升,并且对AR/VR都有更好的优化。A73是采用ARMv8-A架构中核心最小的处理器,每核心面积在0.65mm,并且继续支持big.LITTLE架构。

A72、A73处理器提供了单核超G FLOPS的浮点处理能力,接近于x86CPU的性能,可用于服务器级别的ARM设备中。

典型的A73芯片如瑞星微RK3399、高通枭龙835等。这类CPU以及结合GPU能够运行Resnet50、Resnet101等深度学习模型,可用于数万人脸库比对及高性能的人脸检测等。

2.专用加速芯片主控

A.嵌入式GPU芯片

深度学习的芯片领导厂商英伟达推出了专门面向设备计算的嵌入式开发模块Jetson TK1、TK2、TX1、TK2等模块。以最新的TX2为例,典型性能达到1.5TFPLOPS。

TX2由TX1的Tegra X1升级至Tegra Parker处理器,该处理器由16nm工艺制造,6核心设计,CPU部分由2个丹佛+4个A57核心共同组成,GPU则采用Pascal架构,拥有256个CUDA,浮点性能为1.5TeraFLOPS,相比老款Tegra X1的 GPU性能提高约50%。

25.jpg

JETSON TX2(图片来源于Nvidia)

GPU专用芯片的优势是性能强劲、软件兼容性好,劣势是成本高、发热量大、在嵌入式市场占有率太低。

B.Intel专用加速芯片

Intel收购的神经网络加速芯片公司Movidius,推出了一种称为神经计算引擎(Neural Compute Engine)的功能,这是一种集成在芯片上的DNN加速器。Movidius称,有了它,Myriad X的DNN推理吞吐量能达到每秒超过一万亿次运算(TOPS),而理论运算量能达到4+ TOPS。

Movidius Myriad X VPU视觉处理单元,这是配备专用神经网络计算引擎的片上系统芯片(SoC),可用于加速端的深度学习推理,比如无人机、机器人、智能摄像头、虚拟现实等产品。Myriad X是芯片上集成的硬件模块,面向专为高速、低功耗、不牺牲精确度地运行基于深度学习的神经网络,让设备能够实时地看到、理解和响应周围环境,可提供1TFlops(每秒万亿次)的计算性能,总体性能可以超过4TFlops。该芯片的尺寸也非常迷你,长宽只有8.8×8.1毫米,而且功耗不到1W,采用台积电16nm FFC工艺制造。

Movidius MA2485

Movidius芯片的优势是成本低、性能强劲、功耗低,但是它的开发环境复杂、软件兼容性差以及产品化程度差。目前有部分厂商使用这类芯片做人脸门禁的开发。

C.海思NPU方案

国内视频成像芯片的主导厂商海思在2017年发布了当前业界最强的视觉智能处理芯片3559A,这是全球旗舰性能的SOC芯片。采用12nm超低功耗工艺;支持多核多CPU;支持3200万像素30帧编码;有独立的DSP和GPU,支持OpenGL和OpenCL,可以做很多现在PC才能做的工作;带双核NNIE 神经网络计算引擎,支持深度学习算法,算力达到惊人的4T(远超NVIDIA的TX1);支持多sensor输入(最多8个),并支持运行拼接算法;支持Professional 4KP30 raw video output等。

作为人脸门禁产品来看,海思芯片主要优势是性能强劲、稳定性好,但是也存在成本太高、定制开发难度大、软件兼容性低等局限。

3.X86 CPU主控

X86主控是指采用基于x86指令的CPU研发的人脸识别门禁设备,x86CPU的优势是软件兼容性好,缺点是成本高、设备体积大、产品稳定性一般,所以现在人脸门禁设备越来越少采用x86架构。

适用于人脸门禁的x86处理器通常为:低功耗赛扬、ATOM系列处理器、低功耗笔记本CPU。

赛扬处理器、ATOM处理器和低功耗笔记本CPU是CPU领导厂商INTEL为了进军嵌入式和移动计算市场所研发的低功耗高性能处理器。赛扬处理器是Intel旗下的「经济型」产品, 于1998年推出。其定位是低端,比奔腾低一级。Intel Atom(官方中文译名英特尔凌动处理器,开发代号Silverthorne)是Intel的一个超低电压处理器系列。该处理器的市场定位是在于智能手机、平板电脑和低成本PC。

后来由于INTEL放弃嵌入式和移动CPU处理器芯片领域,这两个处理器的产品线基本上不再更新。部分人脸门禁产品为了软件兼容性好采用了这类处理器方案。

低功耗赛扬、ATOM系列处理器的浮点运算能力在0.1-0.5TFLOPS左右。

低功耗笔记本系列CPU处理器的浮点性能在0.2-0.6TFLOPS左右。

4.FPGA主控

利用FPGA大规格可编程逻辑进行人脸识别的运算处理是比较早期的一种技术方案,由于FPGA产品体积大、开发困难等原因,当前在人脸门禁一体化设备中较少采用这种方案。

FPGA(Field-Programmable Gate Array),即现场可编程门阵列,它是在PAL、GAL、CPLD等可编程器件的基础上进一步发展的产物。它是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。

FPGA芯片的内部结构

FPGA的开发相对于传统PC、单片机的开发有很大不同。FPGA以并行运算为主,以硬件描述语言来实现;相比于PC或单片机(无论是冯诺依曼结构还是哈佛结构)的顺序操作有很大区别,也造成了FPGA开发入门较难。FPGA开发需要从顶层设计、模块分层、逻辑实现、软硬件调试等多方面着手。

总结:

主控板是人脸门禁机的计算核心,目前是ARM架构的主控板占据主流产品市场。根据主控板的计算性能,将人脸门禁设备可划分为:

消费级人脸门禁设备:人脸库1000人以下,适合单个房间或者中小型企业的人脸门禁管理。合适的CPU涉及:ARM的A7、A9等。

企业级人脸门禁设备:人脸库10000人以下,适合单个建筑或企业的人脸门禁管理。适合的CPU涉及:arm的A12、A17、A53、A57以及Intel的赛杨或atom系列芯片等。

行业级人脸门禁设备:人脸库容量50000人以下,适合大型园区的人脸比对管理。适合的CPU涉及:arm的A72、A73以及专用的芯片加速硬件如Movidius、海思NPU等。


显示屏

1.规格尺寸

人脸门禁的屏幕尺寸参考手机屏幕和平板电脑屏幕,从3.7寸到10英寸多种类型。典型尺寸的对比如下:

手机及平板电脑尺寸

2.接口类型

A.TTL(RGB)接口

SoC的引脚电平标准都是属于TTL电平,+5V表示逻辑,0V表示逻辑0,这就是TTL电平。对于SoC中内置的LCD控制器而言,他的接口输出也是TTL电平,我们把这种接口叫做TTL接口(也叫做RGB接口)。如果LCD的硬件接口也是TTL接口,那么可以直接对接(一般是通过软排线连接),但是一个很现实的原因,TTL电平有很大的缺陷,例如:不能传递太远,抗干扰能力差。

很多的LCD的硬件接口并不是TTL接口,而是采用了其他的接口。为了能够进行匹配,我们的主板这边的接口应该要和LCD的硬件接口必须要相对应,所以我们应该把LCD控制器输出的TTL接口的信号通过IC芯片进行转换,把它变成LCD的硬件接口相对应的接口信号,使他们顺利完成通信。

TTL接口

B.LVDS接口

LVDS,即Low Voltage Differential Signaling,是一种低压差分信号技术接口。由于采用低压和低电流驱动方式,因此,实现了低噪声和低功耗。在液晶显示器中,LVDS接口电路包括两部分,即主板侧的LVDS输出接口电路(LVDS发送端)和液晶皮肤侧的LVDS输入接口电路(LVDS接收器)。LVDS发送端将TTL信号转换成LVDS信号,然后通过驱动板与液晶皮肤之间的柔性电缆(排线)将信号传送到液晶皮肤侧的LVDS接收端的LVDS解码IC中,LVDS接收器再将串行信号转换为TTL电平的并行信号,送往液晶屏时序控制与行列驱动电路。也就是其实TFT只识别TTL(RGB)信号。

LVDS接口

显示的是单信道8位数据模式:有5组差分线,4组信号线,一组时钟线。分别是Y0M、Y0P、Y1M、Y1P、Y2M、Y2P、CLKOUT_M、CLKOUT_P。

C.eDP接口

EDP(Embedded DisplayPort)一种基于Display Port架构和协议的全数字化接口,可以用简单的连接器和较少的引脚来传递高分辨率信号,且传输速率高于LVDS。

eDP接口

EDP接口信号由Main Link、AUXCH、HPD等组成,相比LVDS,可以提供更高清的传输能力。

D.MIPI接口

MIPI (Mobile Industry Processor Interface) 是2003年由ARM, Nokia, ST ,TI等公司成立的一个联盟,目的是把手机内部的接口如摄像头、显示屏接口、射频/基带接口等标准化,从而减少手机设计的复杂程度和增加设计灵活性。MIPI联盟下面有不同的WorkGroup,分别定义了一系列的手机内部接口标准,比如摄像头接口CSI、显示接口DSI、射频接口DigRF、麦克风/喇叭接口SLIMbus等。统一接口标准的好处是手机厂商根据需要可以从市面上灵活选择不同的芯片和模组,更改设计和功能时更加快捷方便。MIPI是一个比较新的标准,其规范也在不断修改和改进,目前比较成熟的接口应用有DSI(显示接口)和CSI(摄像头接口)。CSI/DSI分别是指其承载的是针对Camera或Display应用(例如LCD显示),都有复杂的协议结构。

MIPI接口

E.几种接口类型的对比小结

液晶显示屏的几种接口对比如下表所示:

接口

分辨率

说明

RGB

800*480以下

大部分AP均支持RGB接口,此类LCD在低端平板广泛使用

LVDS

1024*768及以上

主要通过转换芯片将RGB等转成LVDS来支持;少量AP直接集成;此类LCD目前在中高端平板和笔记本中广泛使用

MIPI

1080P以下

手机平台标准接口,与LVDS类似,但更省电;目前普及趋势明显,TI、nVidia、高通等最新平台大多配备RGB和MIPI接口;1080P是其能力的极限

eDP

支持1080P以上

比较新的规范,在笔记本行业将广泛用于取代LVDS,支持超高分辨率


联动输出模块

1.门禁设备的典型接线图

A.传统IC卡门禁的接线图

传统IC卡门禁的接线图

B.人脸识别门禁的接线图

在人脸门禁设备与传统设备对接时,直接将人脸识别门禁兼容485或韦根协议,作为传统设备的一个读卡器进行连接,或者人脸门禁直接连接开关量,控制门禁主板进行设备的开关。

2.开关量

开关量输出是指数字量输出,输出0或1,用于控制外部信号灯、继电器等开关信号。 开关量是指非连续性信号的采集和输出,包括遥信采集和遥控输出。它有1和0两种状态,这是数字电路中的开关性质,而电力上是指电路的开和关或者说是触点的接通和断开。“开”和“关”是电器最基本、最典型的功能。一般开关量装置通过内部继电器实现开关量的输出。开关量输出通道是指为了防止外电路的干扰,往往微成隔离型通道,即DO通道与主机间无直接电连接。由于DO一般用来直接驱动或通过继电器来带动电气设备,了解它的驱动能力很重要。有的数字调节器的DO通道是直接由光隔离或小功率开关电路引出,它的驱动能力不大于20mA。这时要带动一个电气设备(如电动机的交流接触器、电动阀门的单相电动机、电加热器等),必须通过中间继电器。

3.RS485/232

RS485是现场总线使用最广泛的协议之一。在门禁领域主要用于多级设备互联和与上位机通讯。

在要求通信距 离为几十米到上千米时,广泛采用RS-485串行总线标准。RS-485采用平衡发送和差分接收,因此具有抑制共模干扰的能力。

典型的串行通标准是RS232和RS485,它们定义了电压,阻抗等,但不对软件协议给予定义,区别于RS232, RS485的特性包括:

  • RS-485的电气特性:逻辑“1”以两线间的电压差为+(2—6)V表示;逻辑“0”以两线间的电压差为-(2—6)V表示。接口信号电平比RS-232-C降低了,就不易损坏接口电路的芯片, 且该电平与TTL电平兼容,可方便与TTL 电路连接。

  • RS-485的数据最高传输速率为10Mbps 。

  • RS-485接口是采用平衡驱动器和差分接收器的组合,抗共模干扰能力增强,即抗噪声干扰性好。

  • RS-485接口的最大传输距离标准值为4000英尺(约1219米),实际上可达 3000米,另外RS-232-C接口在总线上只允许连接1个收发器,即单站能力。而RS-485接口在总线上是允许连接多达128个收发器。

4.韦根协议

Wiegand是一种数据传输协议,中文被翻译为“韦根”或者“维根”,它是由美国安全工业协会SIA(Security Industry Association)规定的读写接口控制协议。在门禁和一卡通系统中,韦根码作为一种读卡设备与上位机之间的通信介质,其应用领域非常广泛。根据美国安全工业协会颁布的《以26位维根码读卡器为界面的门禁控制标准草案》,26位维根码长度为26位。

韦根传感器是由一根双稳态磁敏感功能合金丝和缠绕其外的感应线圈组成的。它的工作原理是:在交变磁场中,当平行于敏感丝的某极性(例如n极)磁场达到触发磁感应强度时,敏感丝中的磁畴受到激励会发生运动,磁化方向瞬间转向同一方向,同时在敏感丝周围空间磁场也发生瞬间变化,由此在感应线圈中感生出一个电脉冲。此后若该磁场减弱,敏感丝磁化方向将保持稳定不变,感应线圈也无电脉冲输出;但当相反极性(s极)磁场增强触发磁感应强度时,敏感丝磁化方向又瞬间发生翻转,并在感应线圈中感生出一个方向相反的电脉冲。如此反复,韦根传感器便将交变磁场的磁信号转换成交变电信号。

    Wiegand接口界面由三条导线组成:

  • 数据0(Data 0):暂定蓝色,通常为绿色。

  • 数据1(Data 1):暂定白色,通常为白色。

  • GND:暂定信号地,通常为黑色。

这3条线负责传输Wiegand信号。D0、D1在没有数据输出时都保持+5V高电平。若输出为0,则D0拉低一段时间,若输出为1,则D1拉低一段时间。如下图所示:

韦根信号传输原理

上图显示的是读卡器将数字信号以bit的方式发给门禁控制器的一个时序图。这个时序图的Wiegand指导方针是遵照SIA 门禁控制标准协议,这个协议是针对26bit的Wiegand读卡器(一个脉冲时间在20us至100us之间,脉冲的跳变时间在200us至20ms之间)。Data1和Data0信号是高电平(大于Voh),直到读卡器准备发一个数据流过来。读卡器发出的是异步的低电平的脉冲(小于Vol),通过Data1 或者Data0 线把数据流传送给门禁控制盒(如图一的锯齿波)。Data1和Data0脉冲不会交叠,也不会同步发生。

5.以太网有线和WIFI

越来越多的门禁主机采用以太网TCP/IP协议进行设备间通讯,这样的联网型门禁设备可以通过对接网络协议的方式进行对接开发。

有线以太网通过RJ45网线进行连接,WIFI网络是成熟稳定的协议,以近距离无线方式进行连接。

6.蓝牙

在近场通讯时,蓝牙也是较常用的连接协议。蓝牙( Bluetooth® ):是一种无线技术标准,可实现固定设备、移动设备和楼宇个人域网之间的短距离数据交换(使用2.4—2.485GHz的ISM波段的UHF无线电波)。蓝牙技术最初由电信巨头爱立信公司于1994年创制,当时是作为RS232数据线的替代方案。

蓝牙2.0的速度:1.8M/s,蓝牙3.0的速度:可达24M/s,蓝牙4.0的速度:24M/s,覆盖范围可超过100m。

  • 蓝牙2.0的标准是基于1.2进行改进和研发的 ,相较于1.2来说,蓝牙2.0的传输速度有极大幅度的提高,约为1.8M/s~2.1M/s,同时,2.0开始支持双工模式,即可以同时支持语音通话和数据传输,其中数据传输支持文档和图片。

  • 蓝牙3.0于2007年正式公布,3.0采用了全新的交替射频技术Generic Alternate MAC/PHY"(AMP)。3.0极大地提高了传输速度,能够达到24Mbps,在需要的时候甚至能够调用802.11 WI-FI并实现高速数据传输的强大功能。由于3.0的传输速度提高了八倍以上,配备蓝牙3.0的设备之间能够进行很多视频、高清图片等大容量的文件传输。

  • 蓝牙4.0标准在2010年7月发布,4.0最大的亮点是低功耗,且加强了兼容性,降低了延迟,但理论最高传输速度依然没有改变,还是24Mbps,不过,蓝牙4.0能够覆盖超过100米的范围,远远高于过去仅仅只能覆盖10米时的标准,这一点是极大的改变。

总结:人脸门禁与门禁主控板、电磁锁的联动,可以支持开关量、485、以太网、韦根协议以及蓝牙等多种形式。目前485、韦根协议、以太网是主流的协议,未来蓝牙等也有非常大的发展潜力。


本篇总结:

一体化人脸门禁产品是当前人脸门禁的主流产品,产品部件众多、组合方式多样、适用范围差异较大。客观来看,所有产品功能设计的组合是为了用户的需求和场景的细分,所以提出了以用户使用场景来划分一体化人脸门禁产品,形成了三种场景分类、三种比对设备级别的细分。

三种场景分类为:第一类,室内标准配合场景;第二类,楼道出入口半配合场景;第三类,园区或建筑出入口自然通行场景。

三种比对设备级别为:第三级,消费级,适用于1000人脸库以内的配合型比对;第四级,企业级,适用于10000人脸库以内的半配合型比对;第五级,行业级,适用于50000人脸库以内的自然通行比对。其它分级如第一级学术级、第二级娱乐级和第六级金融级属于应用数量较少的种类,不再详细阐述。


第六篇 人脸门禁产品软件


人脸门禁通常不仅是一体机的单机系统,还涉及管理平台、客户端软件等软件组件。而且人脸门禁一体机上的单机软件也是人脸门禁产品软件的重要组成部分。通常来说人脸门禁的软件涉及几个方面:

  • 设备端软件。指运行在人脸门禁一体机或者组合式产品上的离线门禁管理软件,实现人脸检测和防线比对功能;

  • 平台管理软件。指运行在服务器主机或者云平台上的管理软件,实现人脸库管理、设备管理等功能;

  • 客户端软件。通常指运行在客户端电脑上的门禁管理软件,实现对设备、对用户的交互界面。


人脸门禁业务流程

人脸门禁通常的业务流程涉及设备初始化、用户注册和库管理、人脸检测和库比对、报警联动、运营维护等步骤流程,各个步骤相互关联,每增加一个设备或者用户都涉及要循环类似的业务流程。

人脸门禁业务流程

1.设备初始化

人脸门禁设备的初始化一般包括如下内容:

  • 设备参数初始化,如设备名称、位置等信息;

  • 网络参数初始化,如设备的IP地址、访问外网的方式等;

  • 人脸检测参数初始化,如采用的摄像机种类、人脸检测算法参数配置等;

  • 人脸比对参数初始化,如人脸比对的一些配置参数;

  • 门禁联动配置的初始化,配置与门禁设备的协议对接等方式等。

  • 其它一些和系统或组网相关的参数初始化。

2.人脸库注册和管理

人脸门禁要想对人脸进行比对,首先要对比对人脸的名单库进行注册管理,通常采用批量导入或者用户逐个注册的方式实现对人脸门禁底库的建立。

人脸库建立以后,还涉及到增加人员名单、更新或删除人员名单等操作。

涉及到访客管理功能时,需要对访客进行邀请、注册、到达告警以及访客权限的过期自动删除等。

3.人脸门禁比对和联动

人脸门禁的比对通常在设备和用户数据初始化以后,由人脸门禁设备自动完成。人脸门禁在比对通过的结果还要和门禁及其它模块进行报警联动。

4.运营维护和数据分析

人脸门禁的通行记录、报警记录、访客记录、用户和设备权限等数据,可供后台查询或者数据导出。


设备端软件

运行在人脸门禁比对设备上的软件通常称为设备端软件。根据设备端软件操作系统一般分为Android设备端软件、Linux设备端软件和Windows设备端软件。当前基于Android的设备端软件占据主流地位。Linux设备端软件通常稳定性好但是功能可能相对简单而且难于扩展,Windows设备端软件通常稳定性较低。

  • 设备初始化。指在设备端对设备的基本信息、网络信息、人脸检测信息、人脸库信息、运营维护、升级管理等功能进行初始化配置。设备初始化往往是安装设备的第一阶段的工作。

  • 人脸库注册。指在设备端对人脸库进行添加和管理。以Android设备端软件为例,在设备端的人脸库管理往往比较简单,仅提供基本的人员添加、修改和删除功能,更多功能需要在后台管理软件进行扩展。如果人脸门禁设备支持联网管理,也涉及到设备本地注册的人脸名单库要与后台注册的人脸名单库进行同步更新的操作。

  • 联动控制。通常指对接门禁控制器的连接接口和对接协议,以实现对人脸门禁控制器的控制功能。联动控制通常涉及到开关量、485总线或者韦根协议的兼容性问题。

  • 数据查询统计。设备端软件要能支持基础的人脸比对记录、通行记录、权限记录的查询和导出管理等功能。


平台管理软件

平台管理软件是指运行在局域网联网主机或者互联网云平台上的管理软件,实现对多个门禁设备的统一管理和多个客户端的接入管理功能。平台管理软件是实现人脸门禁联网的核心软件,平台管理软件的管理规模和业务功能决定了整个门禁系统的组网规模和可管理可维护的能力。

1.设备连接管理

平台管理软件的一个基本功能是对多台设备进行联网管理,监测每台设备的状态以及对每台设备进行数据的同步。

对每台接入设备的状态管理需要通过定时与每台设备通讯以获得设备的实时状态以及对设备进行远程操作管理。

对多台设备数据进行同步是平台管理的重要功能,例如对用户设置了门禁访问权限,那么当系统增加多台设备时平台软件负责把用户的权限数据同步到指定范围内的多台门禁设备。

2.用户库管理

平台管理软件实现对所有用户以及涉及用户的群组的统一数据管理功能。平台的用户管理一般支持批量的用户操作、用户的权限管理以及用户的记录管理等功能。

用户分为系统管理员用户、普通用户和访客用户等不同类型,平台管理应支持多种不同用户的差异化管理。

3.记录管理

平台负责记录所有设备所有用户的基本数据、配置权限、通行记录等数据,支持对记录管理的导出备份等。

4.系统管理

平台一般也支持软件版本自动升级、系统配置以及对设备、对用户的基础配置等工作。


客户端软件

客户端软件是指安装在电脑或手机等设备上,直接连接管理平台,可以实现平台的交互界面的软件。客户端软件通常为WEB版本或者APP程序版本,甚至完全通过微信、百度、阿里的小程序实现对客户端的各项基本操作。

1.批量设备管理

除了基本的设备管理功能外,客户端软件可实现对设备的批量添加、批量修改或批量删除。客户端软件将平台的功能进行交互呈现。

设备管理通常涉及到设备所属的区域、所属的组织的配置管理。

2.批量用户管理

客户端软件可实现对用户的单独管理和批量管理,用户管理是客户端软件的主要功能。通常涉及用户的组织管理、用户的添加和修改、删除等。

3.访客管理

访客在门禁系统中是一种特殊的用户,即配置完用户后过了指定时期可由系统自动删除权限的用户。

4.数据管理

客户端支持对设备数据、用户数据、访问数据等多种数据的查询、导出等功能。

5.运营维护

客户端软件应支持配置系统基本信息、配置软件升级信息、配置一些系统必备的信息等。

总结:人脸门禁的硬件是产品的骨架,人脸门禁的软件是产品的灵魂。人脸门禁软件涉及到设备端软件、平台软件和客户端软件等几种类型。软件功能的业务丰富度、软件功能的易用性是人脸门禁实用性最重要的体现 。


第七篇 测试检验方法


作为最终用户如何选择和检测人脸门禁产品是核心的基础需求。人脸门禁的产品检验应首先结合用户的使用场景,确定人脸门禁应检测的范围和重点功能,过少的检测将影响系统的可用性,过多的检测实际上除了增加不必要的系统成本也容易造成对重点功能的忽视。建议按照人脸门禁适用的三类场景和六种应用需求,确定人脸门禁的使用用户以后再进行针对性的测试检验。

人脸门禁的测试检验通常分为:

人脸门禁的测试检验流程

按照这些检测过程,对人脸门禁产品的测试列为测试项目查验表的形式进行。


应用场景和测试用例的设计

人脸门禁的测试检验,通常要考虑以下应用场景:


第三级配合型消费级

第四级半配合型企业级

第五类无感型行业级

第三类室外无感型



室外光线差异大的建筑大厅和社区出入口门禁

第二类楼层半配合型


光线基本保障的建筑楼层和社区单元出入口门禁


第一类室内配合型

光线充足的室内办公室门禁、人脸柜、人脸锁等




成像环境

1.室内配合型标准环境的测试

编号

测试项

测试内容

预期结果

实测数据

1

设备安装位置

设备应安装在室内门口光线均匀

设备的安装应能支持稳定检测人脸信息


2

人脸检测距离

检测人脸与设备之间的最小和最大检测距离

应在0.5米-1.5米之内均实现人脸检测


3

人脸检测时间

检测人在摄像头出现及设备检测到人脸的时间

人脸检测的时间应低于0.2秒


4

人脸检测精度

检测2个以内多人在画面出现后人脸检测数量

根据设备要求应至支持1人检测,理想支持2人并发检测


2.室内半配合环境的测试

编号

测试项

测试内容

预期结果

实测数据

1

设备安装位置

测试设备可安装的上下位置

设备的安装应能支持稳定检测人脸信息


2

人脸检测距离

检测人脸与设备之间的最小和最大检测距离

应在0.5米-1.5米之内均实现人脸检测


3

人脸检测时间

检测人在摄像头出现及设备检测到人脸的时间

人脸检测的时间应低于0.2秒


4

人脸检测精度

检测5个以上多人在画面出现后人脸检测数量

根据设备要求应至支持1人检测,理想支持5人并发检测


3.室外自然光环境的测试

编号

测试项

测试内容

预期结果

实测数据

1

设备安装位置

设备应安装在室外出入口

设备的安装应能支持稳定检测人脸信息


2

人脸检测距离

检测人脸与设备之间的最小和最大检测距离

应在0.5米-3米之内均实现人脸检测


3

人脸检测时间

检测人在摄像头出现及设备检测到人脸的时间

人脸检测的时间应低于0.1秒


4

人脸检测精度

检测10个以上多人在画面出现后人脸检测数量

根据设备要求应至支持1人检测,理想支持10人并发检测



主控模块性能

对主控模块的检测应能体现出设备主控的计算性能和管理人脸库的容量

1.第三类消费级门禁测试

编号

测试项

测试内容

预期结果

实测数据

1

人脸库容量

批量导入1000个人脸名单

人脸名单导入全部成功,并能实现正常的比对管理


2

人脸比对时间

在1000人脸库时,  进行人脸检测比对

人脸检测和比对时间应在1秒以内


3

人脸比对精度

1000个人脸库随机抽取20-30人进行准确度测试,或关闭活体检测用100-200人检测

人脸检测的准确度应达到95%,人脸判误或出错应低于千分之一


4

系统稳定性

设备反复重启100次

系统失效率应低于1%


2.第四类企业级门禁测试

编号

测试项

测试内容

预期结果

实测数据

1

人脸库容量

批量导入10000个人脸名单

人脸名单导入全部成功,并能实现正常的比对管理


2

人脸比对时间

在10000人脸库时,  进行人脸检测比对

人脸检测和比对时间应在1秒以内


3

人脸比对精度

10000个人脸库随机抽取50人进行准确度测试,或关闭活体检测用100-200人检测

人脸检测的准确度应达到99%,人脸判误或出错应低于千分之一


4

系统稳定性

设备反复重启100次

系统失效率应低于1%


3.第五类行业级门禁测试

编号

测试项

测试内容

预期结果

实测数据

1

人脸库容量

批量导入50000个人脸名单

人脸名单导入全部成功,并能实现正常的比对管理


2

人脸比对时间

在50000人脸库时,  进行人脸检测比对

人脸检测和比对时间应在1秒以内


3

人脸比对精度

50000个人脸库随机抽取100人进行准确度测试,或关闭活体检测用1000-2000人检测

人脸检测的准确度应达到99%,人脸判误或出错应低于千分之一


4

系统稳定性

设备反复重启100次

系统失效率应低于0.1%


联动输出

对联动报警的测试,通常检测以下项目:

编号

测试项

测试内容

预期结果

实测数据

1

报警接口

以太网,开关量,韦根

同时支持开关量、以太网以及韦根等多种接口


2

报警速度

人脸检测比对后报警联动触发时间

人脸比对成功后,报警应实时进行,延时低于0.1秒


3

报警配置和关闭

指报警是否可配置开关

设备的报警输出应可配置对接协议和报警联动参数



产品评估综合因素

评估人脸门禁产品的原则是:先评估类别,例如是室外型、楼层型还是室内门型,再评估设备的性能等级是消费级、企业级、行业级。评估人脸门禁最好通过公开的检测检验机构进行。

人脸门禁产品的评估,建立 针对主要功能项,采用计分制的方式进行评估,以衡量相对优势。典型的人脸门禁评分模型参考如下:

序号

项目

预期数据

说明

1

人脸检测成像能力

15分

按照室外宽动态、楼层出入口、室内标准光三个等级,分别对应10-15、6-10、1-5分等

2

主控板硬件性能

10分

按照行业级、企业级、消费级的人脸库规模及算法精度得分

3

主控板接口功能

5分

按照主板支持的扩展接口

4

平台软件功能

15分

按照平台软件实现的功能数量

5

客户端软件功能

10分

按照客户端软件的易用性

6

产品外观形态

5分

按照产品外观设计


第八篇 行业解决方案


人脸门禁并不是一个孤立的产品,而是涉及到产品的联网和应用的场景。结合不同应用场景可组合多种人脸门禁产品进行综合应用,实现对细分场景的完整应用能力。以下细分解决方案仅描述产品方案涉及的组成和联网情况。

细分解决方案时,会结合需要将人脸门禁产品形成人脸摄像机、人脸比对屏、人脸闸机、人脸智能柜等多种产品形态。

事实上有人的地方都可能会用到人脸门禁系统或者人证合一设备,尤其是在机场案件、火车站进展、边防站、酒店大堂认证合一得到了广泛的应用。人证合一严格意义上来讲就是人脸门禁系统。


智能楼宇

毫无疑问,智能楼宇行业将是除人证合一应用之外最大的行业之一了。在智能楼宇的业态中,包含了小区(住人)、大厦(办公)、工厂(生产)、酒店(住宿)、各种场馆(活动),而这些场所正是大多数市民工作和学习的地方,进出的次数最多,故而人脸门禁的需求最大。

智能楼宇人脸门禁应用

智能楼宇和人脸识别相关的不仅包括人脸门禁产品,还包括人脸摄像机、人脸闸机、电梯人脸控制系统、人脸智能柜(快递柜)、人脸访客系统、人脸考勤系统、人脸会议签到系统。


智感社区

智感社区又称智感安防区,是继平安城市、雪亮工程之后的又一大安防蓝海市场。常见的智感社区要解决最后一公里人员和车辆的管理问题。而人脸门禁系统是最佳的人员管理方案,故而智感社区优先建设人脸门禁系统,当然进出门的权限可能由卡片来决定,而不一定要用人脸进行识别,人脸识别只作为一种图像记录的手段。

 

智感社区如果足够大的话,人脸识别的应用和智能楼宇差不多,唯一不同的是智感社区的门禁可能带人脸识别功能也可能不带,即使是具备人脸识别的门禁机,也不一定用人脸做通行权限的判断。其他的人脸摄像机、人脸闸机、人脸访客管理、电梯人脸梯控等也会用到。


智能校园

智慧校园的主要服务对象是学生,而不能像管理居民和上班族那样管理。主要应用校园的主出入口用来人脸识别身份,校园宿舍的舍管系统(比如对夜不归宿的管理)、课堂签到、考试实名认证等。

在智慧校园的建设中,可能包括的系统或产品有:人脸识别摄像机、人脸闸机、人脸访客系统、人脸门禁、人脸班牌、人脸考勤系统、人脸消费系统、人脸图书借阅系统等。


智能零售

对于零售业而言,线上向线下渗透、线下向线下渗透同样流行。对线下的实体商业而言,如果最大限度的吸引顾客、分析顾客行为、为顾客提供差异化服务,提高单点的人流量和交易量同样重要。而利用人脸识别技术进行人流统计、VIP身份识别、防盗、防窃、热度图分析、用户行为分析方面有着很大的技术优势和技术成熟度。

对零售行业而言,和人脸识别相关的应用和系统包括:人脸客流画像摄像机、人脸广告屏、VIP会员管理系统给、人脸会员收银机、人脸智能柜(存物柜)等应用。当然也可以用于店铺的工作人员考勤、签到服务。


第九篇 未来发展趋势


预测趋势的最好方法就是不去预测。在2009年的时候,编者之一的纽豪斯就曾经预测过门禁系统的发展趋势,唯一没有预测到的趋势就是人脸识别门禁系统(虽然有提到生物识别),但人脸识别不仅发生,而且成为事实。

预测趋势是毫无意义的。本书在最后一张里和大家分享最近2-3年最可能发生的事情。

  • 无感通行(无闸机、无门禁)。就是不论是人还是车辆完全不需要配合,自然通行就可以通过任何闸机或门禁,甚至不用刷卡、不用扫二维码,就是无感通行的典型应用。比如现在已经出现了很多高级写字楼已经取消物例闸机、有些地铁站的闸机是常开的没有权限才自动关闭进行拦截。

  • 人脸+电梯。理论上讲电梯才是最好的门禁系统,我们可以设想在一栋高层建筑物里面,你到达的每一层都要通过电梯到达,目前的很多高档电梯都可以实现楼层控制和自动派梯。我们可以设想一种场景,不论是业主还是访客,当你走在电梯门口时,电梯可以自动判断你要抵达的楼层,不论你是业主还是访客,如果电梯自动派梯多要抵达的楼层不是你所想要的楼层才需要手工干预抵达的楼层,但是即使手工干预,系统也可以通过人脸识别判断你到底有没有到达相关楼层的权限,最大限度的提高大厦的安全性和无感通行的效率。

  • 人脸+停车场出入口管理。我们可以假想一种场景,当你驾驶一辆无牌车进入一个具备车牌识别的停车场,你会发现你还是无法实现自动进入(无感通行),现有的解决方案主要包括拿卡、手机扫二维码,而未来一定会出现一种通过人脸识别的方法让无牌车实现自动放行,你只需要摇下车窗(甚至不用),系统通过人脸识别来判断车辆身份。也就是说未来的停车场不一定是靠车牌判断通行权限的,很有可能仅通过人脸识别就能够实现通行权限管理和自动缴费。

  • 人脸+门禁。未来2-3年一定会出现人脸识别无感通行的门禁系统,传统的道闸消失了、大门是常开的,你可以自然的通行任何一个区域(如果你拥有权限的话),但是当你们权限的时候,物例装置会自动关闭通行区域,这个时候闸机关上、大门也会自动关闭。对于强行过关的人和车系统会自动识别黑名单,下一道门禁或闸机就不会让你通行,当然系统还具备高效的防尾随系统,一旦发生尾随,系统就会禁行人和车一段时间(或者永久),就会有力的防止非授权进出,人工也可以干预。貌似不安全的系统同样会提高系统的安全性。

  • 全功能型闸机。一部闸机同时支持刷门禁卡、身份证、地铁卡、闪付卡、二维码、Apple Pay(或者其他Pay)、指纹、指静脉、虹膜、掌纹、人脸识别,总之你喜欢用哪一种就支持哪一种。最大化限度的方便人的进出,这样的趋势已经出现,相信最先应用的将是地铁的市场,之后会逐渐普及到各种需要通道的场所。

  • 成像能力的全天候。随着摄像头成像能力的普遍提升,人脸门禁将不再区别室外版还是室内版,摄像头将统一具有全天候成像能力,适用各种复杂的光线条件。

  • 人脸比对性能的更大提升。当前人脸门禁由于主控板性能问题仍需要划分消费级、企业级、行业级门禁,未来随着性能的提升,企业级甚至行业级主机将是基础配置,硬件性能将大幅度提升。

  • 人脸管理软件的丰富化。未来人脸门禁的软件将丰富化、模块化、多元化。门禁软件将不仅只是门禁通行、考勤打卡,而且将集成到员工的情绪分析、通知消息、活动评估等多种情况。

  • 人脸比对数据的大数据化。人脸门禁的设备将不再孤立只是门禁数据,而将与员工行为评估、任务分工、IT信息关联等多种信息系统融合,实现数据的大数据化。

  • 人脸库ID的统一融合。未来人脸门禁将不再需要单独注册ID,而是借助微信、手机号等公用ID,实现统一融合的一人一档身份授权管理。

真正的未来趋势是需要广大读者和编者们一起去努力实现的,谁说不是呢?


主要参考资料

[1]张新房等.视频云技术蓝皮书.北京:中国电力出版社,2018

[2]张新房等.人工智能技术蓝皮书(公共安全篇).北京:中国电力出版社,2018

[3]张新房.智能视频监控系统.北京:中国电力出版社,2018

[4]张新房.图说建筑智能化系统.北京:中国电力出版社,2009

-完-


关于人人智能

人人智能(FaceOS)致力于人脸云系统的产品化,适用于实名制人证比对、智能建筑智能通行、新零售智能客流等领域。凭借对芯片、算法、OS、终端的丰富积累,专注基于深度学习的算法技术、芯片加速技术、操作系统内核OS重构技术、海量视觉图像数据挖掘技术、产品工程技术等,拥有完整的从技术到应用场景的端到端技术提供能力。

关于赛翼智能

广东赛翼智能科技有限公司是国内专业智能化系统解决方案提供商、智慧社区服务运营商,业务涵盖智慧城市、云计算数据中心、建筑智能化领域的项目咨询规划、方案设计、软件开发、工程施工、系统集成与服务,以及智慧社区、互联网可视门禁对讲管理系统的研发、生产、销售、配套服务与运营等。

AI智道,致力于AI赋能落地安防!

注:未经授权禁止全文或者部分内容的转载,如需获取转载授权,请添加微信号:tsh620,以获取转载授权。



版权声明
本文由智客号作者上传并发布,智客号仅提供信息发布平台。文章仅代表作者个人观点,不代表千家智客立场。

相关推荐

评论文章

全部评论(0)

房叔话安防

房叔,真名张新房,人称“房叔”,17年视频监控和安防行业经验,目前专注于视频监控、人工智能、计算机视觉技术。

格式jpg品质60图片即可