2
然而,制造重庆“3·19”哨兵遇袭案的袭击者,显然比尹刚谨慎得多。始终掩盖在浅色线帽下的,到底是怎样一张面孔?
对于这样的情况,人眼识别困难重重。以至于曾目击枪匪逃窜的废品铺老板不胜其扰,每次面对记者,只能反复说:“他脑袋上套着帽子,只露出眼睛。”
的确,刘海、口罩、帽子、眼镜,是人脸图像中最常见的遮挡物,对识别准确率影响很大。墨镜更是绝佳工具。章柏幸和他的研究小组就曾接到某国家部门的一张视频截图,画面中的人用墨镜遮挡住大部分的脸部特征,难以辨识。
“但这并不直接影响‘人像组合系统’画出脸的大致模样。”章柏幸说,“即便他隐藏了某个‘部件’。”
这些“部件”,指构成人脸的五要素:脸型、眼睛、鼻子、嘴巴和眉毛。“人像组合系统”的计算原理,正是分析五部件的各自特征。系统将人脸识别分解为:人面像识别,眼睛识别,嘴巴识别,鼻子识别,眼眉识别。如此细分,可以有效避免由年龄、姿态等变化产生的面部变形对捕捉人脸信息造成的影响,“摘掉”眼镜和口罩,也不是什么难事儿。
在“人像组合系统”的作用下,几分钟后,一张隐藏在墨镜下的人脸逐渐清晰,新图像随即交由当地警方,在辖区范围内排查锁定嫌疑人。
“摘墨镜”看似简单,系统却需要运行一系列庞大的运算。因为人面部的五官结构各有不同,为获得准确结果,每个细部的识别都需要用不同的方法分析计算。
而操作者只需“做道选择题”:向系统输入“戴墨镜”的人脸之前,不选眼睛,只在其余四“部件”前打上钩。用章柏幸的话讲,要让计算机明白,这次眼睛“不做数”。
置换一个最简单的例子,即便本·拉登刮掉了标志性的浓密长胡子,去掉下巴,也能画出他的模样。
3
但是,从视频中还原并组合出相对清晰的人脸,只是两步必要的“准备”工作,要想从茫茫人海中揪出嫌犯,还需要“人脸识别系统”的运算分析。
而这一系统,在2008年北京奥运会开幕式的入场安检中,就曾发挥过作用。
这是奥运史上首次采用具有“生物特征”的身份识别方式。8月8日当晚,观众进入“鸟巢”,除了凭借那张价格不菲的门票,还必须逐一在进场通道前“留张影儿”。
“拍照”由一部安装在人脸识别认证设备顶端的摄像头完成。这个摄像头,与另一台识别门票信息的刷票机,共同组成了人脸识别认证系统的终端。
持票人刷票时,摄像头在一两秒钟内抓拍人脸,系统再自动分析1秒内的25帧画面(或2秒内50帧画面,依次叠加),选取角度合适并且相对清晰的5帧(或10帧),定位面部关键点,并提取特征,随后将持票人和票内信息的认证结果同时上传到中转服务器,再由中转服务器上传至安保中心服务器。观众信息获得认证并通过,只需要两三秒时间。
“定位关键点和提取特征,是整个识别系统中最关键的一步。”章柏幸说。
然而,困难在于,人脸本身虽不易改变,神态却千变万化,甚至在人的一生中,一张面孔上绝对不会出现两种完全相同的表情。加上年龄增长和不同光照下的明暗变化,识别人脸对于只认数字和计算的电脑来说,困难重重。
“但是在识别过程中,电脑必须和人脑一样,看一眼就知道‘他是不是他’。”中科院计算机研究所博士孙庆南说。北京奥运会期间,他作为奥运会电子门票协调小组成员之一,直接参与了人脸识别快速身份验证系统的实施和操作。
其实,人的面部有许多无法改变的特征:眼眶内外侧的比例,鼻梁长度和鼻翼宽度的比例……这些由人的面部骨骼决定的比例关系,组成了无数个“关键点”,不会因为胖瘦、表情、年龄的变化产生改变。
于是,系统根据这些关键点进行统计学计算,建立起数据模型,把人的面部解析成由数字组成的“矩阵”,变成电脑能读懂的“语言”。这样一来,人脸经计算机转换为数字,一点点计算出来,最终提取出一组能够表达整张人脸的特征数据。
为奥运会开幕式门禁建立的数据库,包含了所有持票人购票前提交的正面免冠照片,并且已完成对面部特征的逐一提取。当系统从摄像头图像中提取的持票人特征,与数据库中已储存的购票人特征重合度达到80%以上时,便能认定“他就是他”。
“通常,在我们的系统里。这组数据称为‘680维特征’。”章柏幸说。

Copyright ©1999-2026 chinanews.com. All Rights Reserved