主题 : 人脸识别硬核科普:人群中看你一眼,从此不忘你容颜
千山同一月 万户尽皆春 千江有水千江月 万里无云万里天
级别: 总版主

UID: 998
精华: 0
发帖: 605006
威望: 528829 点
无痕币: 7 WHB
贡献值: 0 点
在线时间: 62002(时)
注册时间: 2008-12-25
最后登录: 2024-04-17

0 人脸识别硬核科普:人群中看你一眼,从此不忘你容颜

小编是个天生懒惰的人,同时又是个急性子,这样的人最享受被科技服务的乐趣。

举个例子,十多年前大家还在普遍用现金的时代,小编在商店买东西排队结账,每当看到收银员找零时手忙脚乱的样子就会心急如焚,只恨不能拿了东西直接走人。那时候年幼的小编就攥紧拳头梦想着以后一定要发明一种不用找零钱的方法。

后来这个在心底萌芽多年的梦想被别人实现了,失望之余小编也乐享其成。用手机扫扫码就能付钱可比现金方便快捷多了。可天知道小编“懒癌+急癌”晚期,久而久之竟觉得抬手扫码、输入密码这样的动作也很麻烦。所以后来出现的指纹支付算是拯救了小编。
再后来,连手指都不用动了,因为出现了“刷脸支付”,配合手上iPhone的卓越体验,不得不说小编爱死了这个功能。

嗯,刷脸支付将小编从付钱时漫长等待的焦躁和不安中解救了出来,所以在IT之家编辑部的科技氛围里淫浸多年后,小编觉得有必要为大家讲一讲“刷脸”到底是个什么东西,也可算是知恩图报了!
“刷脸”,顾名思义,背后是一项关键技术:人脸识别。
别看这两年因为在智能手机上的使用而大热,其实人脸识别技术最早的研究还要追溯到20世纪50年代,当时已经有科学家在研究人脸轮廓的提取方法,但受限于技术水平,这项技术的相关研究一度停滞,直到20世纪80年代,人脸识别的方法才有了新的突破,神经生理学、脑神经学、视觉等相关知识被引入,人脸识别进入了新的发展阶段。
所以,当前阶段的人脸识别不是单一的技术,而是融合了神经生理学、脑神经学、计算机视觉等多方面学科的技术。不过,本质上它还是一项计算机视觉技术。
当然,IT之家做这篇文章的重点不在于回顾人脸识别的历史,而是和大家讲讲人脸识别背后的一些基本原理。
人脸识别技术系统的基本逻辑架构
我们每天用人脸识别技术解锁手机、结账付款,是那么的自然,但相信很少有同学深入思考这项技术背后是怎样一个流程。
前面我们说,计算机视觉是人脸识别关系最紧密的技术。所以我们从这一点入手。
计算机视觉,通俗来说就是利用摄像头等设备代替人眼,来获取图像,利用计算机对图像信息进行处理,综合人类的认知模式来建立人类视觉的计算理论。

这其中,最难的无疑是如何处理图像信息、如何模拟人类的认知模式。
为了解决这些问题,计算机视觉还引入了图像处理、模式识别、图像理解、图像生成等学科的知识。
图像处理就是把原始图像转换成计算机更容易识别的图像;模式识别,就是计算机判断自己要识别的是什么和怎么识别的过程;图像理解,就是对图像中描述的景物进行分析;图像生成,举例来说就是当图像的部分信息缺失时,能够将缺失的信息补上……
这些都是计算机视觉需要借助的学科技术。这里面我们要着重讲的是模式识别,它是一个独立的理论体系,具体到计算机视觉领域的应用,它表示将计算机表示出来的图像和一致的类别进行匹配的过程。
有点懂是吧。IT之家为大家通俗解释一下,所谓“识别”,就是先认识,然后辨别。认识什么?认识的是图像和从图像中总结的目标物体的特征。怎么辨别?就是将总结出来的特征和自己已经掌握的特征库进行比对,然后才能实现辨别。
我们人类识别一样物体也是遵循这个逻辑,先总结特征,然后比对。至于前面的“模式”,就有点抽象了,你可以理解为一种规律,它影响着特征和类型比对的结果。
没错,人脸识别本质上也是这个过程。
所以,我们沿着模式识别的思路,来看看它的整体过程:分别为预处理、特征提取和分类等。我们画出如下流程图:

千山同一月 万户尽皆春 千江有水千江月 万里无云万里天
级别: 总版主

UID: 998
精华: 0
发帖: 605006
威望: 528829 点
无痕币: 7 WHB
贡献值: 0 点
在线时间: 62002(时)
注册时间: 2008-12-25
最后登录: 2024-04-17

预处理是第一步,但是这部分工作可能很多很杂,例如减少图像中的噪声干扰、提高清晰度、还有包括图像滤波、变换、转码、模数转化等。
特征提取,就是在预处理后的图像中,提取对识别有明显作用的特征,并在这个过程中降低模式特征的维数,令其便于处理。这是一个复杂的过程,后面我们讲到具体方法时候会有体现;
分类,就是对提取到的特征值按照一定的准则进行分类,便于决策。

举个例子,计算机要识别出这张照片中的男人,当它拿到照片时,可能觉得画面太暗,先提个亮度,然后又发现噪点太多,再做个降噪……一顿操作后感觉可以了,再将照片转化为数字信息,这个过程是预处理。

提取出来的特征值会进入单独的特征空间,因为这样可以更好地识别和做分类。接下来,就要对特征空间里的数据进行分类了,让它们眼睛归眼睛,鼻子归鼻子,头发归头发……基于这些分类好的数据,计算机才可以进行识别判断和决策。
当然,为了方便大家理解这个逻辑过程,IT之家在这里只是举例粗略地说明,可能不准确,实际的步骤也是相当复杂的,还要考虑各种干扰的因素,例如图像的质量不清晰、背景复杂、图像光照分布不均匀、目标姿势角度出现扭曲或者佩戴了头饰、眼镜以及张了胡须、化了妆等等各种情况。

还有要说明的一点是,这个模式识别的系统是需要一个自我训练、学习的过程的,其中最重要的是对前面分类错误率的训练(分类器训练),因为在前面的分类中,我们无法保证分类的结果是100%正确的,但必须控制在一定的错误率之类,这必须通过大量的训练样本来不断修正,令错误率符合要求。
千山同一月 万户尽皆春 千江有水千江月 万里无云万里天
级别: 总版主

UID: 998
精华: 0
发帖: 605006
威望: 528829 点
无痕币: 7 WHB
贡献值: 0 点
在线时间: 62002(时)
注册时间: 2008-12-25
最后登录: 2024-04-17

好了,基于以上对计算机视觉模式识别的讨论,我们就可以给出人脸识别系统的主要功能模块了:

可能有小伙伴觉得上面这个举出功能模块太简单了,所以我们再精确一些,给出下面的逻辑架构图,相信不难理解:
知足常乐
级别: 十方秋水

UID: 23
精华: 1
发帖: 261097
威望: 117110 点
无痕币: 2292 WHB
贡献值: 0 点
在线时间: 9389(时)
注册时间: 2007-11-24
最后登录: 2024-04-17

看看学习了解一下
事能知足心常乐 人到无求品自高
千山同一月 万户尽皆春 千江有水千江月 万里无云万里天
级别: 总版主

UID: 998
精华: 0
发帖: 605006
威望: 528829 点
无痕币: 7 WHB
贡献值: 0 点
在线时间: 62002(时)
注册时间: 2008-12-25
最后登录: 2024-04-17

这个可以看看,了解一下。
十方秋水,漫长旅途.
级别: 十方秋水

UID: 116295
精华: 0
发帖: 111450
威望: 122808 点
无痕币: 4249 WHB
贡献值: 0 点
在线时间: 6088(时)
注册时间: 2011-03-27
最后登录: 2024-03-09

感谢楼主分享
Total 0.042075(s) query 4, Time now is:04-17 02:33, Gzip enabled 粤ICP备07514325号-1
Powered by PHPWind v7.3.2 Certificate Code © 2003-13 秋无痕论坛