人工智能知识全面讲解: 人脸识别技术

2023-05-16

早在40年前,图像识别领域就有很多关于人脸识别的研究。但是在当时,
传统算法在普通图像识别中已经很难取得良好的识别效果,更何况还要从人脸
中提取更加细微的特征。在很长一段时间里,人脸识别主要存在过拟合与欠拟
合两个问题。
一方面是因为不同的人脸之间的差别只有五官上细微的差异,这要比区分
飞机、桌子的照片更难。因为后者的特征差异明显,比较容易判断,而模型容
易将长得很像的两个人误判为同一个人;另一方面是同一个人在不同时间拍摄
的两张照片可能由于光照、角度、年纪、表情、化妆等不同的原因,导致同一
个人的脸在计算机看来有很大的差异。因为过拟合与欠拟合这两个问题的限
制,人脸识别技术一直发展得非常缓慢。
直到深度神经网络出现以后,人脸识别技术才有了真正的可用性。自从
2014年来自香港中文大学的团队开发的模型,使得计算机在人脸识别任务上的
表现第一次超越人类,人脸识别开始从电影银幕进入人们的日常生活。现在我
们开通金融账户,不必再跑到营业点,直接就能通过手机刷脸验证;在火车
站、出入境等地方使用人脸识别技术搜索犯罪嫌疑人,成了案件侦破的利器。
11.3.1 人脸检测
人脸识别是一个从一幅数字图像或一帧动态视频中,“找到人脸”和“认
出人脸”的过程。这两个环节也称为“人脸检测”与“人脸识别”。之所以设
置人脸检测,不仅是为了检测出照片上人脸的位置,更重要的是去掉照片中与
人脸无关的噪声信息,加快识别速度。否则将整张照片的所有像素点都输入模
型中会影响模型的判断,也会增加计算复杂度。
目前主流的人脸检测是用方向梯度直方图,这个方法主要是将图像灰度化
后,分析某片像素区域,根据明暗度生成一个箭头,箭头的指向代表了像素逐
渐变暗的方向。如果我们重复操作每一个区域,最终图像会被很多箭头取代。
这些箭头称为梯度(gradients),它们能显示出图像从明亮到黑暗流动的过
程,这样做可以将人脸的结构用梯度大致表示出来,如图11-18所示。最后再
与已知的人脸梯度库对比,即可找出新图像的人脸位置。

对于人脸检测的这个环节不一定要使用深度学习技术,因为这个环节的要
求相对低一些,只需要识别照片中有没有人脸以及人脸在照片中的大致位置即
可。
11.3.2 人脸识别
找到人脸以后,接?来我们要区分不同的人脸。人脸识别是一个图像分类
任务,整个识别过程通常包含以?几个步骤:人脸检测、特征提取、人脸对比
分析与分类。人脸检测是对包含用户脸部的图像进行提取,找到人脸的五官、
角度等信息,完成让计算机“看得见”的任务。特征提取则是让计算机“看得
懂”,对于计算机来说朝向不同的人脸是不同的东西,为此我们得适当地调整
扭曲图像中的人脸,使得眼睛和嘴总是与被检测者重叠。
有一种方法叫面部特征点估计法,可以帮助我们解决上面的问题。该算法
的基本思路是找到人脸普遍存在的68个点,这些点被称为特征点,如图11-19
所示。

有了这68个特征点,计算机就能够知道一张照片中眼睛、鼻子和嘴巴的位
置在哪里。因为每张照片的拍摄角度多少有些不同,因此我们需要再做一些人
脸位置的对齐、角度的调整工作,经过这道工序以后这才意味着完成了让计算
机“看得见”的任务。找准了脸的位置后,就进入了人脸识别技术的核心环
节,让计算机能够“看得懂”,看懂特征,区分不同的人脸。这个环节的核心
在于通过眼睛、眉毛、鼻子、嘴巴、脸颊轮廓特征关键点和面部表情网,找
出彼此之间的关联,最终判定这些图像是否为同一个人 。
因此接?来我们需要使用深度卷积神经网络模型来提取细微的脸部特征,
主要步骤是用卷积神经网络计算图像的特征,利用特征计算相似函数,最后为
人脸生成128个测量值。
为了让模型不会产生过拟合或者欠拟合的现象,同时能够获得比较好的识
别效果,我们采用一种定?三元函数的方法。这种方法需要我们在每次训练时
输入三张不同的脸部图像,即同一个人不同角度的两张照片以及另外一个人的
一张照片,三张照片分别代表目标、正例和反例。如果目标与正例是同一个
人,那么它们的测量值不会相差太多;如果目标与反例不是同一个人,那么它
们的测量值会相差比较多。神经网络不断调整参数,以确保第一张和第二张生
成的测量值接近,让第二张和第三张生成的测量值略有不同。经过百万次的训
练,模型可以用一种较为准确的方式为不同的人脸照片编码。
最后,若要判断一个人的图像在不在数据库里,只需要用这个人的人脸图
像与数据库里的图像比对即可。比对时,我们计算两张图片之间的编码距离,
然后与设定的阈值相比较。如果计算的结果高于阈值我们就认为相似度较高,
即两张照片为同一个人。通过这样的方式完成同一个人的匹配,也代表计算机
能够识别出这个人的身份。
实际上关于人脸识别技术,目前已经有许多成熟的算法都能够达到我们的
要求。尽管每个算法的步骤和计算方式不太一样,但核心都是人脸检测与人脸
识别,首先要让计算机能够找到脸,确定脸的位置,接?来才能够分析脸,识
别出不同的脸。
除了识别身份以外,人脸识别技术还有很多不同的应用。比如活体检测,
在很多风控场景?需要确认摄像头前是一个真实的用户还是一张虚假的照片;
比如人数计算,在出入境等关口可以通过摄像头实时计算过关人数。对于不同
的场景,产品经理关注的指标不同,因此指标的含?也是我们重点关注的事
情。
11.3.3 人脸识别的效果评价方法
在人脸识别领域,常用的评价指标为FAR与FRR。在前文中我们曾提到,在
进行人脸识别,判断测试照片与人脸数据库中某张照片是不是同一个人时,一
般会计算两张照片编码后的相似度或距离。在比较的过程中,我们会设定一个
相似度阈值。如果两张照片的相似度高于阈值则认为这两张照片是同一个人,
如果低于阈值就认为这两张照片不是同一个人。但是无论如何调整阈值的大
小,总是会有一定的错误率,这个错误率称为误识率,用FAR表示。关于FAR,
简单理解就是我们比较不同人的照片时,把两张不同的照片当成同一个人的照
片的概率。所以我们希望模型的 FAR越小越好。
参考以上对 FAR的解释,我们知道,当对同一个人的两张照片进行比较时
可能会出现相似度小于阈值的情况,这个错误率我们称之为错误拒绝率,用
FRR表示。简单理解FRR就是我们比较同一个人两张不同的照片时,错误识别为
两个人的概率。所以我们希望模型的FRR越小越好。
需要将FAR与FRR两个指标结合起来看才能够看出一个模型的效果。试想一
种极端的情况,如果我们把模型的相似度阈值设为1,即使是两张相同的照
片,模型也会判定为两个不同的人,因此模型的误识率为0%。如果单看这一个
指标会误以为模型的效果很好。但如果我们再看误拒率,会发现高达100%,那
么这样的模型对我们来说没有任何意?。
人脸识别技术如今已经融入我们生活的方方面面,我们可以真实地感知到
生活的变化。在购物支付时,不再需要一遍一遍输入密码,只需要刷脸就能迅
速完成支付;在进行出入境安检时,也不再需要人工审核我们的身份,通过人
脸识别已经能够高效、准确地判断;甚至我们上班打卡、计算机开机都能够用
人脸识别,每一个场景的原有流程都大大简化了。除了以上场景外,还有很多
应用场景待产品经理去一一探索,相信借助人脸识别这一有力的?器,未来能
够涌现出越来越多更智能、方便的产品。因此产品经理只有掌握了图像识别、
人脸识别的原理,才能够发现真正有价值的场景,设计出可行的方案。 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

人工智能知识全面讲解: 人脸识别技术 的相关文章

  • ubuntu16.04对SD卡进行分区

    赶在2020年上半年的最后一天 xff0c 匆忙地写上一个博客 这篇博客是对自己的一个反思 xff0c 我的博客属于自己完全开辟的内容几很少 xff0c 有些博客大家随便在网上一搜就能找到 说实话 xff0c 有时候我会怀疑自己的智商有问题
  • RT-thread移植指南-RISC-V

    目录 RT thread移植指南 RISC V 1 概述 1 1 移植资料参考 1 2 移植开发环境准备 2 移植步骤 2 1 全局中断开关函数 2 2 线程上下文切换函数 2 3 线程栈的初始化 2 4 时钟节拍的配置 2 5 中断函数
  • 寒假学习心得--从0开始学破解

    寒假学习心得 从0开始学破解 写给和我一样将要接触或者才接触破解 的朋友们 前提 你必须得真正喜欢 她 一 工欲善其事 必先利其器 1 找一个中文版的OD PEID 记得就OD就有咱PYG版的某牛人强化版的等等等等 找一个合适的工具 干起事
  • 常用的“密码重置”代码

    61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61
  • ORACLE多表查询优化

    转自某地 对作者很愧疚 不晓得地址了 ORACLE 多表查询优化 这里提供的是执行性能的优化 而不是后台数据库优化器资料 参考数据库开发性能方面的各种问题 收集了一些优化方案统计如下 当然 象索引等优化方案太过简单就不列入了 嘿嘿 执行路径
  • Word to PDF Converter v3.0 算法分析及注册机

    Word to PDF Converter v3 0算法分析及注册机 详细过程 1 xff0c 主程序在C Program Files doc2pdf DOC2PDF dll xff0c PEID查壳为ASProtect 1 23 RC1
  • 安全策略调整步骤

    1 修改防火墙 xff0c 保留22 SSHD 8081 APACHE 80 关闭端口443 HTTPS 3306 MYSQL 8080 8088 53 123 2 针对PHP的BUG和安全漏洞 xff0c 只有升级版本一途 xff0c 经
  • 获取微信openid(或昵称头像)的授权登录及其代理

    lt php 本页用于微信授权登录及其代理 64 version V2 0 64 author ty1921 lt ty1921 64 gmail com gt 64 param backurl 传get参数backurl xff0c 则授
  • 常用的PHP文件头和HTML5文件头(含移动端)

    lt php PHP Header Created by ty1921 64 gmail com Ver V1 Date 2017 8 18 1 session session start 2 display errors ini set
  • VB+PHP实现在线修改Windows服务器的配置文件

    本文仅供记录 存档备案用 用途 xff1a 某电话转接系统 xff0c 需要每天修改配置文件 并重启服务端程序 原理 xff1a WEB用于展示修改界面 xff0c 提交 保存配置文件的相关数据 VB端用于定时轮训WEB上保存的数据 xff
  • OLLVM分析

    一 LLVM是什么 LLVM最初是Low Level Virtual Machine的缩写 xff0c 定位是一个 xff0c 但是是比较底层的虚拟机 然而LLVM本身并不是一个完整的编译器 xff0c LLVM是一个编译器基础架构 xff
  • A General Optimization-based Framework for Local Odometry Estimation with Multiple Sensors论文翻译整理

    综述部分 x1f4cc 多传感器融合有两个趋势 xff1a 基于滤波的融合 xff08 MSCKF EKF UKF xff09 基于优化的滤波 xff08 BA xff09 基于滤波器的方法对时间同步很敏感 任何迟来的测量都会引起麻烦 xf
  • 按键精灵的5级开发认证,笔试题参考

    4题是抄的 xff0c 只是为了过级 最后得93分 xff0c 可能代码还是不够最优 xff0c 有看出的大大希望能不吝指点 1 写一个脚本 xff0c 要求启动时 xff0c 记录 xff08 录制 xff09 当前鼠标的移动轨迹 xff
  • 常见端口号和对应服务的概念和作用

    端口号的主要作用是表示一台计算机中的特定进程所提供的服务 网络中的计算机是通过IP地址来代表其身份的 xff0c 它只能表示某台特定的计算机 xff0c 但是一台计算机上可以同时提供很多个服务 xff0c 如数据库服务 FTP服务 Web服
  • 51单片机学习历程---单片机入门

    主要用来做控制的 xff0c 如果要驱动外部设备的话 xff0c 需要使用驱动电路 proteus 模拟 51 8位 最小系统 晶振电路 提供时钟 12M xff08 方便计算机器周期 xff09 11 0592M xff08 非常适合串行
  • 手把手教你使用--常用模块--HC05蓝牙模块,无线蓝牙串口透传模块,(实例:手机蓝牙控制STM32单片机点亮LED灯)

    最近在学STM32 xff0c 基本的学完了 xff0c 想学几个模块来巩固一下知识 xff0c 就想到了蓝牙模块 玩啥好难过有很多博客教怎么连的 xff0c 但自己看起来还是有点糊涂 模块的原理和知识点我就不讲解了 xff0c 这里我主要

随机推荐

  • FreeRTOS实时操作系统----机制

    四 机制 目录 四 机制 4 1任务优先级 4 1 1高优先级抢占低优先级 4 1 2时间片 4 2任务调度器 4 3临界段的保护 4 4空闲任务与阻塞延时 4 5任务延时列表 4 6消息队列 4 6 1消息队列的基本概念 4 6 2消息队
  • 三极管导通条件

    NPN三极管 xff0c 箭头朝外 xff1a 高电平导通 PNP三极管 xff0c 箭头朝里 xff1a 低电平导通
  • 74HC1G66模拟开关,多路复用

    SEL为低电平的时候 xff0c SD导通 SEL为高电平的时候 xff0c SD不导通 直接看数据手册
  • 一张图了解MOS管导通条件

    不管他长什么样 xff0c 直接就看箭头指向 箭头向栅极 xff0c 就是nmos管 xff0c 高电平导通 箭头向外 xff0c 就是pmos管 xff0c 低电平导通 一边连了两根线的就是s极
  • Android SDK的安装配置

    SDK xff1a xff08 software development kit xff09 软件开发工具包 被软件开发工程师用于为特定的软件包 软件框架 硬件平台 操作系统等建立应用软件的开发工具的集合 因此 xff0c Android
  • 1.C++简介

    学习目标 xff1a 初识C 43 43 xff0c 介绍C 43 43 一些简单的语法 xff1a 初识C 43 43 数据类型 运算符 程序流程结构 学习内容 xff1a 1 初识C 43 43 一个简单的C 43 43 框架 xff0
  • 死锁形成的原因和四个必要条件

    死锁的概念 死锁是指两个或两个以上的进程 xff08 线程 xff09 在运行过程中因争夺资源而造成的一种僵局 xff0c 若无外力作用 xff0c 这些进程 xff08 线程 xff09 都将无法向前推进 xff0c 这时就形成了死锁 处
  • Android P阻止调用非sdk api后,Atlas该何去何从

    0 背景 自从Android 9 0后 xff0c Android就已经开始着手阻止app开发调用非sdk的api xff0c 也就是被标记为 64 hide的变量 函数 类不可以通过反射调用 xff0c 否则会提示NoSuchMethod
  • 简历应该这么写!

    很多同学刚开始找工作时 xff0c 投出去很多简历 xff0c 但是都石沉大海了 xff0c 没有后文 之所以简历不通过 xff0c 往往都是简历不够 好看 很多大公司HR经常一天要看几百份 xff0c 甚至上千份简历 xff0c 基本都是
  • 希望计算机专业同学都知道这些老师

    C语言教程 翁凯老师 赫斌 翁恺老师是土生土长的浙大码农 xff0c 从本科到博士都毕业于浙大计算机系 xff0c 后来留校教书 xff0c 一教就是20多年 翁恺老师的c语言课程非常好 xff0c 讲解特别有趣 xff0c 很适合初学者学
  • 100个python算法超详细讲解:抓交通肇事犯

    1 xff0e 问题描述 一辆卡车违反交通规则 xff0c 撞人后逃跑 现场有三人目 该事件 xff0c 但都 没有记住车号 xff0c 只记下了车号的一些特征 说 xff1a 牌照的前两位数字是相 同的 xff1b 乙说 xff1a 牌照
  • 100个python算法超详细讲解:百钱百鸡

    1 xff0e 问题描述 中国古代数学家张丘建在他的 算经 中提出了一个著名的 百钱 百鸡问题 xff1a 一只公鸡值五钱 xff0c 一只母鸡值三钱 xff0c 三只小鸡值一钱 xff0c 现 在要用百钱买百鸡 xff0c 请问公鸡 母鸡
  • 100个python算法超详细讲解:水仙花数

    1 xff0e 问题描述 输出所有的 水仙花数 所谓的 水仙花数 是指一个三位数 xff0c 其各位数字的立方 和等于该数本身 xff0c 例如 xff0c 153是 水仙花数 xff0c 因为153 61 1 3 43 1 3 43 3
  • 100个python算法超详细讲解:常胜将军

    100个python算法超详细讲解 64 谷歌学术 1 xff0e 问题描述 有火柴21根 xff0c 两人依次取 xff0c 每次每人只可取走1 xff5e 4根 xff0c 不能多取 xff0c 也不能不取 xff0c 谁取到最后一根火
  • 100个python算法超详细讲解:逆序输出数字

    100个python算法超详细讲解 64 谷哥技术 1 xff0e 问题描述 编程实现将输入的整数逆序输出 2 xff0e 问题分析 前面我们已经接触过很多的递归问题了 xff0c 这些递归问题可以简单 地分成两类 xff1a 一类可以归结
  • 100个python算法超详细讲解:角谷猜想

    1 xff0e 问题描述 角谷猜想在西方常被称为西拉古斯猜想 xff0c 据说这个问题首先是在 美国的西拉古斯大学被研究的 xff0c 而在东方 xff0c 这个问题则由将它带到日 本的日本数学家角谷静夫的名字来命名 xff0c 故被称为角
  • 100个python算法超详细讲解:统计学生成绩

    完整版下载 超详细Python算法案例讲解100例 zip Python文档类资源 CSDN下载 1 xff0e 问题描述 有5个学生 xff0c 每个学生有三门课程的成绩需要统计 要求从键盘输入学生的学号 姓名以及三门课程 的成绩 xff
  • apt update、apt upgrade 和 apt dist-upgrade 的区别

    1 root 64 kali apt update apt update 的作用是从 etc apt sources list文件中定义的源中获取的最新的软件包列表 即运行 apt update 并没有更新软件 xff0c 而是相当 win
  • C++服务器开发100个知识要点C++RAII惯用法

    最初的写法 在笔者刚学习服务器开发的时候 xff0c 公司给笔者安排了一个练习 xff1a 在 Windows 系统上写一个 C 43 43 程序 xff0c 用该程序实现一个简单的服务 xff0c 在客户端连接上来时 xff0c 给客户端
  • 人工智能知识全面讲解: 人脸识别技术

    早在40年前 xff0c 图像识别领域就有很多关于人脸识别的研究 但是在当时 xff0c 传统算法在普通图像识别中已经很难取得良好的识别效果 xff0c 更何况还要从人脸 中提取更加细微的特征 在很长一段时间里 xff0c 人脸识别主要存在