有遮挡的人脸识别论文阅读整理

暂时决定先跑个RSC,后面需要改进时继续整理论文。


现有研究和背景

现有的用于解决部分遮挡的人脸识别的方法:

  1. 基于 KL(Karhunen Loeve ,KL)扩展的方法:这类方法对原始训练数据进行预处理,然后通过KL变换求得主成分作为分类的特征,最后用稀疏表示分类 (Sparse Representation Classification,SRC)进行分类。
    典型的方法包括:
    • RSC(Robust Sparse Coding)
    • LRMA(Low Rank Matrix Approximation)
    • SDR-SLR(Supervised Low Rank Dictionary Decomposition ,SDR-SLR)将训练数据分离成与身份有关信息、与身份无关信息以及噪声部分,能有效地提高有遮挡的人脸识别率。
      以上方法强调了在训练数据中结构不协调的重要性,即 尽可能地从独立的不同类中学习到变换矩阵。
  2. 基于模型的方法: 主要代表方法是基于 3D 模型的人脸识别,这类通过更多的摄像传感器获取人脸的三维模型来进行识别与认证,对于人脸的姿态、表情、 光照、 遮挡等变化都有非常稳健的性能。 Nese Alyuz提出了一种完全自动的三维 人脸识别系统,对遮挡的情况具有鲁棒性。它主要针对表面有遮挡的人脸识别和基于子空间分析技术引起的数据丢失进行分类,利用未被遮挡的部分进行训练,遮挡部分被剔除。在分类阶段采取掩蔽策略,是一种利用不完备数据进行子空间分析的 技术,进一步来说就是用局部处理的方法来改善全局的质量。
  3. 基于相关的方法: Felix Juefei-Xu 在文章[12]中提出了在表情、遮挡、 姿态变 化下的 3D
    人脸识别。文章[15]提出了一种新的几何框架,用螺旋弯曲的方法去对 比、匹配、
    平均化他们的形状并表示面部的表面,去创建一个黎曼结构,用于分析 面部表面的形状。 A. M.
    Ali[13]提出了一种在远距离框架下姿态不变的 3D 人脸识别 模型。能自动获取图形完成人脸识别。
  4. 基于模板的方法: JongJu 在文章[14]中提出了一种在遮挡下对面部特征检测
    和追踪的方法,初始化阶段、检测人脸、估计面部的姿态,根据检测出来的人脸, 初始化与姿态有关的特征集合;
    优化阶段将海森矩阵与轮廓梯度向量以及外观误 差联合起来更新参数集,进而获得面部的参数, 通过加入一个模板脸将特征检测延 伸到人脸追踪,
    使得在重度遮挡的情况下依然能实现更为精确的面部特征识别。
  5. 基于特征的方法: 字符串匹配是一种非常有力的部分匹配技术,但是并不
    适合正面的人脸识别,因为人脸包括连续和不连续的特征,需要利用全局序列来表 Weiping
    Chen[16]提出了一种使用全局字符串匹配的人脸识别方法,它利用非常
    紧凑的语法描述字符串去表示人脸,可以在两张不连续的字符串脸间完成匹配。因 为人脸字符串的相继顺序和方向都不变,
    这个潜在的性质使得算法在识别过程中 能够自动利用每一块没有被遮挡的区域,而不用去管形状是什么样。 这种方法在训
    练样本数量很少时同样有效。实验验证上述方法不仅在部分遮挡的人脸识别中有
    显著的性能,而且有能力将素描的人脸和相片里面的人脸进行匹配。另外一种是
    Lingfeng[17]提出来的流形正则化的局部稀疏表示方法(MRLSR), 该方法认为在稀 疏表示条件下所有的编码向量都是组稀疏的。具有个体稀疏和局部相似两条性质。 利用这些性质能有效地提升有部分遮挡情况下的人脸识别率。
  6. 基于神经网络的方法: 随着近几年深度学习研究的深入,基于神经网络的人脸识别研究也获得了许多进步,其中香港中文大学的汤晓鸥团队提出的基于深度学习[18-20]的人脸识别,利用卷积神经网络学习特征,刷新了人脸识别率的新高 峰。 DeepID特征可以从卷积神经网络的最后一个隐藏层提出来,在学习基于卷积 神经网络的分类器时,沿着特征提取的层次结构减少神经元的个数,这个卷积神经网络的顶层神经元个数会逐渐减少,最后只保留几个与身份相关的神经元。 Y. Sun[19]针对人脸识别中很难有效提取到能降低类内变化并增加类间变化的特征这个问 题,提出了 DeepID2 特征。实验证明使用DeepID2 特征能更加有效地提升识别率。 在文章[20]中提出了一种更高性能的卷积神经网络,通过增加隐藏表示的维数并在前面的卷积层加入监督,使得 DeepID2+获得更好的识别率, 实验证明了 DeepID2+ 对于遮挡情况也十分稳健。

现有数据库:

  1. AR 人脸图像数据库: 包含 126 个人的四千多张正面人脸图像,其中男性
    70 个,女性 56 个。每个人有 26 张人脸图像,其中包含了光照变化、表情变化、
    还有眼镜遮挡和围巾遮挡。该人脸数据库中的图像分别间隔了两周的时间采集:
    session1 和 session2,每个时间段每个人采集了 13 张。
  2. FERET 人脸图像数据库: 美国军方组织的 FERET 人脸识别算法测试[5],
    主要为了解决成像条件理想、用户配合、中小规模人脸数据库上的人脸识别问题。
    该数据库包含有 14,051 张人脸图像, 每张人脸图像有姿态和光照的变化,并且主
    要为白种人。
  3. Yale 人脸数据库: 包含有 15 个人的 165 张 GIF 格式的灰度图片, 其中每
    个人有 11 张人脸图像,包含了丰富的表情变化和光照变化, 比如:快乐、伤心、
    惊讶、正常、 困倦、眨眼、 左偏光、 中心光、右偏光等。
  4. Yale 人脸数据库 B: 在 576 个观察条件下(9 种不同姿态64 种光照条件)
    采集到的 10 个自愿者的 5760 张人脸图像, 即每个自愿者在每一种观察条件下采
    集到一张人脸图像。
  5. PIE 人脸数据库: 由 68 个人的的 41368 张人脸图像组成,其中每个人的人
    脸图像是在 13 种不同姿态、 43 种不同的光照、 4 种不同的表情条件下采集到的。
  6. SCface 人脸数据库: 由 130 个人的 4060 张静态人脸图像构成, 人脸图像
    是在室内用五架分辨率不一的摄像机采集的。 SCface 人脸数据库是开源的, 可以
    很方便的获取。
  7. LFW 人脸数据库: 该数据库由美国马萨诸塞大学阿姆斯特分校计算机视觉
    实验室整理完成,主要研究非受限情形下的人脸识别问题,现在已成为学术界乃至
    工业界评价识别性能的 benchmark。该数据库包含了 5749 个人的 13233 幅人脸图
    像,这些人脸图像主要是从互联网上收集的,反映了真实场景下的人脸图像,比如
    大的姿态变化、光照变化、表情变化、任意的遮挡等。

论文观点整理

有部分遮挡的人脸识别方法研究

因为人脸这边不做了,集中精力搞车牌,暂时不更新了。


Author: Ykk
Link: https://ykksmile.top/posts/9363/
Copyright Notice: All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.