树人论文网一个专业的学术咨询网站!!!
树人论文网

深度稀疏自编码网络融合多LBP特征用于单样本人脸识别

来源: 树人论文网发表时间:2019-12-27
简要:摘 要:单样本人脸识别的关键在于充分挖掘单样本判别性信息,采用深度稀疏自编码网络与空频域多LBP特征融合进行特征提取。首先利用部分样本训练深度稀疏自编码网络,利用训练好

  摘 要:单样本人脸识别的关键在于充分挖掘单样本判别性信息,采用深度稀疏自编码网络与空频域多LBP特征融合进行特征提取。首先利用部分样本训练深度稀疏自编码网络,利用训练好的网络分别提取训练及测试集的特征;其次,利用二维离散小波变换将时域样本变换到频域,實现样本扩展,增加单样本信息并分别提取各域上的多LBP特征;最后利用协同表示对深度自编码网络及多LBP特征进行分类识别,融合识别结果获取最终分类结果。在AR及PIE数据库上的实验结果表明,该融合算法能提高样本判别性信息的提取,提高单样本人脸识别性能。

  关键词:稀疏自编码;单样本人脸识别;空-频特征;多特征融合;二维离散小波变换;数据库

物联网技术

  《物联网技术》杂志是目前国内第一本经国家新闻出版总署批准,手续齐全的物联网专业科技期刊。物联网是继计算机、互联网之后世界信息技术的第三次革命,据美国独立市场研究机构Forreter预测,物联网所带来的产业价值要比互联网大30倍,将形成下一个上万亿元规模的高科技市场。

  0 引 言

  人脸识别是计算机视觉和模式识别领域重要的研究课题,在生活中应用广泛,如视频监控[1]、门禁[2]、行人再识别[3]、视觉追踪[4]等。尽管目前已有的人脸识别算法在特定环境下性能较好,但在实际测试中人脸可能含有多重面部变化,例如光照、阴影、姿势、表情、遮挡、不对齐等[5],因此人脸识别仍是一项具有挑战性的任务。

  在许多实际应用场合中,每人仅有一个训练样本,例如ID卡认证、航空港监测等,导致在单样本识别中很难根据训练样本预测测试样本中可能出现的类内变化信息,因此单样本人脸识别仍是人脸识别中的难点。而传统的判别性子空间学习算法,例如线性判别分析(Linear Discriminant Analysis,LDA)[6]、基于Fisher的算法[7-8]在此种情况下会失效。基于表示的分类算法如稀疏表示(Sparse Representation-based Classifier,SRC)[9]和协同表示(Collaborative Representation-based Classifier,CRC)[10]要求每类用多个训练样本来有效表示测试样本,因此其在单样本识别中性能也会大幅下降。

  为处理单样本人脸识别,研究人员提出多种算法,这些算法大致可以分为两类[11],即全局算法和局部算法。全局算法[12-13]用整张人脸图像作为输入,其主要思想是扩大训练样本数以捕捉类内信息。文献[14]中有两个方向,分别为虚拟样本生成和通用学习。虚拟样本生成利用真实训练样本合成虚拟样本,例如SPCA[15]和SVD-LDA[16]基于奇异值分解(Singular Value Decomposition,SVD)生成虚拟样本。这些算法的主要缺点是虚拟样本往往与训练样本高度相关,因此很难作为独立的样本进行特征提取[14]。

  与基于虚拟样本算法不同,泛型学习方法通常会引入一个辅助泛型集,由不感兴趣的人员来补充原始的SSPP(Single Sample per Person,SSPP)图库集。Wang等人[17]假设不同的人之间共享相似的类内变化,据此利用泛型集估计类内散度。基于表示的算法包括扩展的SRC(ESRC)[12]、叠加SRC(SSRC)[18]、稀疏变化字典学习(SVDL)[13]、协同概率标签(CPL)[19]等。尽管这些算法可以在一定程度上提高单样本人脸识别算法的性能,但其性能仍严重依赖于巧妙的选取泛型集,理想的泛型集通常包括两个特点:需与训练样本有相似的拍摄场景;需包含足够的面部变化来预测测试样本中未知的变化。然而实际中很难收集到足够多的满足上述条件的泛型集。

  局部算法利用局部面部特征识别测试样本。通常生成局部特征的方法是将一张人脸样本分割成一些重叠或不重叠的图像块,因此该类型的局部算法通常被称作基于块的方法[20]。该类方法中每个被划分的块都被看作是这个人的独立样本,基于该假设,研究人员将传统的子空间学习和基于表示的分类算法(例如PCA,LDA,SRC,CRC)进行扩展得到对应基于块的算法,例如块PCA[21],块LDA[22],块SRC(PSRC)[9]和块CRC(PCRC)[20],整合每个块的识别结果,得到最终的单样本人脸识别结果。Lu等人[14]提出一种判别性多流行学习算法(DMMA),将人脸识别转换成域到域的匹配问题。基于这一工作,Yan等人[23]通过整合多个局部特征提出多特征多流形学习方法来提升人脸识别性能。Zhang等人[21]通过加入另一个基于稀疏图的Fisher准则修正了DMMA算法,并为被划分出来的块学习一个判别性子空间。

  最近,有研究人员尝试将泛型学习整合到基于块的方法中用于单样本人脸识别。例如,Zhu等人[24]从泛型集中提取块变化字典,然后将其与训练块字典串联来度量每个测试块的表示残差。这类算法与现有的基于块的表示方法相比可在单样本人脸识别中获得更好的性能,但理想的泛型集的获取仍是实际应用中的难题。

  本文将样本投影到频域空间以实现样本的扩充,同时采用通用训练集采集部分类内变化信息,减小类内变化导致的单样本识别率下降现象,最后将空频域的识别结果进行融合获得最终的识别结果并在数据集上验证。

  1 相关工作

  1.1 深度稀疏自编码网络

  SSAE是一种无监督特征学习算法,该算法采用层级训练方案构造深度网络,每一层包含两个部分,即编码器和解码器。编码器为一个函数,可将输入向量x映射到隐藏层表示a,即。解码器将隐藏层表示映射成一个重构向量y,即。其中W(1)和W(2)分别表示输入到隐藏层及隐藏层到输入的权重;b(1)和b(2)分别表示隐藏层单元和输出层单元的基;f(·)表示隐藏层单元的激活值,一般选用sigmoid函数;g(·)表示输出单元的激活值,一般设置为g(x)=x。对SSAE每层训练即最小化该层损失函数J:

  式中:x(i)表示第i个训练样本,同时也是期望输出;y(i)表示对应预测输出;m表示训练样本的个数;h表示隐藏层单元的个数。相对熵惩罚项是为了增强隐藏层的稀疏度,参数表示第j个隐藏单元在训练集上的平均激活度,而ρ表示稀疏度参数,其值接近0,采用反向传播算法进行训练。