全国咨询热线18910108617
  • 消耗需求将促使伸缩门行业更加完美和成熟
  • 北京电动伸缩门小知识
  • 北京电动伸缩门的选购切忌贪小便宜
当前位置:北京永昌城科技有限公司 >> 新闻动态 >> 行业动态 >> 浏览文章
行业动态

人脸识别发展脉络

标签:识别,发展,脉络 时间:2019年05月16日 阅读95
人脸识别发展脉络 主动人脸识别的经典流程分为三个步骤:人脸检测、面部特性点定位(又称Face Alignment人脸对齐)、特性提取与分类器设计。一样平常而言,狭义的人脸识别指的是"特性提取+分类器"两部分的算法研究。

在深度学习出现曩昔,人脸识别方法一样平常分为高维人工特性提取(例如:LBP, Gabor等)和降维两个步骤,代表性的降维方法有PCA, LDA等子空间学习方法和LPP等流行学习方法。在深度学习方法流行之后,代表性方法为从原始的图像空间直接学习判别性的人脸透露表现。
  人脸识别发展脉络  一样平常而言,人脸识别的研究历史可以分为三个阶段。在第一阶段(1950s-1980s),人脸识别被当作一个一样平常性的模式识别题目,主流技术基于人脸的几何结构特性。在第二阶段(1990s)人脸识别敏捷发展,出现了许多经典的方法,例如Eigen Face, Fisher Face和弹性图匹配,此时主流的技术路线为人脸表观建模。在第三阶段(1990s末期到如今),人脸识别的研究赓续深入,研究者开始关注面向真实条件的人脸识别题目,重要包括以下四个方面的研究:1)提出不同的人脸空间模型,包括以线性判别分析为代表的线性建模方法,以Kernel方法为代表的非线性建模方法和基于3D信息的3D人脸识别方法。2)深入分析和研究影响人脸识别的因素,包括光照不变人脸识别、姿态不变人脸识别和表情不变人脸识别等。3)行使新的特性透露表现,包括局部描述子(Gabor Face, LBP Face等)和深度学习方法。4)行使新的数据源,例如基于视频的人脸识别和基于素描、近红外图像的人脸识别。     人脸识别发展脉络        2007年以来,LFW数据库成为事实上的真实条件下的人脸识别题目的测试基准。LFW数据集包括来源于因特网的5,749人的13,233张人脸图像,其中有1680人有两张或以上的图像。LFW的标准测试协议包括6000对人脸的十折确认义务,每折包括300对正例和300对反例,采用十折平均精度作为性能评价指标。 人脸识别发展脉络 自从LFW发布以来,性能被赓续刷新。2013年之前,重要技术路线为人造或基于学习的局部描述子+测度学习。2014年之后,重要技术路线为深度学习。        人脸识别发展脉络   2014年以来,深度学习+大数据(海量的有标注人脸数据)成为人脸识别领域的主流技术路线,其中两个紧张的趋势为:1)网络变大变深(VGGFace16层,FaceNet22层)。2)数据量赓续增大(DeepFace 400万,FaceNet2亿),大数据成为提拔人脸识别性能的关键。      人脸识别发展脉络  在前DL时代,以VIPL实验室三代半SDK为例,关键技术点包括1)分块人脸特性融合:Gabor特性+LPQ特性。 2)子空间学习进行特性降(PCA+LDA)。3)融合多尺度的人脸归一化模板。SDK3.5的相干技术在FRGC实验4上取得了0.1%错误接受率条件下96%的确认率,至今依然是FRGC数据集上最好效果。 人脸识别发展脉络 必要指出的是,虽然深度学习强调特性学习搬家公司北京,但学习特性并不是DL的专利。在前DL时代北京发光字制作,行使浅层模型从图像中直接学习透露表现和基于人造描述子学习语义透露表现(例如学习中层属性透露表现的Attributes and Simile Classifier和学习高层语义透露表现的Tom-vs-Pete)的工作都见于相干文献。  人脸识别发展脉络 2014年,Facebook发表于CVPR14的工作DeepFace将大数据(400万人脸数据)与深度卷积网络相结合,在LFW数据集上逼近了人类的识别精度。其中DeepFace还引入了一个Local Connected卷积结构西安人事考试网站,在每个空间位置学习单独的卷积核,瑕玷是会导致参数膨胀搜索引擎排名,这个结构后来并没有流行起来。     人脸识别发展脉络    DeepID家族可以看作是DL时代人脸识别领域的一组代表性工作。最早的DeepID网络包括四个卷积层,采用softmax损失函数。DeepID2在DeepID网络的基础上,同时考虑了分类损失(identity loss) 和确认损失(verification loss), 这两种损失在Caffe深度学习框架中分别可以采用softmaxwithloss层和contrastive loss层来实现。DeepID2+网络则是在DeepID2的基础上,增长了每一层的辅助损失函数(类似Deep Supervised Network)。     人脸识别发展脉络
Google发表于CVPR2015的工作FaceNet采用了22层的深层卷积网络和海量的人脸数据(800万人的2亿张图像)以及常用于图像检索义务的Triplet Loss损失函数。值得一提的是,因为人脸类别数达到800万类,假如使用softmax loss,输出层节点将达到800万个,必要至少32GB显存(假设上一个隐层节点1024个,采用单精度浮点数),而Triplet Loss则不必要额外占用显存。FaceNet在LFW数据集上十折平均精度达到99.63%,这也是迄今为止正式发表的论文中的最好效果,几乎宣告了LFW上从2008年到2015年长达8年之久的性能竞赛的结束。

作者:北京电动门智控