胥淘
【摘 要】提出了一种基于改进LBP算子的人脸识别算法.局部二元模式(LBP)是一种灰度范围内的纹理描述方式,它从一种纹理局部近邻定义中衍生出来.然而,LBP算子本身还不够完善,在人脸识别的应用中还存在许多问题亟待解决.文章在此基础上,对其特征的组合方式等方面作了一些改进,并将改进后的LBP算子用于人脸识别.通过改进前后在YALE人脸库的实验比较,该方法在识别率上取得了较好的结果. 【期刊名称】《电脑与信息技术》 【年(卷),期】2010(018)006 【总页数】3页(P36-38)
【关键词】人脸识别;局部二值模式;特征提取 【作 者】胥淘
【作者单位】中南大学信息科学与工程学院,湖南,长沙,410083 【正文语种】中 文 【中图分类】TP391.4
在当今社会,身份确认具有十分重要的应用。近年来,人类的生物特征越来越广泛的应用于个人的身份鉴认,人类固有的生物特征主要有:DNA、指纹、虹膜、语音、步态、掌纹、人脸等。相比其他的生物特征识别方法,人脸识别具有以下强大优势:
(1)无需用户过多参与,非接触式采集,无侵犯性;
(2)对用户没有任何明显刺激,便于隐藏;
(3)设备成本低廉,主要是采用摄像头来搜集人脸。因此,人脸识别技术得到了越来越多人的关注和研究。但是,计算机人脸识别技术中的关键一步——特征提取却因为受光照、姿态、表情、服饰、年龄等诸多因素的影响,其鲁棒性还有待提高。
局部二元模式(Local binarypattern,LBP)型[1-2]本质上属于线性特征提取方法,它从一种纹理局部近邻定义中衍生出来,表现为灰度范围内的一种纹理描述方式,最初提出是为了辅助性地度量局部图像对比度。Ojala、Ahonen等人成功地将LBP作为人脸特征提取的方式[3-7],在自动人脸识别中取得了显著的效果。在该方法的研究基础之上,本文提出了一种改进其特征获取途径、描述方式和识别过程的LBP算法,改进的LBP算子具有以下几个特点: (1)图像数据来源广泛; (2)描述方法具体准确; (3)识别过程利用充分。
通过改进,使得提取的特征更有局部的判别分析能力,并且更适合于表情识别。 最初的LBP算子是由Ojala等人提出来的,它是一种描述纹理特征的强有力的方法。原始的LBP算子为图像的每个像素定义了一个以该像素为中心的3×3的窗口(纹理单元),然后以该中心像素的灰度值为闽值,对该窗口的其余8个像素进行二值化,然后根据像素的位置以及二值化的结果进行加权求和得到该像素的LBP值。图1为基本LBP算子的操作过程,图2为LBP算子对图像处理前后的对比图: 其中ji为中心像素的灰度值,jc为8个领域像素的灰度值,B(x)为二值化函数,定义如下:
每个像素LBP值的计算如式(1)所示:
得到LBP编码图后,接下来的工作是提取特征。一般是取一定大小的窗口,统计
窗口内部LBP编码得到LBP直方图,最终用来识别的特征就是整幅图的一定大小窗口条件下的联合直方图,如图3所示:
本文提出的第一个改进就是改变单张图像表达表情数据的情况,变成多张包含不同信息的图像表达表情,增加原始的表情数据。本文采用的工具是小波包。小波包分解的数据由以下公式决定:
当图像经过小波包分解后,产生了4幅图像:低频图像、横向高频图像、垂直高频图像和对角高频图像。它们分别包含了图像在不同频率上的信息,互不相关。只不过大小只有原来的四分之一,整体4幅图像数据量和原图像大小相同,如果就这样进行特征提取不符合增加数据量的初衷。所以,在分解的基础上,又将每一种频率的图像在其它频率图像为零的情况下进行重构,得到与原图像大小相同、表达信息完全不同的图像。
得到的4幅图像并不是单个使用,而是分别在计算出相应的LBP编码图像后将相应块数据进行叠加,叠加后的图像不仅依然保持了原图像的信息,而且在一些特征点位更加细化,比如嘴巴、眼睛等等。
得到重构后的4幅图像后,接下来提取相应的LBP特征。在计算LBP图像时,本文采用的是“统一模式”编码,具体参数为P=8,R=2,且窗口的重叠度为1。所提算法主要改进是在LBP直方图的构成过程中。在经典的LBP算法中,直方图是通过计算一定大小窗口内的LBP值得出,通常情况计算LBP直方图的窗口是计算LBP编码窗口的10倍左右,以保证一定的统计意义。也就是说将原图像分为几个大块,计算各块中的LBP直方图,然后将每块的直方图进行串联得到最终的图像特征,如图3所示。本文中图像分为2q个块,其中q是合并图像块的层数,本文取4。先逐个计算每个小块中的直方图,然后合并一些小块,再计算大块中的直方图数据。如此下去,直到最后计算的是整个图像的直方图特征,这样通过将所得到的所有直方图特征进行串联得到整个图像的待识别特征,如图4所示。从以上
的特征提取过程可知,本文提取的特征不仅包含了局部的纹理信息,而且还包含了整体的纹理信息,一定程度上增加了特征的判别分析性能。
根据各种频率图像的LBP编码图和它们混合的编码图,可以发现在每种频率的LBP编码图像中,那些有表情细节地方的LBP码值较小,没有表情或者是不表达表情的地方LBP码值较大而且较平稳,所以采用LBP码值作为权值参数一方面能够充分吻合纹理细节,另一方面还可以根据图像的质量自动调节,真正做到了自适应的要求。本文是将所有表情图像相叠加得到一个平均人脸表情模板,然后再将这个模板按照提取LBP直方图特征同样的方式进行分块,计算每块中相应LBP编码值,最后将得到的数值倒数作为最终的权值。
本节将通过实验来验证改进LBP算子的有效性和鲁棒性。在实验中,我们采用的是Yale人脸库,包含有15个人一共165幅人脸的正面图像,每个人包括喜悦、忧愁、惊奇、困惑、眨眼等不同表情和不同光照的11幅图像。同时为了减少图像中由于灰度大小、人脸位置、人脸大小等因素的影响,先对图像进行归一化,使得归一化后的图像具有相同的大小、灰度均值和方差,更重要的使所有图像的主要关键点(双眼和嘴巴)在同一个位置。结果如图5所示,图中,将本文中提出的算法和经典的LBP算法相比较。
可以看出本文的一系列改进能够提高LBP编码特征的识别率,除了“惊奇”的表情外,其它所有的表情都被更准确地识别,具体原因作者认为数据库中很多人“惊奇”得不够,很容易被识别成“中性”表情。但是就总的识别率而言,本文的算法依然要好于经典的算法,将近提高了2个百分点。
本文提出一种基于改进LBP的人脸识别算法。该算法首先将原图像经过小波包分解并在其它频率图像为零的情况下重构,得到了4幅与原图像大小相等的不同频率图像;然后将图像由粗到精的方式分为多个LBP直方图块,采用级联的策略串联每个块中的LBP直方图;最后通过分析LBP图像的特征,提出了一种合理的定
权策略,使得各种特征的组合一方面符合图像本身的信息特征,另一方面达到了一定的自适应要求。通过和经典LBP算法的对比,可以看出本文提出的这些改进确实提高了原算法鲁棒性和识别率。
【相关文献】
[1]LBP
methodology[EB/OL].http://www.ee.oulu.fi/research/imag/texture/lbp/about/Texture%20Analysis%20with%20Local%20Binary%20 Patterns.pdfument.
[2]T.Ojala,M.Pietikainen,and T.Maenpaa,Multiresolution Gray-scale and Rotation Invariant Texture Classification with Local Binary Patterns[J].IEEE Transactions on Pattern Analysis and Machine Intelligence.24(7):971-987,2002.
[3]Hadid A,,Pietikainen M&Ahonen T.,A Discriminative Feature Space for Detecting and Recognizing Faces[C].Proceedings of the 2004 IEEE Computer Societyon Computer Visionand Pattern Recognition(CVPR’04).
[4]TimoAhonen,Abdenour Hadid,and Matti Pietikainen,Face Recognition with Local Binary Patterns[J].ECCV2004,LNCS3021,pp.469-481,2004.
[5]Timo Ahonen,Matti Pietikainen,Abdenour Hadid et al.,Face Recognition Basedon the Appearance of LocalRegions[C].Proceedings of the17th International Conferenceon Pattern Recognition(ICPR’04).1051-4651/04.
[6]OlliLahdenoja,Mika Laiho,and Ari Paasio,Reducing The Feature Vector Length In Local BinaryPattern Based Face Recognition[C].IEEE International Conference on Image Processing(ICIP 2005),Genoa,Italy,2:914-917.
[7]Jiali Zhao,Haitao Wang,Haibing Ren et al.,LBP Discriminant Analysis for Face Verification[C].Proceedings of the 2005 Computer Society Conference on Computer Vision and Pattern Recognition(CVPR’05).1063-6919/05.
因篇幅问题不能全部显示,请点此查看更多更全内容