毕业论文

当前位置 /首页/学习经验/毕业论文/列表

逐步求精的分层眼镜检测算法

1.引言

逐步求精的分层眼镜检测算法

眼镜是人脸图像最常见的佩饰物,自动判断图像中的人脸是否佩戴眼镜,并能计算眼镜位置和形状的眼镜检测方法,对提高人脸识别算法性能,人脸对象媒体生成具有十分重要的影响。
  由于受眼镜形状的多样性、眼睛特征的显著性以及图像质量等因素的影响,鲁棒的眼镜检测仍然存在许多难点。早期的眼镜检测主要采用图像处理和模板匹配的方法:根据像素灰度值的不连续变化来检测眼镜的下边框和眼镜鼻梁;通过两眼之间区域的边缘信息来检测眼镜;使用三维Hough 变换方法检测眼镜。这类方法计算简单,但容易受到噪声干扰,检测准确率较低。小波特征也被用来进行眼镜检测,但该算法对初始人脸位置的要求很高。
  本文依据类 Haar 特征和级联AdaBoost 目标检测思想,从样本学习的分类规则出发,提出一种逐步求精的分层眼镜检测方法。本文首先定位具有显著特征的眼睛区域,从而圈定眼镜检测的背景区域,以鼻梁上方的镜架横梁区域作为检测目标,从而克服了眼镜形状的多样性难点。与传统的直接检测算法相比,本文提出的眼镜检测算法在检测精度上有大幅度的提高。


  2.分类问题的样本选择规则

目标检测判断某个检测窗口是否为检测目标,是一个分类问题,而眼镜检测就是两类分类问题。对分类问题来说,分类的复杂度取决于两个因素:来自同一类别的不同个体之间的特征值波动和属于不同类别样本特征值间的差异。说明正样本(检测目标)和负样本(检测背景)分布对分类器设计及性能的影响,当检测目标越复杂或者检测目标结构相对固定时,与检测背景的相似程度越低,正样本分布也越集中。相反,检测背景越单一,分布范围越小,负样本分布就相对比较集中。
  从上述规则可知,检测目标和检测背景对于目标检测性能影响很大,因此对检测目标及背景的选择可有效提高目标检测的准确率。
  眼镜检测的检测目标是眼镜,但由于眼镜的形状多样,镜框包括宽边、窄边甚至无框,而所有眼镜在鼻梁上方的镜架横梁区域特征比较一致,可选择该区域作为检测目标。
  选择眼睛作为检测背景,因为眼睛结构比眼镜结构复杂,定位眼睛要容易很多,而且根据眼睛位置确定检测目标,可以极大地缩小检测背景区域,提高眼镜检测精度。
  据此,一种逐步求精的眼镜检测方法的基本思想是:对一幅输入人脸图像,首先定位眼睛位置,估计眼镜检测的背景区域,然后用眼镜分类器进行眼镜检测。


  3.检测背景区域估计

依据眼睛位置估计眼镜检测的背景区域,既可以排除眼睛干扰又缩小了检测的背景区域。用左眼和右眼位置分别作为检测背景区域的左右边缘,由于眼镜镜框横梁位于鼻梁上方的区域与眼睛位置基本平齐,可以根据眼睛的上下坐标估计该区域的上下边缘,确定在该区域内检测是否佩戴眼镜,从而实现人脸图像的眼镜检测。以下将叙述眼睛定位和如何根据眼睛位置确定背景区域。
  人眼定位采用基于统计的眼睛定位算法。首先依据类Haar 特征和级联AdaBoost 目标检测算法,训练产生左眼、右眼和双眼三个分类器。利用训练好的分类器进行在线检测。
  检测过程如图2 所示,输入一幅通过人脸检测并且旋转归一化到正面的人脸图像,通过积分投影方法将左半边脸和右半边脸分开,分别用左眼和右眼分类器在对应区域进行检测,同时用双眼分类器在上半部分人脸进行检测,最后根据左眼、右眼和双眼检测结果确定眼睛的精确位置。
  由于三个分类器同时使用,使得检测结果具有互补性,同时训练样本包含了各种眼睛情况,眼睛定位结果对光照、姿态及眼睛闭合等具有很强的鲁棒性,检测正确率高。
  根据眼睛位置将左右眼位置作为背景区域的左右边缘,眼睛的上下坐标作为区域的上下边缘,估计出检测背景区域。