设为首页
加入收藏
联系我们
公告:欢迎光临范文论文吧、如果您喜欢本站,请您多多向您的朋友推荐,相信有您的支持我们会做得更好! 今天是
您当前位置: 范文论文吧 >> 免费论文 >> 计算机论文 >> 当前信息
站内搜索

栏目导航
计算机论文 电子商务论文
法律论文 经济论文
会计论文 金融论文
教育论文 工商管理论文
行政管理论文 企业管理论文
酒店管理论文 工程造价论文
桥梁建筑论文 国际贸易论文
商场营销论文 医学论文
药学论文 经济学论文
质量管理论文 物流管理论文
成本管理论文 工资管理论文
薪酬管理论文 德育论文
师德论文 英语论文
物理论文 化学论文
语文论文 数学论文
政治论文 地理论文
历史论文 科技论文
毕业论文写作 毕业论文范文
毕业论文格式 教学论文
相关文章
热门文章

人脸检测中的眼睛定位算法研究

作者:计算机应用论文_计算机论文_工学论文  来源:范文论文吧  发布时间:2008-5-6 13:02:29  发布人:admin

减小字体增大字体

摘  要  眼睛是一个在人脸检测中极为重要的人脸特征,因此一种快速可靠的精确定位眼睛的算法对许多实际的研究各种算法来实现眼睛定位,主要可以分为以下几类:霍夫变换法、变形模板法、边缘特征分析法和对称变换法等,本文结合人脸的肤色和几何特征以及人眼的灰度信息提出了一种快速、稳定的人眼定位算法。

2  常用的几种眼睛定位算法

     (1) 霍夫变换法
     假设经预处理已经得到包含眼球的图像Ep,为了节省检测眼球的时间并避免镜片反光点边缘产生的干扰,先用小灰度聚类法粗定眼球中心点,以此缩小检测范围,聚类的过程是将图像Ep中灰度值最小的n个像素,按列递增的顺序排序,若相邻的列数差值都未超过预先设定的门限T1,说明只有一个聚类中心,求出这些像素行列的平均值就是要找的眼球中心点;若超过了门限T1,说明这n个像素可以聚成两类,对左眼,因为阴影、镜脚集中在左边,所以取右边那类的平均值;对右眼,则取左边那类的平均值;n的选择可根据图像Ep的总像素数目及眼球占图像的大致百分比决定。
    在用霍夫变换检测眼球前,先用Canny算法提取边缘。对于比较细长的眼睛,由于眼球的上半部分较多地被眼皮覆盖,所以改用检测下半圆,这样更可靠且省时。设图像空间为(i,j),i和j分别表示行和列,三维变换空间为(ie,je,R),其中ie、je分别代表眼球圆心的行和列,R为半径。下半圆表达式为:
                          (1)
       对于变换空间的每一个坐标点(ie,je,R),在图像空间都对应一个半圆,在这个半圆上存在的边缘点数就是变换空间上坐标点(ie,je,R)对应的值。变换空间上的峰值点坐标即为所求的眼球半圆参数。实验证明,霍夫变换确实具有抗干扰能力强的优点。当眼球与眼白的对比度较低时,提取出来的边缘是断裂或不很规则的,即使如此,仍能根据变换空间中的峰值点准确地定位眼球圆心[2]。
    (2) 变形模板法
    模板匹配法主要是模板的选择,根据所选模板的维数可分为二维可变形模板和三维可变形模板。图1为二维简单眼睛模板,由于人脸的旋转角度是任意的,当旋转角度比较大时,其中一部分眼白就会看不见,所以为了适应人脸向两侧作较大角度的旋转,就增加了两个单眼白的简单眼睛模板,当垂直旋转角度大于30°时,就使用仅有左眼白的简单眼睛模板,如图1 a所示,当旋转角度大于-30°时,就使用仅有右眼白的简单眼睛模板,如图1 b所示,若旋转角度介于-30°和30°之间,就使用正常的双眼白简单眼睛模板,如图1 c所示。

 

图1 眼睛的变形模板
    简单二维眼睛模板可以用如下数学形式表示:
               (2)
     在进行眼睛定位时,不断改变简单眼睛模板的尺寸参数S和眼球中心位置参数(x,y),当模板与人脸图像取得最佳匹配时的对应的尺度S就是眼睛的大小,中心位置(x,y)就是眼睛在人脸图像中的位置。匹配时采用的能量函数与三维可变形模板中的能量函数类似。
     三维可变形眼睛模板的生成源于人脸合成时用到的一般三维人脸模型。在一般三维人脸模型中,把眼睛特征点分截取出来,作为可变形眼睛模板的基本点。三维可变形眼睛模板是由10个基本三维点构成的,如图2所示,其中外部8个点组成了上、下眼睑,内部2个点,决定眼球的所有边界,其余的眼睑三维点是由外部8个基本点线性插值得来的,而眼球上的三维点是通过内部2点构成的空间来定的。

 
图2  三维眼睛模板
    三维可变形眼睛模板可以用以下的数学形式来表示:
      
                    (3)
    其中,参数X=(x1,x2,x3…,y1,y2,y3,…,z1,z2,z3,…)是由10个三维基本点的坐标组成,S表示三维可变形眼睛模板的尺度大小,θ 表示眼睛模板的垂直旋转角度, 表示眼球的中心,也是整个三维眼睛模板的中心坐标。眼睛模板的可变形性就体现在不仅模型的尺度S、角度θ和眼球的中心是可变化的,而且眼睛模板的形状参数X也是可变化的。当所有参数都进行变化时,将产生各种各样的三维眼睛模板。在模板匹配时,需要把这些三维模板影射成如图3所示的二维眼睛映射模板,然后针对这些二维眼睛模板定义相应的能量函数,用最小值搜索算法求得最佳匹配。此时所对应的眼睛模板坐标就是需要求的眼球中心。
 
图.3  三维眼睛模型在不同旋转角度下的二维映射
    (3 )边缘特征分析法
    此算法所处理的图像为单人灰度图像,是利用图像的垂直灰度投影曲线,根据凸峰宽度确定人脸的左右边界,然后利用人脸区域的水平灰度投影曲线确定头顶及鼻子中部形成的上下边界。利用预测法先确定人眼在眉眼区域的大概位置,通过检测眉眼部位的边缘及边缘分组,确定双眼的坐标位置。
观察不同单人脸图像的垂直灰度投影曲线,可以发现人脸所在区域将使垂直灰度投影曲线形成一个具有一定宽度的凸峰。这个凸峰的左右边界大致代表了人脸的左右边界。当人脸的左右边界确定之后,取左右边界之间的人脸区域作为研究对象,作该图像的水平灰度投影曲线,观察人脸区域图像的水平投影曲线可以发现,此曲线的第一个极小值点对应人的头顶,因为头发的低灰度产生了水平投影曲线的低谷,而曲线的最大值点和次最大值点分别对应人的额头部位和人的鼻中部,这样就可以轻易地求得人眼所处的大致水平位置(如图4所示)。                                                         
    在边缘检测前先对眉眼区域进行去噪、增强处理,使图像平滑,这是保证下面边缘检测获得较好效果的关键步骤。然后用Canny算子求出眉眼区域的边缘图像[4],求解时阈值取得较高,使得边缘点仅由眉毛和眼睛的强边缘以及瞳孔产生的强边缘组成,而不会包含由鼻子的轮廓产生的弱边缘。随后将边缘点进行分组,可以得到几组分离的边缘,其中位于下面的两组分别为左右两眼产生的边缘,取这两个边缘组的中心作为人眼的中心。边缘分组算法中,将分别包含每个边缘分组的最小矩形作为人眼检出,最先检出的两个分组分别对应左眼和右眼。当出现两个分组后算法立即结束,提高了执行效率。  
 

(a) 原图像
 
 

(b) 在水平方向上的投影

   (c) 在垂直方向上的投影
图4 水平方向和垂直方向的投影结果示意图
  该算法的优势在于首先通过灰度投影曲线确定眉眼区域,使数据量大大减少,然后在有效的边缘检测之后,使用了高效的边缘分组策略,在保证正确率的基础上,提高了算法速度。此算法的定位错误出现在头部倾斜度过大,以及侧光太强,还有头部在图像中所占区域过小的情况。
  (4) 对称变换法
  在计算机视觉研究中,对称性被认为是物体的基本性质之一,通常在将物体从背景中分割出来后,用来简化物体形状的描述,或物体的近似。目前研究最多的是点对称(也叫中心对称)和轴对称,对人脸而言,眼睛、鼻子、嘴巴等都有很弱的点对称性,广义对称变换正是用来描述物体的点对称。文献[3] 利用广义对称变换定位人眼进而提取脸部特征,文献[4]在广义对称变换的基础上,定义了一种方向对称变换DST(Directional Symmetry Transform),用于人眼的精确定位。以上的对称变换利用了人眼的中心强对称和脸部特征的生理几何分布,对人脸偏转、脸部表情变化、光照变化等因素的左右不敏感,因而具有很好的鲁棒性。但是,以上对称变换的计算需要在大范围的尺度上进行,计算量很大,而且,由于只是描述了各点的局部对称性,当它用于人眼的定位时产生的候选点较多,不太利于眼睛的精确定位。
  结合广义对称变化和方向对称变换的优点,于是有了一种新的对称变换——离散对称变换,它不仅具有广义对称变换描述物体对称性大小的特点,而且通过对各点领域的考察,去除那些处于规则区域外的点,可大大降低计算量,实现眼睛定位的快速算法。广义对称变换把图像中的所有像素点同等对待,每个像素点都计算其对称值。事实上,在图像中物体的单一背景区域中,大面积的灰度均匀区域上的像素点在一定的尺度范围内不具有明显意义的对称性,所以就不必计算它的对称值,而这样的像素点在人脸图像中占了很大一部分,如头发、脸部除眼、嘴等特征区域之外的区域及部分身体区域。眼、嘴、鼻子等特征区域在大于其轮廓的范围内灰度有变化,这样的区域我们把它称为灰度不均匀区。离散对称变换以减少计算量为出发点,在计算对称之前加入一个对图像灰度不均匀区域的检测步骤以减少计算量,然后定义了一个与广义对称变化相似的对称算子来计算点对称。
  离散对称变换实际上可看成一种非线形滤波,由于对每个像素点都进行相同的领域处理,适合于并行处理,在定位圆形物体圆心时,算子领域采用圆环。通过图像的离散对称变换后,眼睛中心点附近像素的对称值一般都处在对称值最大的前四、五位,对具有强对称值的候选点,采用两条简单的规则进行筛选。规则(1):邻近像素合并,一般选取对称值内最大的前10位候选点,将其中位置相邻的候选点合并到它们中对称值最大的像素处;规则(2):几何约束判别,对经过规则(1)筛选后的候选点,利用眼在脸部的几何分布性质进一步筛选,取基本符合眼睛分布规律的两点作为最终的定位双眼结果。

3 基于肤色、几何特征和灰度信息的人眼定位

  根据人眼灰度变化非常明显这一显著特点,本文提出的基于肤色、几何特征和灰度信息的人眼定位算法主要由以下几步组成。
  (1) 肤色提取
  肤色是人脸的重要信息,不依赖于面部的细节特征,对于旋转、表情等变化情况都能适用,具有相对的稳定性并且和大多数背景物体的颜色相区别。Anil K.Jain曾专门统计研究了皮肤的色彩模型,他提出的方法属于色彩空间中的聚类模型,这一类肤色模型的建立要选取一种合适的色彩空间。文献
转贴于 范文论文吧 http://www.fwlw8.com

[1] [2]  下一页

         
∷相关范文评论∷    (评论内容只代表网友观点,与本站立场无关!) [更多评论...]
搜索关键词:范文、论文、小说、手机、总结、报告、演讲稿、发言稿、试题、试卷、高考、英语、大学英语三级成绩查询、大学英语四级成绩查询、大学英语六级成绩查询、计算机等级考试、计算机3级成绩查询、计算机4级成绩查询、大学招生、研究生招生、招生信息、招生政策、创业贷款、情书范文、祝福短信、搞笑短信、自我介绍、自我评价等!
免责声明
1、本站部分内容是转载自其它站点或其它媒体,其版权归原文作者、版权声明者、或原文存放站点所有,如果需要转载或引用,请注明原文出处及连接。
2、本站的所有内容不得用于商业目的,使用者应对其行为承担一切后果,本站不负任何责任。
3、如果本站有涉及您版权的内容请点此[告知我们], 我们会尽快作出相处理。

Copyright © 2006- 范文论文吧 All Rights Reserved
本站部分资源出自其他站点或媒体、版权归原创作者所有、本站仅作学习参考、如有涉及您版权的内容请[来信告知]
营业证号: 黔ICP备06004583号