直方图均衡化的基本原理范例6篇

前言:中文期刊网精心挑选了直方图均衡化的基本原理范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

直方图均衡化的基本原理

直方图均衡化的基本原理范文1

关键词:数字图像处理;图像增强;直方图均衡化;规定化; MATLAB

中图分类号:TP391.4 文献标识码:A文章编号:1009-3044(2007)16-31106-02

On Histograms Processing of Image Enhancement and Its Realization with MATLAB

WANG Hong-lan,ZHANG Ruo-Gang

(Hunan Weaponry Industrial Staff University,Xiang Tan 411207,China)

Abstract:Image Enhancement is an important branch of image processing, it can improve availably whole or partial characters of image; Histogram is the most important one of the basic concept for image processing, it can effectively be used for image enhancement. This article mainly introduces two kinds of algorithm-histogram equalization and histogram specifications, gives relative logic formula and methodology; In addition to the use MATLAB to be realized, given the standard digital images in various pre-processing and post-processing images contrast, the specific algorithm, the experimental results and histogram. The result shows: histogram equalization and specifications can improve the contrast and effect. With algorithm of histogram equalization and specifications, intensive gray distribution of the original image has become more sparse, so the image processing visual effects and its contrast can be improved.

Key words:Digital image processing;Image enhancement;histogram;equalization;specification;MATLAB

1 引言

为了改善视觉效果或者便于人和机器对图像的理解和分析,根据图像的特点或存在的问题采取的改善方法或者加强特征的措施称为图象处理。在图像形成、传输或变换的过程中,由于受到一些客观因素的影响,获取和传输图像的过程中往往会发生图像失真,所得到的图像和原始图像有某种程序的差别,如图像颜色变淡、图像对比度降低、图像模糊等等。因此,要改善这种情况,必须要采取一定的手段。而图像增强技术正是在这种情况下所提出的。

增强的首要目标就是处理图像,使其比原始图像更适合于特定应用,换句话说,图像增强目的就是为了改善图像的的质量。图像增强的通用理论是不存在的。当图像为视觉解释而进行处理时,由观察者最后判断特定方法的效果。图像增强的方法主要分为两类:空间域增强法和频域增强法。“频域”处理技术是以修改图像的傅氏变换为基础的;空间域增强法是以对图像的像素直接处理为基础的,它属于直接增强的方法。空间域法包括基本灰度变换、直方图处理、消除噪声的平滑法和增强边缘的锐化法。本文要讨论的直方图增强方法属于空间域增强法。

2 直方图处理

2.1 直方图基本原理

灰度级为[0,L-1]范围的数字图像的直方图是离散函数h(rk)=nk,这里rk是第k级灰度,nk是图像中灰度级为rk的像素个数。经常以图像中像素的总数(用n表示)来除它的每一个值得到归一化的直方图。因此,一个归一化的直方图由P(rk)=nk/n给出,这里k=0,1,...,L-1。简单地说,Pr(rk)给出了灰度级为rk发生的概率估计值。注意,一个归一化的直方图其所有部分之和应等于1。直方图增强技术正是利用修改给定图像直方图的方法来增强图像的,最后得到的图像增强程度取决于我们所采用的直方图。

2.2 直方图均衡化

让变量r和s分别代表图像增强前后的像素灰度级,相应灰度级分布的概率密度分别为Pr(r)、Ps(s)。为讨论方便,假设像素灰度值已经归一化在区间[0,1],在灰度级坐标中r=0表示黑,r=1表示白。对区间[0,1]内任一个r值按变换函数:

S=T(r)(1)

进行变换,T(r)满足两个条件:

(1)T(r)在区间0≤r≤1中为单值单调增加函数;

(2)当0≤r≤1时, 0≤r≤1。

条件(1)使灰度级保持从黑到白的次序,条件(2)保证输出灰度级与输入灰度级有同样的范围。从s到r的反变换为:

r=T-1(s),0≤s≤1 (2)

同样,规定变量s也满足条件(1)和(2)。由概率理论知,若

Pr(r)和变换函数s=T(r)已知,T-1(s)是单值单调增加函数,则有:

直方图增强技术就是通过变换函数T(r)控制图像灰度级的概率密度函数而改变图像的外貌。

对于连续图像,变换函数为:

这说明,在变换后变量s在定义域内,Ps(s)是均匀概率密度。在图像增强意义上,这相当于像素的动态范围增加。在后面的MATLAB仿真时,便可以看到图像对比度会产生显著的变化。

对于离散图像,灰度级rk的概率值为:

其中,n表示图像中像素的总数,nk是在图像中出现这种灰度级的次数,L表示灰度级的数目,Pr(rk)为第k级灰度级的概率。与连续图像的(4)式相对应,离散形式为:

反变换为:

rk=T-1(sk),0≤sk≤1(9)

可见,能够直接利用式(8)从所给的图像计算变换函数T(rk)。

2.3 直方图规定化

直方图均衡化能自动地确定变换函数,该函数寻求产生有均匀直方图的输出图像。当需要自动增强时,这是一个好办法,因为由这种技术提到的结果可预知,并且操作简单。有时可以指定希望处理的图像所具有的直方图形状。这种用于产生处理后有特殊直方图的图像的方法,叫做直方图匹配或直方图规定化,可以说,直方图规定化是对直方图均衡化方法的改进。令Pr(r)和Pz(z)分别表示原始和希望的图像概率密度函数,同时利用式(4)直方图均衡化,则:

由式(4)均衡化处理产生最后的结果Ps(s)=1与积分内的概率密度无关,因此,处理后的原图像及理想图像的概率密度Ps(s)和Pv(v)具有相同的均匀密度。这样,可以从原始图像中得到的均匀灰度s代替逆过程中的v,其结果灰度级z=G-1(s)就是所要求的概率密度函数。上述过程即为:

(1)将原始图像的灰度级均衡化。

(2)对目标图像规定希望的概率密度函数,并用式(11)得到变换函数G(z)。

(3)计算目标图像的逆变换函数z=G-1(v),便得到了所希望的灰度级。

由以上讨论可以得到:

z=G-1[T(r)] (13)

对离散图像,相应的规定化表达式为:

以上各式表明,一幅图像决定出T(r)与反变换函数z=G-1(v)便可以进行直方图规定化,但在实践中得到T(r)和G-1却不大可能。幸运的是,在离散情况下,这一问题在相当大的程度上被简化了。总的来说,并没有规定化直方图的规定,对于任何一个给定的增强任务都必须借助于实际分析,下面我们来看一下采用MATLAB语言实现的对比效果。(可通过图3、图4看出对比效果)

3 MATLAB实现及结果分析

3.1 MATLAB中直方图均衡化及规定化函数

在MATLAB中实现结果所涉及到的直方图均衡化和规定化处理函数:

(1)I=imread(‘图像名称’)%读取图像

(2)imshow(I) %显示图像

(3)imhist(I) %显示出图像的直方图

(4)J=histeq(I) %对图像进行均衡化

(5)subplot(m,n,p) %显示m行n列个图像,在第p个区域内显示图像

(6)figure%创建一个新窗口,避免直方图覆盖原来数组显示的结果

(7)J=histeq(I,hgram)

J=histeq(I,n)

[K,T]=histeq(I,……)

%返回图像I的每个灰度上的像素点数目,均衡化后返回各灰度值

3.2实例:直方图均衡化及规定化处理

(1)首先显示原图像及直方图,代码及效果图如图1所示:

I=imread(‘girl.tif’); %读入图像

Subplot(1,2,1);imshow(I); title(‘原始图像’);

%显示原图像与标题

Subplot(1,2,2),imhist(I); title(‘原始图像直方图’); %显示原始图像直方图及标题

图1 原始图像及其直方图

图2 均衡化后的图像及其直方图

(2)进行均衡化处理,代码及效果图如图2所示:

J=histeq(I);

%均衡化处理图像

Subplot(1,2,1); imshow(J);title(‘均衡化后图像’)

%显示均衡化后的图像及标题

Subplot(1,2,2);imhist(J); title(‘均衡化后直方图’)

%显示均衡化后的图像直方图及标题

(3)获得均衡化后的像素点及显示要规定化的图像,代码及效果图如图3所示:

[counts,x]=imhist(J);

%获得均衡化处理后直方图各像素点灰度级以便后面图像规定化

%直方图规定化处理

K=imread(‘cell.bmp’);

Subplot(1,2,1);imshow(K);title(‘要规定化的图像’);

%显示要规定化的图像及标题

Subplot(1,2,2);imhist(K);Title(‘要规定化图像直方图’);

%显示要规定化的图像直方图及标题

(4)进行规定化处理,代码及效果图如图4所示:

L=histeq(K,counts); %规定化处理

Subplot(1,2,1);imshow(L);title(‘规定化后的图像’);%显示规定化后图像及标题

Subplot(1,2,2);imhist(L);title(‘规定化后的图像直方图’);%显示规定化后的图像直方图及标题

图3 要规定化的图像及直方图

图4 规定化后的图像及其直方图

从上述实例及效果图中可以看出,原始图像较暗且灰度级变化范围小;图1是原始图像及其直方图;图2是对原始图像均衡化处理后的结果,可以看到处理后图像亮度值出现的频数趋于平衡,灰度的动态范围和对比度差都得到了增强;图3(血细胞图像)为需要规定化处理的图像及其直方图;图4是采用直方图规定化处理后的结果,可以看到规定化处理是将原来较暗区域的一些细节得到增强,从而使图像更加清晰明了。

4 结束语

本文从理论上介绍了直方图处理中常用的直方图的均衡化及规定化方法。通过MATLAB程序算法实现了上述图像增强过程,并给出了处理前后的图像效果图。

实验表明,采用直方图处理技术对图像增强有着良好的处理效果,它可以应用到各个领域,如医学、电子航天等各方面。应该指出的是,图像增强的通用理论是不存在的,它是由观察者最后判断特定方法的结果。本文给出的程序代码在MATLAB中编译通过。

参考文献:

[1]Rafael C.Gonzalez,Richard E.Woods 著.阮秋琦,阮宇智 等译. Digital Image Processing (Second Edition).数字图像处理(第二版)[M]. 电子工业出版社,2005.

[2]张志涌.精通MATLAB6.5版[M]. 北京航空航天大学出版社,2003.

[3]汪志云,黄梦为.基本直方图的图像增强及其MATLAB实现[J].计算机工程与科学,2006,28(2):54-56.

[4]徐飞,施晓红.应用图像处理[M].西安:西安电子科技大学出版社,2002.

[5]姚若河,黄继武,吴湘淇.改进的直方图均衡化图像增强算法[J].铁道学报,1997.12

[6]王耀南,李树涛,毛建旭.计算机图像处理与识别技术[M]北京:高等教育出版社,2001.

[7]王炳锡,陈琦,邓峰森.数字水印技术[M].西安电子科技大学出版社.2001.

直方图均衡化的基本原理范文2

【关键词】视觉测量 数字图像处理 开放性实验

【中图分类号】G642 【文献标识码】A 【文章编号】1006-9682(2012)10-0001-03

一、引 言

数字图像处理作为一门学科大约形成于20世纪60年代初期,并首次在航空航天领域取得了成功应用。数字图像处理技术的发展除了与计算机技术、信息技术的快速发展密切相关以外,还得益于其在航空航天、工业、生物医学、军事、通信工程、商务、环境、林业等诸多领域的广泛应用,正是这些应用需求,促进了数字图像处理技术的深入研究和快速发展。“数字图像处理”课程是随着计算机和信息技术发展应运而生的一门新兴课程,已成为信息类专业本科生的重要专业课。通过该课程的学习,要求学生掌握数字图像处理的基本概念和原理,能够对图像进行各种处理,如图像增强、图像运算、图像编码、边缘检测等,为图像通信、模式识别、计算机视觉以及其他交叉学科等工程领域的应用奠定基础。

“数字图像处理”课程的理论教学很抽象,仅仅通过理论教学学生很难掌握数字图像处理的基本原理。如果把数字图像处理的广泛应用引入课堂理论教学,将具体知识点与其在实践中的使用相结合,同时为学生提供边学边实践的机会,不仅可以提高学生的学习兴趣,加深对抽象理论知识的理解,增强其动手实践的能力,还可以拓展学生的视野,与目前学科前沿技术相衔接。

二、视觉测量技术

在现代三维测量新技术中,视觉测量是由计算机视觉、图像处理、模式识别等多学科交叉结合而形成的科学。图1所示,视觉测量是一种非接触性测量手段,以数字图像作为信息载体,对被测目标进行成像,通过提取多个像面的二维像点信息,标定相机内、外参数,并重建、优化被测目标的三维信息,实现测量。视觉测量基于严谨的理论和现代的硬软件设施,可以达到相当高的精度和可靠性,便于对大型工件、设备的尺寸、位置、三维轮廓等进行高精度测量,而且移动方便,可快速灵活地构建适于不同测量对象的系统,进行现场测量。目前,视觉测量技术已经广泛应用于建筑工程、航空航天、汽车制造、生物医学、考古等各个领域。[1~5]因此,视觉测量技术正在深入工业生产和社会生活的各个领域,研究和应用新的基于光学、数字图像和视觉信息融合的三维测量方法,既具有重要的理论意义,又具有重大的实用价值,应用前景非常广阔。

根据视觉测量的基本原理,利用数字图像处理技术获取的二维信息是视觉测量中相机标定、三维重建等环节的基础,对于系统的测量精度、稳定性等方面具有决定性的影响,是视觉测量领域的关键技术。在长期的数字图像处理课程教学以及视觉测量研究工作中发现,可以将视觉测量中关于数字图像处理的应用内容引入课堂教学中,与具体理论知识相结合,加深学生对于课程理论的理解,使其接触到科学研究的前沿内容。此外,通过设置开放性实验等环节,引导有兴趣和能力的学生进行实践能力的培养,使学到的知识“活”起来。

三、视觉测量与数字图像处理课程的融合

为了改善数字图像处理课程的教学效果,提高教学效率,将视觉测量技术与数字图像处理课程相融合,本文主要在教学方法和教学手段改革、视觉测量需求与理论知识点结合、实践动手能力提高等方面进行了研究。

1.教学方法和教学手段改革

为了贯彻学生是教育主体的教育思路,使学生学会学习,并充分激发学生的创新能力和素质培养,促进学生个性的发展,同时有利于师生彼此促进共同进步的原则,针对数字图像处理课程的特点,采取了以下措施:

(1)重视数字图像处理课程的基础理论教学。数字图像处理内容丰富,应用灵活广泛,但学生在掌握某些具体应用技术时感到理解困难。因此,在实际教学上,首先需要注重相关的基础理论教学。[6]例如,数字图像的本质是数字信号,所以在课程前期阶段,专门有针对性地复习和讲解了信号分析与处理方面的基本理论,包括数字信号处理的常用方法、离散傅里叶变换和快速傅里叶变换、离散余弦变换等,这些理论在数字图像处理课程中有具体应用。这不仅有利于对数字图像处理内容的掌握,也可以反过来加深对相关理论的理解。另一方面注意授课内容的精选,内容不在于多,而在于少而精,突出重点,使学生在有限学时内有最大的收获。例如,在频域空间进行图像增强时,不能将频域空间的所有方法都对学生讲授,而是突出讲解了关于频域空间与时域空间处理之间的关系,针对频域图像平滑介绍一种低频滤波器,分析其原理和特点。这样不仅节省了教学时间,而且重点突出,同时也引导学生查阅其他相关方法,让他们自己去动脑思考,提高其思维能力。

(2)完善和改革课堂教学方法。在课堂教学过程中,我们始终重视启发式教学,遵循“提出问题”、“启发式思考”、“解决问题”的教学过程,使用“问题教学法”引导学生去思考、分析问题,激发学生学习的积极性,提高教学效果。课堂开始时,根据授课内容,提前向学生抛出相关问题,在讲课过程中则围绕该问题讲解课程内容,最后提出问题的解决方法。例如,在讲解“直方图均衡化图像增强技术”一节内容时,首先向学生展示了两幅曝光不足和曝光过量的图片,并且为了提高学生的学习兴趣,认识数字图像处理的实际应用,图片取自于视觉测量、航空交会对接定位等领域的实际图片,向学生提问,“如果实际应用中,由于环境光的影响,拍摄到了这样的图片,应该怎么办?”课堂讲解过程中,随着直方图、直方图增强技术的理论、直方图均衡化方法等内容的展开,使学生逐渐理解并掌握直方图均衡化方法,最后,给学生演示了直方图均衡化方法的实现,并看到了利用该方法对图片增强前后的图片效果。这种启发引导式的课堂教学方法,取得了良好的效果。

(3)传统和现代化教学手段相结合。随着计算机、通信技术应用的迅速普及,国内高校的课堂教学已普遍采用了多媒体技术,利用计算机、投影仪、幻灯机等现代化教学设备,结合计算机辅助教学(CAI)展示教学内容。这些现代化技术的确为课堂带来了很多丰富多彩的教学手段。数字图像处理是以图像为处理对象,其输出的形式主要以图像和图形为主,该课程也十分适宜将教学内容制成课件,采用多媒体计算机开展现代化教学。借助多媒体,使学生较直观地看到各种图像的处理需求、处理过程、处理效果等,这是普通教材和参考资料所无法比拟的。因此,我们针对课堂教学需求,进行了多媒体课程教学资源建设,如教学大纲、教学日历、授课教案和课件等通过多媒体平成,便于讲课,同时也便于学生课后的复习。例如,将视觉测量原理、过程等,通过多媒体课件的形式演示出来,相比较口头介绍等方法具有更加直观的效果。除了多媒体教学手段,传统的板书式教学作为补充手段也在数字图像处理课程中得到应用,主要用在课堂教学内容框架展示、理论推导等方面。

2.视觉测量与理论知识点结合

为了提高算法对于目标特征的识别效果,视觉测量通常采用圆形或方形特征点(图2),在获取的图像中对特征的成像位置进行识别和精确定位。视觉测量对于图像处理的要求主要包括图像预处理、特征粗定位、特征精定位等内容,对应数字图像处理课程中的图像增强、边缘检测、特征识别、几何运算等知识点。[7]

图2 视觉测量常用特征点

(1)图像预处理。图像预处理的主要方法包括彩色图像灰度化、图像增强等,为此,在讲解彩色图像内容时,介绍了RGB、HSI等彩色模型以及不同彩色模型之间的转换,并引出如何将彩色信息转换成灰度信息。通过分析彩色表示模型,建立了彩色到灰度图像的转换。

向学生展示常用视觉测量图像效果的基础上,为了减少图像噪声的影响、提高图像识别效果,提出改善图像质量的目标,需要进行图像增强。结合图像增强中常用的直方图增强技术、空域和频域图像增强方法在视觉测量图像处理中的实际应用,给学生展示直观的处理效果,加深对图像增强方法的理解。

(2)特征点粗定位。数字图像处理的边缘检测是该课程比较重要的一部分内容,边缘检测中包含了多种方法,便于学生对不同边缘检测算法的作用效果有直观印象,将各种算法应用于视觉测量图像征点的边缘检测,并有针对性地选择相应参数,使学生不仅学习了各种边缘检测算法的使用,也看到了算法的特点。

根据视觉成像的特点,圆形特征点成像后一般为椭圆,所以,利用边缘检测得到的边缘像点数据,讲解用边缘点进行指定特征识别的方法,如基于Hough变换的特征检测方法。为了引导学生思考,采用启发式讲课方法,讲解了Hough变换检测直线的方法,引出如何用Hough变换检测像面上的圆或椭圆,并鼓励有能力的学生实现相应算法。

(3)特征点精定位。特征点精定位的目的是在实现特征点粗定位的基础上,对圆形特征点中心在像面上的精确坐标进行定位。精确定位主要设计到数字图像处理中的点运算,但需要考虑采用的具体定位算法,如灰度重心法、加权灰度重心法、椭圆拟合法等。引导学生通过文献资料查找和实现相关定位算法,并且与国际领先的专业软件进行定位精度对比。通过比较,可以使学生发现不同算法之间的区别,并分析不同的原因。进一步,引导学生尝试对定位算法做一定的改进,这种改进,不需要从算法根本上做出很大的创新,只是从某一方面进行微小的变化,使其能够适合特定的应用需求。例如,如果对视觉测量像面上特征点定位采用加权灰度重心法时,通过调整加权系数,得到不用的效果,从而分析加权系数对于定位精度的影响,并据此得出适用于该需求的结论。

四、开放性实验

长期以来,“数字图像处理”课程教学主要采用课堂理论教学,教学内容也多为经典的内容,很难反映课程内容的时代特征。实验教学是高等教育的重要组成部分,是抽象思维与形象思维、传授知识与训练技能相结合的过程,在人才培养中具有课堂理论教学环节不可替代的作用,对培养理工科大学生的创造性是不可缺少的。虽然目前大多数课程都设置了实践环节,但也普遍存在着很多问题,[8]例如,实验课成绩占课程成绩比例小,学生对实验的重视度不够,存在着抄袭他人实验结果和报告的现象;实验模式单一,实验内容陈旧、呆板,多为验证性实验,缺乏创新性和挑战性,学生完全处于被动状态,最终导致实验不认真,敷衍了事,所学的知识和操作技术遗忘快;不能保证每个学生都有充分的时间和机会做实验,个别学生逐渐养成依赖心理,最终只有一部分学生得到了锻炼;理论课与实验课教学老师分离,造成理论和实践环节脱节等。

针对目前“数字图像处理”课程实验的现状,根据视觉测量像面特征点定位需求,开设相关开放性实验项目“视觉测量特征点提取定位实验”,实验要求学生结合数字图像处理课程知识理论,对视觉测量采集的数字图像进行处理,提取相关特征点。针对视觉测量中常用的特征点(圆形、方形)进行自动检测,并实现高精度定位,主要实验内容包括:图像预处理、特征点粗定位、特征点精定位、算法设计与实现、实验结果分析等。

教师在开放性实验项目中承担的角色主要是方案设计和实施过程中的指导、监督,对方案的具体实现方法不做限制性要求,主要由学生结合课堂教学内容以及查阅文献资料来设计并完成。为了提高项目完成的效率,教师可以通过适当的引导为学生指出主要方向。

对于单个学生来说,这样的实验项目有些困难,“团队合作”也是新时期对科技人才素质的要求,所以可以通过建立项目小组的方式开展实验。小组成员将实验内容进行分工,每人负责不同的部分,通过相互合作、帮助,完成整个实验项目。通过这种形式,也在某种程度上锻炼了学生的团队合作意识和合作方法。

五、结束语

通过将视觉测量领域研究成果引入“数字图像处理”课程,并在教学方法、教学手段、教学内容、开放性实践等方面的改革和尝试,逐步做到科学研究成果与课堂理论教学的有机结合,不仅丰富了课程的教学内容,提高了学生的学习兴趣,加深了对理论知识的理解,而且使学生接触到科学研究的前沿领域,开拓了视野,对创新能力的培养锻炼等方面也具有重要意义。

参考文献

1 E.M. Mikhail, J.S. Bethel. Introduction to Modern Photogramme

-try[M]. New York: John Wiley & Sons,2001

2 胡安文、季铮、盛庆红.基于近景数字视觉测量的飞机表面模型重建[J].地理空间信息,2004(6):23~25

3 Nicola D’Apuzzo. Overview of 3D surface digitization technologi-es in Europe[C]. Three-Dimensional Image Capture and Applications VI, Proc. of SPIE-IS&T Electronic Imaging, San Jose (CA),2006

4 刘常杰、邾继贵、叶声华.汽车白车身机器视觉检测系统[J].汽车工程,2000(6):373~376

5 彭三城、孙星明、刘国华.三维人体自动测量技术综述[J].计算机应用研究,2005(4):1~5

6 Wang Jun, Dong Mingli, Liang Bo. A fast target location method for the photogrammetry system[C].Proc. of SPIE-ISMCM, Beijing,2011

直方图均衡化的基本原理范文3

关键词:主成分分析;眼睛定位;特征脸;视线;OPENCV

中图分类号:TP391文献标识码:A文章编号:1009-3044(2011)04-0870-03

Eye Detection on Different Gaze

YU Qiong, FAN Yin-tao

(Dept of Computer Science, Wuhan University of Technology, Wuhan 430063, China)

Abstract: Eyes contain a variety of important information,eye detection has important practical value in human face detection and face recognition technology. But the traditional detection methods based on geometrical characteristic are not accurate enough and large computational, this paper presented a new eye detection method. Using of PCA method in the upper half of the face to calculate the position of the eyes. Experimental results show the effectiveness of the algorithm.

Key words: PCA; eye detection; eigenface; gaze; OPENCV

近年来,人脸识别技术迅速发展,人们认识到相关技术的价值并在这方面做了很多的研究,人脸特征的提取是人脸自动识别过程中至关重要的一步。

眼睛是一个在人脸最为重要的特征,因此,眼睛的定位成为了人脸识别中关键的一步。脸部特征强烈依赖于双眼的位置,只要左右眼睛的位置确定下来,则人脸其它特征(如鼻子、嘴、眉毛等)都可根据人脸的生物特征分布关系基本确定。正因为眼睛定位在人脸识别中具有如此重要的地位,所以近年来提出了许多人眼定位的方法,主要有霍夫变换法、灰度投影法和对称变换法[1]等,霍夫变换法对二值化图像进行圆检测,从而确定双眼的精确位置,该方法受眼睑以及眼睫毛等的干扰大,而且也较复杂,因而很难得到广泛的应用;灰度投影法利用人脸灰度图像进行水平和垂直方向上的投影,分别统计出两个方向上的灰度值和,找出特定的变化点,确定人眼位置,该方法对不同人脸和姿态变化敏感,只能大致找出眼睛区域,不能精确定位;对称变换法利用正面人脸图像的强对称性检测人眼,但这种方法局限于人脸正面图像,通用性不是很好。本文提出了一种多角度视线方向上的人眼检测算法,在人脸区域上部[2],利用PCA方法搜索最接近人眼图像的区域。

在图像处理[3]过程中,首先通过直方图均衡化增强人脸局部的对比度,之后再通过像素灰度值归一化在一定程度上消除成像条件不同,也就是外界光照条件不同对定位造成的负面影响。在人脸库中选取多角度视线方向上的眼睛图像,用这些图像合成人眼图像。根据人眼在人脸的位置特点,在已检测出的人脸区域的上部,利用PCA方向检测人眼的位置。

1 图像预处理

直方图能反映图像的概貌,比如图像中有几类目标,目标和背景的分布如何;通过直方图可以直接计算图像中的最大亮度、最小亮度、平均亮度、对比度以及中间亮度等。使用直方图可以完成图像分割、目标检索等。因为不同的目标具有不同的颜色分布。使用归一化直方图作目标匹配,还不易受到目标翻转和目标大小变化的影响。

若i代表像素的灰度,H(i)代表该灰度的像素总个数。

均衡化原理:根据熵理论可知H(0),H(1)…,H(n-1)相等时,图像信息量最大。均衡化的目的是使每个H(i)都相等,即把原始图的直方图变换为均匀分布的形式,这样就增加了像素值的范围,增强了图像的对比效果。

像素灰度值归一化就是改变图像的亮度和对比度,使其等于定值。

通过归一化处理,可以在一定程度上消除成像条件不同,也就是图像光照不同对识别造成的负面影响。

2 合成人眼模板

PCA算法需要标准眼睛图像在人脸中查找人眼的位置,但不同视线方向的眼睛图像差别很大,所以应该降低人眼模板对多角度视线方向的眼睛的敏感性,提高其鲁棒性。为此我们采用一种合成的人眼图像作为模板,从库中选取不同视线方向的左右眼图像,然后将这些图像的对应像素相加平均后得到一个合成模板。合成多角度视线方向的人眼图像操作简便,能够在多角度视线方向之间达到折中,减弱了模板对视线方向的敏感度。

从人脸库中选取不同视线方向的人眼图像,并合成左眼、右眼图像,如图2,图3。

3 用PCA算法实现眼睛定位

主成分分析[4](Principal Components Analysis,即PCA,也称为K-L变换)的目标是寻找r(r

PCA算法的实现步骤:

1)计算向量集I的协方差矩阵C。

2)使用特征值分解技术得到矩阵C的特征向量E与特征值(按降序排列)。

3)假设在所有m*n个特征值中,前k个值比其余的大很多(即前k个特征值之和几乎等于所有的特征值之和),用前k个特征值来构造原图。

4)计算待测区域对所选的k个特征图像的投影系数。

5)利用投影系数计算测试区域到原图像的距离(如:欧氏距离),距离最近者被选作匹配结果。

PCA是图像压缩中的一种最优正交变换。PCA用于统计特征提取构成了子空间法模式识别的基础。它从图像整体代数特征出发,基于图像的总体信息进行分类识别。Sirovich和Kirby首先将K-L变换用于人脸图像的最优表示。Turk和Pentland[5-6]进一步提出了“特征脸”(Eigenface)这个概念。

PCA算法实现人眼定位的基本原理是:利用K-L变换抽取人眼的主要成分,构成特征眼空间,定位时在人脸图像上选取部分区域投影到此空间,得到一组投影系数,投影系数最小的就是人眼区域。用OPENCV库实现多角度视线上人眼定位的步骤如下。

1)利用cvCalcEigenObjects()得到不同视线下的合成人眼图像的特征值和特征向量,并选择前k个特征值(前k个特征值之和几乎等于所有的特征值之和)。

2)x=xlimitL, y=ylimitU。

3)如果y坐标大于等于ylimitD,转(12)。

4)如果x坐标大于等于xlimitR,转(11)。

5)利用cvEigenProjection()计算合成人眼图像对所选的k个特征值的投影系数。

6)利用cvEigenDecomposite()计算选定区域对所选的k个特征值的投影系数。

7)通过合成人眼图像和选定区域的投影系数计算它们的相似度distance。

8)如果distance< min,转(9),否则,转(10)。

9)记录下最小的相似度Min = distance,及其位置。

10)x = x + 2,转(4)。

11)y = y + 2 ,转(3)。

12)所记录的位置即人眼位置。

4 实验结果及分析

本文使用VC++,利用Opencv库[7]完成上述眼睛定位算法。我们可以定位已保存的视频文件中每帧图像的人眼位置,也可以直接定位摄像头捕获的每帧图像的人眼位置。如图4所示,我们利用不断变换头部姿态和视线方向的视频片断来测试本文方法的准确率,当头部旋转角度小于60度时,多角度上的眼睛的定位准确率比较高,该方法对戴眼镜的眼睛定位有很好的鲁棒。

图4 眼睛定位的定位结果

如图5所示,在眼镜反光以及头部旋转角度过大时,定位会出错或无法定位。

图5 眼睛定位出错情况

5 结束语

本文利用PCA算法,开展了多角度及姿势人脸眼睛检测的研究工作。本文通过图像预处理减小外界光照等对人脸图像的影响,合成多角度的人眼图像作为眼睛图像,对合成眼睛图像进行主成分分析,在已检测出的人脸区域内的相应位置上定位眼睛。实验证明,本文所提出的方法具有对光照等外界条件不敏感,对眼镜具有很好鲁棒性以及可以识别不同姿态及多角度的眼睛图像的优点。然而,对于眼镜反光及头部旋转角度过大时的定位出错等问题,将是下一步研究工作的重点。

参考文献:

[1] 唐琏,许海柱,王力.图像中人眼检测技术综述[J].计算机应用研究,2008,25(4):961-965.

[2] 宋加涛,刘济林,池哲儒.人脸正面图像中眼睛的精确定位[J].计算机辅助设计与图形学学报,2005,17(3):540-545.

[3] 张敏,陶亮.人脸图像中人眼的检测与定位[J].光电工程,2006,33(8):33-36.

[4] Richard O, Peter E, David G. 模式分类[M].李宏东,译.2版.北京:机械工业出版社,2003.456-460.

[5] Turk M A, Pentland A P. Face recognition using eigenfaces[J].Proceedings of the IEEE.on Computer Society Conference,US,1991,3(6):586-591.

直方图均衡化的基本原理范文4

关键词:数字图像处理;Matlab;课堂教学;实验教学

作者简介:杨青(1983-),女,河北石家庄人,军械工程学院火控雷达与系统教研室,助教;徐艳(1981-),女,河北保定人,军械工程学院火控雷达与系统教研室,讲师。(河北 石家庄 050003)

中图分类号:G642 文献标识码:A 文章编号:1007-0079(2013)10-0115-02

近几十年,数字图像处理技术在计算机技术发展的推动下得到了飞速的发展,并且已成为工程学、计算机科学、信息科学、生物学以及医学等各学科技术领域中不可或缺的一项重要手段。[1]许多高校将“数字图像处理”课程作为电子信息、工业自动化等专业的专业课程,其目的是为了使学生了解常见的图像处理技术,以便将其应用到相应领域中。该课程是一门理论与实践、原理与应用结合紧密的课程,在教学过程中可分为课堂教学与实验教学两部分。在课堂教学过程中主要讲授基本理论和方法,包括图像的获取、图像变换、图像增强、图像复原、图像压缩编码、图像分割和特征分析等内容。[1]在实验教学中通过实践动手的环节,培养学生对图像处理算法的编程能力。

“数字图像处理”技术是利用其理论方法通过计算机对图像施加某种运算和处理,从而达到某种预期目的,所以,选择合适的计算机语言对于学生掌握好这门课程十分关键。该课程具有数据量大、方法多、算法复杂等特点,为了使学生在有限的课堂学习中很好地实现图像处理,而不使学生陷于算法的设计和复杂的编程语言的学习中,本课程使用Matlab语言辅助教学。Matlab软件是MathWorks公司于1982年推出的一套高性能的数值计算与可视化的数学软件。在高等院校中,对于数学、工程和科学理论中的入门课程和高级课程,Matlab都是标准的计算工具。它集数值分析、矩阵运算、信号和图像处理、图形显示于一体,具有许多特定应用的工具箱,特别是具有图像处理工具箱,扩展了Matlab解决处理图像处理问题的能力。[2]将Matlab用于“数字图像处理”课程的课堂和实验教学中,使得教学方法和教学质量有了很大的改进。

一、Matlab在课堂教学中的应用

在“数字图像处理”的课堂教学中,主要以讲授其基本原理和方法为主要同容。但是,图像处理是利用数字计算机对图像进行的一系列操作,需要通过观察图像的变化来理解图像处理的基本方法,进而将抽象的公式和运算结果联系在一起。在进行课堂教学时,充分运用 Matlab 图像处理工具箱中函数,可以方便得到处理结果,这样的演示教学使抽象的概念具体化,感性地认识图像处理内容,从而使教师教学、学生学习变得容易。下面给出几个教学中的实例。

例1:数字图像在计算机中的矩阵表示。

一幅大小为M×N的数字图像,在计算机中表示成一个M行、N列的矩阵,存储在M行、N列的二维数组中。使用Matlab图像处理工具箱中读取和显示图像的函数来演示读取和显示一幅数字图像的过程。

f = imread(‘rose.tif’);

imread函数可以将一幅图像以矩阵的形式存储在f中,Matlab的工作空间中则显示了矩阵f的大小及数值类型,并且可以看到每一个元素的取值。

imtool(f);

imtool函数可以将矩阵f通过图形窗口以图像的形式显示出来(如图1(a)所示),将鼠标在图像上移动,鼠标指针所指向的像素的位置及其灰度值显示在窗口左下角处,整幅图像的灰度值范围显示在窗口右下角。在该窗口中可以选取图像中任意大小的矩形区域,该区域内的像素被放大显示在如图1(b)所示的窗口中。

图1 图像在Matlab中的显示形式

通过演示,很直观地就可以讲解数字图像的定义及在计算机中的表示形式。

例2:傅里叶变换。

傅里叶变换(DFT)是“数字图像处理”课程中最重要并且最难的内容之一。在图像处理技术中,傅里叶变换起着十分重要的作用,应用也十分广泛。图像的二维离散傅里叶变换可以表示为:

(1)

其反变换表示为:

(2)

二维离散傅里叶的频率和相位角定义如下:

(3)

其中,R(u,v)和I(u,v)分别表示F(u,v)的实部和虚部。

在教学中对公式推导讲解的同时,利用Matlab实例演示并将图像的频谱进行可视化,[2]这样即可以克服理论上的空洞讲解,同时也增强了理论的可信性,达到事半功倍的效果。

在Matlab中一个大小为M×N的图像数组f可以通过工具箱中的函数fft2得到该图像的傅里叶变换。

F = fft2(f);

傅里叶频谱可以使用abs函数获得,即该函数计算数组每一个元素的幅度(实部和虚部平方和的平方根)。

S = abs(F);

使用函数fftshift将进行频谱的中心化。

FC = fftshift(F);

Sc = abs(FC);

通过显示频谱的图像来进行可视化分析是进行频域处理一个重要方面。图2(a)是一幅简单的二值图像,图2(b)是其对应的傅里叶频谱图像,图2(c)将频谱进行中心化后的频谱图像。

将Matlab演示教学贯穿于课堂教学中,可以使学生对数字图像在计算机中的表示形式一目了然,使抽象的原理直观化,大大加快了学生对知识的理解,也使课堂教学的气氛得以活跃。

二、Matlab在实验教学中的应用

“数字图像处理”实验教学内容包括图像处理软件操作、算法设计和综合应用等。根据学生编程水平非常有限的特点,故采用 Matlab软件编程技术,使其与实验教学有机地结合起来,同时可以使学生在学习数字图像处理技术基本原理的同时,掌握一门实用的数学处理工具。而很多学校的教学和实验环节偏重教学生如何使用Matlab系统工具箱来实现图像处理的功能。这种教学方式使学生对工具箱过分依赖,并不能训练学生的编程能力,所以在实验教学过程中,应尽量不使用系统自带函数,而是要求学生自己写函数,对于传统的算法,如直方图均衡化、图像旋转、图像去噪、图像锐化、图像分割等算法,要求学生在了解原理的基础上直接编写程序实现,这样可以让学生提高实现算法的能力,并能加深他们对这些传统算法的理解。

例如,对图像进行3×3邻域大小的中值滤波。

1.利用Matlab可以直接使用工具箱的函数实现

I = imread('lena.png');

J = imnoise(I,'gaussian',0,0.02); % 模拟均值为0方差为0.02的高斯噪声

M = filter2(fspecial('average',9),J)/255; % 领域大小为3×3

subplot(2,1,1); imshow(J); title('噪声干扰图像')

subplot(2,1,2); imshow(M); title('改进后的图像')

虽然这种方法编写起来方便快捷,但是不利于学生对原理的理解。

2.利用结构化编程思想实现中值滤波算法

I = imread('lena.png'); % 读入当前路径下的图像

J = imnoise(I,'salt & pepper',0.04); % 模拟叠加密度为0.04的椒盐噪声

[i_hight,i_width ]= size(J); % 图像的大小

for i=2 :1 :i_hight-1

for j=2:1:i_width-1 % 3×3邻域的中值滤波

c(1) = J(i-1,j-1);

c(2) = J(i-1,j);

c(3) = J(i-1,j+1);

c(4) = J(i,j-1);

c(5) = J(i,j);

c(6) = J(i,j+1);

c(7) = J(i+1,j-1);

c(8) = J(i+1,j);

c(9) = J(i+1,j+1);

for k=1 :1 :8

for m=1 :1 :8

if c(m+1)

buf = c(m+1);

c(m+1) = c(m);

c(m) = buf;

end

end

end

A(i,j) = c(5);

end

end

subplot(2,1,1); imshow(J); title('噪声干扰的图像')

subplot(2,1,2); imshow(A); title('改进后的图像')

在实验教学中可以要求学生利用上面两种方法进行处理,通过观察实验结果学生可以对两种方法进行比较,同时引发学生对实现方法比较深层次的思考,启迪、激发学生的创新思维、创新意识。通过编程对数字图像处理算法的理解逐步增加,同时编程水平得到大幅度提高,并提高了学生的实践能力。

三、结束语

“数字图像处理”作为一门重要的专业基础课,教学改革任重道远。实践证明,Matlab应用于“数字图像处理”课堂教学和实验教学中,能够有效地提高课堂教学质量,以逐层递进的方式达到学生对数字图像处理知识的融会贯通以及灵活运用,激发学生的学习兴趣,激发学生的求知欲,给学生提供了充分发挥创造能力的机会,在很大程度上提高了学生的学习主动性和创新能力,为专业的深入研究打下坚实的基础。

参考文献: