前言:中文期刊网精心挑选了阈值分割的基本原理范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
阈值分割的基本原理范文1
关键词:刀具工艺;MATLAB数控处理;图像;阈值规格;分割方法
数字图像处理技术在全力适应现代化信息整改规模活动秩序的节奏中,运用强度适应基准较高的刀具机械化制定标准方案进行研讨和资料补充,维持阈值在遥感实时定位监督环节中的有机拓展效应。图像分割在视觉层次领域的延展水准,主要结合自动化工业产品的质量检验,生产流程监督控制等前提条件框架,联合性能比较稳定的阈值扩展机理能效,进行简单数据的计算,保证实质性运算效率的拓展潜力开发工艺,规范图像分割处理质量的完整性改善。经过长期的实践经验总结,联系MATLAB语言编程算法的创新式渗透幅度,配合数控式刀具大附件的施展结构维持原理内容,实现先进生产行业机构的整编。
1.数字图像引用阈值分割方法研究工作的基本原理内容探讨
根据一定灰度格局图像的取阈值分割现状机理条件,引用保准化像素的灰度值实体模型实行分析对象的有利对比,透过与阈值对比大小行列中的有序编排组织框架描述,达到区域式分割的目的。整个环节程序主要体现为:确定需要引用的分割法数据模型,并联合适当结构的必要参考像素值实施对比划分,和差值提取,并依据分割队列的组织编排特征实施融合累积校验方案的制定。在图像阈值确定过后,利用划分像素并行结构延续的路径指向规则,实现分割图像区域段的准确定位。整个方图呈现的明显多峰规律,就应该适当运用阈值的取用效率实施良性分割[1]。整体统一的阈值分割处理的图像定义为:
延伸到迭代法阈值选取手段,在满足一定自动化流程的设置基础活动中,利用初始阶段的阈值极限灰度值实施代表数据的筛选。连接后续的分割处理工序,实施图像区域灰度值的分类,并联合像素灰度均值的阈值延伸定义进行新计算步骤的延展。根据上述对比延伸阈值提取的循环运用手段实现差值满足设定范围的计划原则,并引用标准式程序语言的配备,实现自动化的结果提取。
2.联合MATLAB数控阈值分割处理程序应用的刀具图像分析方案研究
边缘结构分析是刀具图像自身存在的必要特性要素,内部应用延展信息的储量十分丰富。在贯彻数字图像处理环节中,依靠区域交接位置强度函数的取样点阵列格局样式,实施函数度量变化规律的探索,其间引申的具体梯度是二维等效格式对向量定义内容的具体阐述形式,主要定义公式表现为:
在铣刀机械器具的制作流程中,依据参数测量工作内容的自适应规格,结合目标像素的相邻领域内部要素实施编码排序整合,连接铣刀结构边界轮廓结构的逐步检测筛选控制程序。主要流程内容包括:依据分割图像实施左上方初始位段的逐步搜索,维持目标要素的自行把控基础,根据像素跟踪向导的起始规划准则规定初始值方向;联合逆时针搜索目标的连同区域设定原理,检测目标位置的精确定位。采用菱形测试图像和必要灰度规范的铣刀图像实施MATLAB程序的补充,邻域位置通过算法改变像素某一类别的隶属效应,在整体环境内的局部收敛特性会发挥必要的优势标准[2]。在此基础上,实际联合刀具分割聚类中心值比较,凭借邻域结构的编码程序跟踪,得到连续的轮廓点阵分析基础资料,保证后期阈值处理图像分割技术的数据依据支持效应。利用MATLAB提供完整的查询中心,帮助系统进行用户要求的提取,在相对简单的编程环境基础状态下调试语言搭配形式,这种具有一套程序扩展系统的工具被称为应用子程序。以下是三刃立铣刀的经过阈值分割处理过的对比图片:
具体轮廓记录结果的点集数据分布结构形式如下表所示:
通过MATLAB中的矩阵运算快速应对解释程序,依靠交互式结构在用户接收信息的指令语言输入形式,实施结果的良性匹配。这种相对开放式的环境集成规范体系,可以确保铣刀制作流程细节图像的全面显示,实现预期计划指导的实际工序操作目标[3]。整个系列的图像界面,自带智能式路径搜索窗口,满足分割处理的预留空间结构形态,并且在不断商业化的技术改革过程中,使用人机交互式的编程指导系统,省去了编译的繁琐效应;对待细致部件的螺纹要求等,能做到即时的报告,并适度整改铣刀的自适应结构模式。
总结:这种MATLAB科学计算能力,主要是联系图像阈值分割,适当提取轮廓点阵的形式存储规模,保证特征前期准备内容的有效编排,这是引申后期深入式机械应用部件整改的必要方向。
参考文献:
[1]陈银清.宏程序编程在数控加工中的应用研究[J].机床与液压,2009,21(05).
阈值分割的基本原理范文2
关键词
图像分割;分割方法;发展趋势
1图像分割简介
图像分割是指将一幅完整的图像分解成若干个互不交叠的、有意义的、具有独特性质的区域然后根据需求提出自己感兴趣目标的技术和过程。它是图像识别和图像理解的最基本步骤,其分割效果的好坏关系到后面图像处理的结果,甚至最终决定其成败。而图像分割的好坏最重要的是取决于所用到的算法。图像分割算法的质量和效率对图像系统的性能起着关键作用。
2常见的几种分割方法
从20世纪60年代以来,好多国内外学者提出了许多关于图像分割的算法,主要是基于阈值、基于区域、基于边缘和基于特定理论的分割方法。而阈值分割方法是图像分割中很古老但又简单方便的常用方法。基于区域的分割方法基本思想是将具有相似性质的像素点集合起来构成区域。基于边缘检测的分割方法是图像分割最重要的一种,是实现基于边界的图像分割的重要基础。边缘的检测是利用物体和目标背景在一种图像特性上的差异以此实现的,它实际上就是检测图像特性一些发生变化的位置。图像分割到现在为止尚无通用的自身理论。随着各学科各种新理论和新方法的提出,出现了好多与一些特定理论、方法结合的图像分割方法。在这几种分割方法中,阈值法是使用最普遍的,故本文着重介绍。
3几种基于阈值分割方法的简介和对比
3.1一维Ot su阈值分割法
Otsu算法是由日本学者天津于1979年提出的一维最大类间方差法,它以分割效果较好、适用范围较广、简单而有效的特点而广受关注。该算法在图像灰度的一维直方图基础,以图像的主体目标背景和背景的类间最大方差为图像分割阈值选取准则,完成图像目标部分与背景部分的分离,其类间方差越大,则说明构成图像的主体目标与图像背景两部分的差距就越大。图像分割效果越好,意味着在分割时,图像内容错分的机率和比例就越小。该方法通常只是针对目标和图像背景灰度特性区分比较明显的图像有较好的效果,但是由于图像来源多种多样,图像在拍摄时也很容易受到噪声干扰,最终导致直方图分布形式多样化,因此采用简单的一维Otsu算法无法得到令人们满意的结果。
3.2二维Otsu阈值分割法
针对一维Otsu分割法的缺点,刘建庄等提出了二维Otsu法。其基本原理为关联原始图像像素点信息与其邻域像素点信息,建立图像像素信息联合直方图。将一维OTsu算法推广到二维OTsu算法,并建立阈值的自适应判别算法。该方法不但很好地利用了图像像素点的信息,而且也充分考虑到了图像像素点与其邻域空间的相关信息,所以它具有较好的抗噪性。但该算法计算二维最佳阈值时采用穷举方法,其运算量超大,很难应用于实时处理。并且它还有一个重要缺陷就是,在计算最佳阈值时,将靠近对角线的概率非零数据忽略,这样势必会影响分割结果,造成分割误差。
3.3二维Otsu斜分阈值分割法
为克服二维Otsu直分的缺陷,吴一全等人提出了斜分。其原理为由于像素点都比较集中在主对角线的附近,这样就可以首先通过4条斜线,这4条斜线位于主对角线两侧并且与主对角线平行,它们其直方图的区域划分为内点区、边界点区和两个噪声点区,然后将上述的每个内点区、边界点区和噪声点区更进一步划分为一一对应于目标和背景的两个子区。然后利用快速实现算法进行最佳阈值的选取。该算法在一定条件之下,可以将概率不为零的点都包括进来,避免了误分割。而且运算时仅包括窄带内的数据,而将其余部分忽略,缩小了运算范围。在一定条件下,也大幅降低了运算量。
3.4二维直方图叉分阈值分割法
斜分法虽然用起来较为精确,但是它又忽了边缘点的存在,这就很有可能导致边缘点区被划分到噪声点区,影响图像边缘的形状的描述。因此李淼等人提出了叉分法。叉分法把目标图像细节保留的更清晰,它的抗噪声能力更坚定。对于噪声很少或无噪声的图像,相比于其他方法而言,叉分法更优,尤其对一些目标边缘轮廓很难处理的图像。叉分法虽然有良好的分割效果,但怎么选取能把区域划分更为精确的匹配参数,就不同的二维直方图来说,还将进一步深入研究。
阈值分割的基本原理范文3
Abstract: Due to the application of visual navigation technology is becoming more and more popular, and therefore, it is necessary to study visual navigation key technologies and applications. In this paper, digital image processing techniques and location and tracking technologies are studied in details, and correspondingly, the relevant application is introduced.
关键词: 视觉导航;图像分割;定位跟踪
Key words: visual navigation;image segmentation;position tracking
中图分类号:TP39 文献标识码:A文章编号:1006-4311(2010)25-0171-01
0引言
伴随着电子技术、计算机技术工业控制技术等的发展,机器智能移动技术也得到了很大的发展。机器智能移动技术的关键部分就是视觉导航技术。视觉导航技术是在机器视觉的基础上 发展起来的。但是与机器视觉又有区别,主要表现为在机器视觉的基础上增加了定位跟踪技术,于是就产生了视觉导航技术。通常一个视觉导航系统由视觉信息采集部分、视觉信息处理部分及导航跟踪部分三大部分构成[1-2]。三部分有机结合,完成视觉导航,具体的工作原理如图1所示。其中视觉信息采集部分主要是完成对机器将要经过路线上的图像的采集,这个过程主要由摄像机(CCD)完成;视觉信息处理主要是对采集到的图像进行增强、边缘提取和分割等;利用一定的跟踪算法,实现机器的智能跟踪,即完成机器的导航。
1视觉导航的主要关键技术
构成视觉导航系统的四个部分中,其中的视觉信息处理部分和智能定位与跟踪部分是系统的核心,这两个部分用到的技术是视觉导航系统的关键技术。这些关键技术主要包括两大方面,即图像处理技术和智能定位与跟踪技术。
1.1 像处理技术在图像采集时,图像噪声的大小,摄像角度上的光线,非理想话图像处理等都会使图像质量变差[3]。再加上道路两旁及道路本省背景的复杂性,要把有用的图像信息提取出来难度很大。因此,为了更好的提取出对导航有用的图像信息,需要对图像进行处理。图像处理主要是对图像进行分割,把机器能经过的道路与路障分开来。图像分割主要包括边缘提取和阈值分割。
边缘提取。边缘主要是指图像局部变化最明显的部分,边缘是划分目标与目标、目标与背景、区域与区域的标志。图像边缘的检测主要就是利用图像像素点灰度值的不连续性,将目标和背景等不同的区域分开来。常用的边缘提取方法是模板法。模板也称为边缘检测算子,模板的数学基础的图像像素点的梯度变化。
阈值分割。阈值分割的基本原理图像中不同像素点的值不同,通过选取合适的阈值,就可以将图像划分为不同的部分。阈值分割中最典型的就是图像的二值化。图像二值化的方法很多,主要有整体阈值法、局部阈值法和动态阈值法。
不论是图像边缘的提取,还是图像的二值化。其对图像处理的效果,关系到后续的机器智能定位与跟踪。视觉导航能否实现,图像处理是关键因素之一。因此,在图像处理时一定要选择合适的图像处理算法,为后续视觉导航的实现服务。
1.2 智能定位与跟踪视觉导航技术中的另一关键技术――智能定位与跟踪。智能定位与跟踪主要是完成对安装了视觉导航系统的机器移动路径及路径上的障碍物的识别,使机器能够实现智能移动。常用的路径与障碍物识别方法有基于道路模型的路径识别方法、基于Hough变换的路径识别、基于LVQ神经网络的路径识别方法。
2视觉导航技术的应用
由于视觉导航技术的发展越来越成熟,其使用也越来越广泛。在工农业生产等各个不同的领域都有所应用。视觉导航技术的应用,给这些领域的生产工作带来了极大的便利,大大提高了机器的工作效率。
2.1 视觉导航技术在农业生产中的应用。视觉导航技术在农业生产中的应用,主要表现为农业机械的导航。视觉导航技术用于农业机械的导航,主要是帮助农业机械把目标物与周围的背景区分开来。07年,伦冠德[11]利用图像增强技术与Hough变换相结合,对传统的导航模型存在的不足进行了改进研究,研究结果表明,新方法对导航路径的识别由于传统的模型导航;09年,杨为民等将动态窗口处理技术与Hough变换相结合,对农业机械中的视觉导航系统进行了改进,并取得了较好的导航效果等。
2.2 视觉导航技术在机器人领域的应用目前世界上许多危险环境下的作业,都是由机器人完成的。比如机器人用于深海探测。机器人要自动到达既定的探测,而不因为碰到障碍物损坏,这就要求机器人必须要有视觉导航功能。05年,周庆瑞等对视觉导航技术在机器人中的应用进行的研究。利用图像的深度信心,再结合相应的校正算法与跟踪技术,实现了机器人的智能移动。
2.3 视觉导航在移动车辆中的应用。具有智能导航功能的移动车辆是当今车辆研究领域的前沿。智能车辆的导航主要是完成环境感知、规划决策和辅助驾驶等功能,这些功能的实现需要计算机视觉技术、控制技术和电子技术等的支撑。其中最重要的还是视觉导航技术。如09年,钱云等研制的基于视觉导航的智能车货物搬运系统,充分利用的图像的边缘提取技术,对智能车要经过的路径进行识别,并且取得了较好的效果。
从上面三个方面的分析研究表明,视觉导航技术在各个领域中的具体应用不同,但所使用的关键技术基本是相同的。主要都是对图像信息的处理和对运动路径的定位于跟踪。
3小结
随着机器视觉产品与我们的生产和生活越来越近,很有必要对视觉导航技术进行必要的研究及应用分析,以便人们能够更好的理解视觉导航产片的工作原理与功能。
参考文献:
[1]吴琳.计算机视觉导航综述[J].人工智能及识别技术.
阈值分割的基本原理范文4
关键词:识别;图象处理;去噪;增强;复原;分割
A Survey of the Basic Principles in Digital Image Processing Technology
PAN Zhen-gan1,2, GONG Sheng-rong1
(1.School of Computer Scinence & Technology, Soochow University, Suzhou 215006, China; 2.Certer of Network, Suzhou University of Scinence & Technology, Suzhou 215009, China)
Abstract: If the corresponding contents of blurry source materials are difficult for naked eye to identify, it is feasible to preserve the materials and carry out history research by inputting the digital images of source materials into a computer, disposing the images with the technology of noise removal, enhancement, restoration, segmentation and reverting them to the effect of visibility.
Key words: identify; image processing; noise removal; enhancement; restoration; segmentation
一些历史档案和资料具有很高的研究价值,对于研究该地区当时的经济和文化背景有很大的作用,但是因为年代久远,其纸质或布质的材质因为时间原因,使得写在上面的图案和文字资料都模糊不清,有些肉眼已经很难分辨出具体内容,对于历史和研究都是很大的损失,用数码相机将这些纸质或布质材质的资料拍摄下来输入计算机,将原始的资料变为数字图象,再用数字图象处理的方法将其处理还原,以达到人眼可以看清内容,进行研究的效果。
用计算机进行图像处理的前提是图像必须以数字格式存储到计算机中,以数字格式存放的图像称为数字图像(digital image)。数字图像处理(digital image processing),就是利用计算机对数字图像进行去除噪声、增强、复原、分割、特征提取等理论、方法和技术,将原始资料清晰化,改善图象的质量,使人的肉眼可以看清这些图象,从而得以保存和研究的目的。由于图像处理是利用计算机硬件和软件实现的,因此也被称为计算机图像处理(computer image processing)。
数字图象处理一般有两种基本的方法:一种方法是在图象的空间域中处理,即在图象空间中对图象本身直接进行各种处理优化,达到改善图象质量的目的;另一种方法是把空间图象进行某些转化,从空间域转到频率域中,再在频率域中进行各种处理,然后再变回到图象的空间域,形成处理后的图象,从而达到改善图象质量的目的。
1 去除噪声
原始实体资料变为数字图象在计算机中进行处理的时候,可能会产生各种各样的噪声,这些噪声可能是在进行数字转换过程中,因为输入设备的原因产生,也可能在对数字图象的处理中产生,噪声不一定是真实的声音,可以理解为影响人的视觉器官或系统传感器对所接收图象源信息进行理解或分析的各种因素。不同原因产生的噪声,其分布特性也不完全相同,根据噪声和信号的关系可将其分为两种形式:1)加性噪声,此类噪声与输入图象信号无关,含噪图象表示为f(x,y)=g(x,y)+n(x,y);2)乘性噪声,此类噪声与图象信号有关,含噪图象表示为f(x,y)=g(x,y)+n(x,y)g(x,y)。噪声对图象处理十分重要,如果图象伴有较大噪声,它会直接影响到图象处理的输入、采集、处理的各个环节以及输出的全过程甚至输出结果,因此,在进行数字图象处理的时候,首先需要对目标图象进行去除噪声的工作。
1.1 均值滤波器
采用邻域平均法的均值滤波器适用于去除通过扫描得到的图象中的颗粒噪声。邻域平均法是空间域平滑技术。对于给定的图象f(x,y)中的每个像点(x,y),取其邻域Sxy,设Sxy含有M个像素,取其平均值作为处理后所得图像像点(x,y)处的灰度。
1.2 自适应维纳滤波器
它能根据图象的局部方差来调整滤波器的输出,局部方差越大,滤波器的平滑作用越强。它的最终目标是使恢复图像f^(x,y)与原始图像f(x,y)的均方误差e2=E[(f(x,y)- f^(x,y))2]最小。
1.3 中值滤波器
基本原理是把数字图像或数字序列中一点的值用该点的一个领域中各点值的中值代换。其主要功能是让周围象素灰度值的差比较大的像素改取与周围的像素值接近的值,从而可以消除孤立的噪声点,对于滤除图像的椒盐噪声非常有效。
1.4 小波去噪
小波变化具有高斯分布的特性,根据信号小波分界的特点,对信号的小波系数设置一个阈值,大于这个阈值的小波系数由信号变换得来,同时含有信号和噪声的变换结果,而小于这个阈值的小波系数则完全由噪声变换而来,应该去掉这些系数。这样就可以达到降低噪声的目的。同时由于这种方法保留了大部分包含信号的小波系数,因此可以较好地保持图象细节。利用小波分析的理论可以构造一种既能够降低图象噪声,又能保持图象细节信息的方法。
2 图象增强
很多历史资料由于材质和时间的原因,整幅图片色泽偏暗,亮度范围不足或非线性等因素造成对比度不足,影响观看效果,结合人眼对灰度的感觉,如果相邻两个物体目标灰度相差比较小,超过人眼对灰度差的感知能力,人眼就无法区分这不同的两个物体,从而导致无法看清楚图片,这就需要对图片做出一些处理,使图片的灰度差和整体色泽有所改善,以达到人眼观看的效果。图象处理的原始目的就是改善图象,使看不清的目标能够看得清楚,因此,对数字图象识别分析的全过程,都要求图象得到改善以适应人的肉眼,为了达到这个目的,除了首先需要去除噪声之外,还需要分辨灰度细节,解决灰度的扩展和图象鲜明化问题。
图象改善最常用的方法是图象增强,图象增强要改善图象的视觉效果,把图象处理成为适用于计算机分析或控制的某种形式,图像增强按特定的需要突出一幅图像的某些信息,同时,削弱或除去某些不需要的信息的处理方法,以达到改善图象的目的。图象增强并不能完全满足原始图象的一些视觉特性,为了达到图象增强的效果,图象往往会发生变化,产生畸变,但是对人的肉眼的感觉而言,畸变后的图象反而比原始图象更加清晰,观感也更舒服,因此,图象增强不顾及原始图象是否发生了畸变,只以符合肉眼观感和找出特征为条件,图象增强内容包括:去除图象噪声,抽取图象中某些目标轮廓,图象的勾边处理,提取图象中的特征等技术,通过直方图均衡化技术来实现图像增强,首先就是对原图像通过离散函数进行直方图处理。得到原图像的直方图后,根据均衡化的变换函数通过计算得到所需要的增强效果的图像的直方图,分析图像增强的点处理、空间域滤波、频域滤波、代数运算。用直方图均衡化的算法增强灰度图像,达到了图象增强的目的。
3 图象复原
有些图象因为质量变坏,导致图象模糊不清,或图象有干扰等现象,这种情况叫做图象退化,根据图象退化的原因建立一个退化模型,以该模型为基础依据,运动各种反退化处理方法,使复原后的图象符合某些要求和条件,图象的质量得到改善,这样的方法叫做图象复原。图象复原和图象增强的目的相似,都是为了改善图象的视觉效果,令其符合人肉眼的视觉要求,但二者并不等同,图象增强不用考虑图象畸变或退化的原因,更多的依据主观判断利用各种技术进行处理,达到增强图象的视觉效果,满足人视觉系统的要求,不用考虑增强后的图象是否失真,只要满足肉眼观感就可以,而图象复原是根据图象产生畸变或退化的原因,建立相应的数学模型,从畸变或退化的图像信号中提取所需的相关信息,并找出一种相应的逆过程处理方法,从而恢复图象的本来面貌。图像复员的过程实际是设计一个滤波器,从已经退化的图像中计算得到真实图像的估计值,并国际预先规定的误差准则,使其最大程度的接近物体的原始真实图像
图象复原是根据退化原因,建立相应的数学模型,从被污染或畸变的图象信号中提取所需要的信息,沿着使图象降质的逆过程恢复图象本来面貌。实际的复原过程是设计一个滤波器,使其能从降质图象g(x,y)中计算得到真实图象的估值f(x,y),使其根据预先规定的误差准则,最大程度地接近真实图象f(x,y)。
象平面所得图像为H[f(x,y)],加性噪声n(x,y),实际所得的退化图象g(x,y)模型函数是g(x,y)=H[f(x,y)]+n(x,y),其中H[・]是综合所有退化因素的函数。
4 图象分割
图像作为一个整体,有丰富的内容和色彩,我们所需要的目标和背景与整幅图像融为一体,不利于进行图像处理,因此,先将图象划分成若干个与物体目标相对应的区域,根据目标和背景的先验知识,对图象中的目标与背景进行标识、定位,将目标从背景或其他伪目标中分离出来,这种方法称为图象分割。
图象分割而成的区域所包含的信息包括了分区分割和对各分区的描述,利用这些区域中所包含的部分特征,例如灰度差别、局部纹理差别、彩色差别、局部统计特征或局部区域的频谱特征的差别等,可以用来区分整幅图象中不同的目标物体,这些区域称为感兴趣区。因为我们是利用现有图象信息中的部分特征去进行区域分割,所以这样的分割方法并不具有通用性。
理论上来说,图象分割有两个原理,一是在图象中,找出有代表性的物体的边缘,利用边缘信息把整幅图象分割为各个感兴趣区;二是从图象中找出具有相似特征的物体区,将这些物体区的外轮廓作为边缘,根据特征相似度的准则进行划分。
三种分割方法:
基于阈值的分割,这是一种最常用的区域分割技术,阈值是用于区分不同目标的灰度值。在图象只有目标和背景的情况下,只需选取单阈值分割,将图象中每个象素的灰度值和阈值比较,灰度值大于阈值的象素和灰度值小于阈值的象素分别归类。如果图象中有多个目标,就需要选取多个阈值将各个目标分开,这种方法称为多阈值分割。阈值分割的结果依赖于阈值的选取,确定阈值是阈值分割的关键。
基于区域的分割,有两种基本形式:区域生长和分裂合并。前者是从单象素出发,逐渐合并以形成所需的分割结果。后者是从整个图象出发,逐渐分裂或合并以形成所需要的分割结果。与阈值方法不同,这类方法不但考虑了象素的相似性,还考虑了空间上的邻接性,因此可以有效地消除孤立噪声的干扰,具有很强的鲁棒性。而且,无论是分裂还是合并,都能将分割深入达到象素级,因此可以保证较高的分割精度
基于边缘的分割,是利用不同区域间象素灰度不连续的特点检测出区域间的边缘,从而实现图象分割。边界的象素灰度值变化往往比较剧烈。首先检测图象中的边缘点,在按一定策略连接成轮廓,从而构成分割区域。
5 结束语
很多文献和资料因为年代久远导致字迹模糊,内容无法识别而失去其历史和研究价值,用数字图象处理的方法将其处理还原,以达到人眼可以看清内容,进行研究的效果。因此可以看出,数字图像处理技术更加普适、可靠和准确。比起其它简单的模拟操作的方法,也更容易实现。
参考文献:
[1] 容观澳.计算机图像处理[M].北京:清华大学出版社,2000.
[2] 边肇祺.模式识别[M].2版.北京:清华大学出版社,2000.
阈值分割的基本原理范文5
关键词:点特征 Moravec算子 Forstner算子 Harris角点提取
1 引言
图像特征的研究是图像领域中一个重要的研究方向,图像特征的提取被广泛地应用于图像匹配、图像识别、图像分割等诸多方面。作为图像的基本特征,点特征一般认为是指灰度信号在二维方向上有明显变化的点,如角点、圆点、交叉点等[1]。点特征提取是最常采用的一种图像特征提取,也是数字摄影测量的关键技术之一,其定位精度在很大程度上影响了数字摄影测量过程中相对定向与绝对定向的定向结果。因此点特征提取算法的研究在数字摄影测量学中有重要的意义。
近年来,学者们已经提出了多种点特征提取算法。HanSP.Moravec(1977)提出利用灰度方差提取特征点,即利用“兴趣算子”来提取特征点,这是较早的基于图像灰度信息进行特征点检测的方法。C.Harris和M.J.Stephens(1988)在H.Moravec算法的基础上发展出一种通过自相关矩阵的角点提取算法——Harris角点提取算法。Forstner (1987,1994)算子通过计算各像素的Robert梯度和像素(c,r)为中心的一个窗口的灰度协方差矩阵,在影像中寻找具有尽可能小的接近圆的误差椭圆的点作为特征点[2]。SUSAN算子(1997)和MIC算子 (1998)则是利用像素邻域内一个圆形模板的灰度计算出每个像素的角点响应函数CRF (Corner Response Funtion),通过与阈值进行比较来确定是否为特征点,该类方法具有较强的抗噪能力[3]。除了以上几种,还有Kitchen-Rosenfeld、IPAN、CSS等多种常见的点特征提取算法。
本文将以较为常用的Moravec算子、Forstner算子和Harris角点提取算法为例,对点特征提取算法的原理和效果进行研究与分析,为点特征提取算法的选择和改进打下基础。
2 算法原理
2.1 Moravec算子
Moravec算子是一种利用灰度方差提取点特征的算子,主要是在四个方向上,选择具有最大、最小灰度方差的点作为特征点。步骤为[2]:
(1)计算各像元的兴趣值IV (Interest value)。
在以像素(c,r)为中心的w×w的影像窗口中(如5×5的窗口),计算四个方向相邻像素灰度差的平方和,取其中最小者作为该像素(c,r)的兴趣值。
(2)给定一个经验阈值,将兴趣值大于该值的点(即兴趣值计算窗口的中心点)作为候选点。阈值的选择应以候选点中包括所需要的特征点,而又不含过多的非特征点为原则。
(3)选择候选点中的极值点作为特征点。在一定窗口内(可以不同于兴趣值计算窗口,如5×5,7×7或9×9像元),将候选点中兴趣值不是最大者全部去掉,仅留下最大者,该像素即为一个特征点。这一步骤可称为“抑制局部非最大”。
2.2 Forstner算子
Forstner算子是一种摄影测量常用的点特征定位算子。该算子通过计算各像素的Robert梯度和像素(c,r)为中心的一个窗口(如5×5)的灰度协方差矩阵,在影像中寻找具有尽可能小的接近圆的误差椭圆的点作为特征点。
其步骤[2]为:
(1)计算各像素的Robert梯度。
(2)计算l×l(如5×5或更大)窗口中灰度的协方差矩阵:
(3)计算兴趣值q与w。
其中DetN代表矩阵N的行列式,trN为矩阵N的迹。可以证明,q是像素(c,r)对应的误差椭圆的圆度。q =0,表明该点可能位于边缘上;如果q =1,表明为一圆。w为该像元的权。
(4)确定待选点。
如果兴趣值大于给定的阈值,则该像元为待选点。阈值为经验值,可参考下列值:
其中w为权平均值,wc为权的中值。当q >Tq且w >Tw时,该像元为待选点。
(5)选取极值点。
以权值w为依据,选择极值点,即在一个适当窗口中选择w最大的待选点,而去掉其余的点。
2.3 Harris角点提取
应用 Harris 方法提取图像中角点的过程可以分为以下几步[4]:
(1)计算图像像素点在水平和垂直方向上的梯度,以及两者的乘积,得到M中4个元素的值。
(2)对图像进行高斯滤波,得到新的 M。
(3)计算原图像上对应的每个像素点的兴趣值,即 R 值。
(4)选取局部极值点。Harris 方法认为,特征点是局部范围内的极大兴趣值对应的像素点。
(5)设定阈值,选取一定量的角点。
3 实验分析与结论
下面将主要从定位的准确性和提取速度两方面对三种算法的角点提取性能进行分析比较。
3.1 Moravec算子
Moravec算子计算简单,运行速度快,易实现,但是容易提取出错误点或出现定位错误,且对斜边十分敏感。
Moravec算子中有3个可变的参数,分别是灰度差平方和的计算窗口的大小、候选点筛选所用的阈值和求极值点的候选窗口的大小。实验可知,阈值越小,提取点的数量越多,相应地,阈值越大提取点数量越少。阈值选取过小,则会出现错误检测;阈值选取过大,则会出现漏检。阈值的确定与图像的属性和检测时的计算窗口都有关系,需要根据实际的检测情况进行调节。候选窗口的大小也与提取点的数量有关,候选窗口越小,提取点数量越多。候选窗口的过大或过小会导致漏检或错误检测。候选窗口的大小的确定与影像角点的分布状态有关,需要根据影像的具体情况确定。相较于阈值和候选窗口,计算窗口的大小对提取点的数量影响不大。图1、2、3分别显示了当计算窗口为3X3、5X5、7X7时,Moravec算子在人造测试图像上的检测结果。
观察可知,单就这幅影像的检测效果而言,所有的检测结果中都出现了斜边上点的误提取。这主要是因为Moravec算子在计算灰度差平方和时只计算了以窗口中心为中心向4个方向延伸的相邻像素的灰度差平方和,并且仅仅通过比较选取最小值的方式来排除非角点,计算的方向较为离散,部分斜边的方向不在4个方向范围内,导致斜边上点的兴趣值偏大,出现提取错误。
除此之外,比较三幅影像可以发现,计算窗口越小,矩形、三角形等规则图形的角点的定位就越为准确。导致这一情况的因素有很多,其中一个原因是计算过程中部分受周围角点和边缘性质影响的角点邻近点的兴趣值比角点大,导致定位错误。当计算窗口较小时,每次计算考虑的中心点的周围像素数较少范围较小,相应地,受角点和边缘性质影响的像素范围变小,当出现定位错误时误判位置与真实位置也更为接近,定位也就更为准确。但需要注意的是,对于真实地物的影像而言,由于地物的形状复杂、拍摄角度各异,计算窗口的改变可能不会带来明显的提取效果改变(如图4、5、6所示)。
3.2 Forstner算子
Forstner算子的运行速度略逊于Moravec算子,但定位较Moravec更为准确,总体的提取效果也更好。
Forstner算子中有四个可变参数,分别是计算窗口大小、阈值Tq、阈值Tw和候选窗口大小。Forstner算子中阈值和候选窗口大小的作用和确定方式与Moravec算子类似,而计算窗口也同样存在不宜过大的问题,如图7、8、9所示。Forstner算子实际上只是确定了点特征的最佳窗口,在确定了最佳窗口后还可以用最佳窗口内加权重心化的方法进一步提高定位精度。
3.3 Harris角点提取
Harris角点提取算法计算简单,易于程序实现,提取效果优于Moravec算子,点特征定位较准确,误判错检情况较少。但由于在计算过程中反复进行高斯滤波,计算量较大,与Moravec算子和Forstner算子相比运行速度较慢。Harris角点提取算法中只有一个可变参数,即候选窗口大小。其候选窗口的大小的作用和确定方式与Moravec算子类似。为了避免提取出在局部为极大值但相较于整幅影像兴趣值过小的点可额外设定阈值,如0.01倍的兴趣值最大值,其实验结果如图10所示。
4 Moravec算子改进建议
实验结果分析可知,Moravec算子虽然具有计算简单易实现等优点,但仍存在一些待改善的问题。为了提高Moravec算子点特征提取的效率、获得更好的角点检测效果,对以下问题提出了改进的建议。
(1)阈值的选取问题
Moravec算子的所计算出的窗口兴趣值受影像的性质影响较大,因而对不同的影像用Moravec算子进行点特征提取时需要设定不同阈值,否则会出现错误检测或点特征遗漏的情况。人工设定阈值需要进行反复的实验,增加了特征提取操作的复杂程度。针对该问题,可以对Moravec算子作如下改进:将阈值设置为由待检测影像各计算窗口兴趣值计算得到的数值,数值随影像变化而变化,省去复杂的人工实验过程。例如,可以将阈值设定为整张影像各计算窗口兴趣值的最大值的0.01倍,或是设置成整张影像各计算窗口兴趣值的平均值的0.2-0.3倍。
(2)定位错误问题
Moravec算子点特征提取过程中出现的定位错误有多种类型,其中有一类定位错误是将角点周围的邻近点误提取。针对这种错误类型,可以对Moravec算子作如下改进:通过分析这类邻近点的性质,提取出这类邻近点,并将以该类邻近点为中心的计算窗口的兴趣值设置为0,从而避免这类定位错误。例如,该类邻近点中的很多点与周围像素的灰度值相同,可以计算出影像中每个像素x方向与y方向的梯度值,选取其中较大的值作为该像素的梯度值。设置一个阈值,将梯度值小于该阈值的像素标记为该类邻近点并剔除掉,从而减少该类定位错误。
5 结束语
Moravec算子、Forstner算子、Harris角点提取算法是数字摄影测量学中常用的点特征提取算法。本文探讨了这三种算法的基本原理,对其角点提取效果进行了比较和分析。实验证明,Moravec算子运行速度较快,但定位准确度不高;Forstner算子运行速度稍慢于Moravec算子,但定位准确度比Moravec算子高;Harris算子的运行速度慢于其他两种算法,但与Moravec算子相较定位更为准确、漏检错检情况也更少。最后,根据实验的分析结果给出了Moravec算子改进的建议,为之后点特征提取算法进一步的研究提供了依据。
参考文献
[1] 官云兰, 张, 刘向美. 点特征提取算法探讨[J]. 东华理工学院学报, 2007, 30(1): 42-46.
[2] 张剑清, 潘励, 王树根. 摄影测量学[M]. 武汉大学出版社, 2003.
阈值分割的基本原理范文6
关键词:车牌定位;字符分割;BP神经网络;车牌识别;VC++
目录
第1章绪论1
1.1课题研究背景1
1.2车辆牌照识别系统原理1
1.3车辆牌照识别在国内外研究现状2
1.4本文主要工作及内容安排3
第2章车辆牌照的定位方法4
2.1车辆牌照图像的预处理4
2.1.1256色位图灰度化4
2.1.2灰度图像二值化5
2.1.3消除背景干扰去除噪声6
2.2车辆牌照的定位方法简介6
2.3系统采用的定位方法7
2.3.1车辆牌照的水平定位7
2.3.2车辆牌照的垂直定位7
2.3.3定位的算法实现10
2.4实验结果分析12
第3章车辆牌照的字符分割13
3.1车牌预处理13
3.1.1去边框处理13
3.1.2去噪声处理13
3.1.3梯度锐化15
3.1.4倾斜调整16
3.2字符分割方法简介17
3.3系统采用的分割方法19
3.3.1算法介绍19
3.3.2算法的实现20
3.4字符分割实验结果21
第4章特征提取与字符识别22
4.1字符的特征提取22
4.2字符的识别方法简介23
4.3系统采用的识别方法24
4.3.1人工神经网络简介24
4.3.2BP神经网络识别车牌25
4.3.3BP神经网络识别算法实现28
4.4实验结果分析29
总结32
致谢33
参考文献34
第1章绪论
1.1课题研究背景
现代社会已经进入信息时代,计算机技术、通信技术和计算机网络技术的不断发展,自动化信息处理能力的不断提高,在人们社会活动和生活的各个领域得到了广泛的应用,在这种情况下,作为信息来源的自动检测、图像识别技术越来越受到人们的重视。
随着汽车数量的急剧增加,车牌自动识别(licenseplaterecognition,LPR)技术日益成为交通管理自动化的重要手段[1]。车牌自动识别技术是计算机视觉、图像处理技术与模式识别等技术的融合,是智能交通系统中一项非常重要的技术。通过车辆牌照自动识别,就可以对运动车辆查询相关的数据库,根据提取的车辆信息,实现有针对性的车辆检查,极大的提高工作人员的效率,降低工作强度,同时也减少了国家财政收入的流失,减少交通事故的发生以及加强社会治安。因此对车牌识别技术研究有巨大的经济价值和现实意义。
由于车牌自动识别技术在智能化交通控制管理中发挥的重要作用,吸引了各国的科研工作者对其进行广泛的研究,目前已有众多的算法,有些已应用于交叉路口、车库管理、路口收费、高速公路等场合。由于需适应各种复杂背景,加之要识别的车辆种类繁多,颜色变化多端,以及检测时要适应不同天气变化导致的不同光照条件,因此,目前的系统都或多或少地存在一些问题。但随着计算机性能的提高和计算机视觉理论及技术的发展,这种技术必将日趋成熟。
车牌的定位与识别技术,总体来说是图像处理技术与车牌本身特点的有机结合,当然也包括小波分析、神经网络、数学形态学、模糊理论等数学知识的有效运用[2]。
本课题是对汽车图像进行分析,从算法角度来研究车牌的定位与识别。
1.2车辆牌照识别系统原理