前言:中文期刊网精心挑选了识别技术范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
识别技术范文1
英文名称:China Auto-ID
主管单位:国家质量监督检验检疫总局
出版周期:双月刊
出版地址:北京市
语
种:中文
开
本:16开
国际刊号:1673-6362
国内刊号:11-5503/TP
邮发代号:
发行范围:国内外统一发行
创刊时间:2006
期刊收录:
核心期刊:
期刊荣誉:
联系方式
识别技术范文2
摘 要:人脸识别技术是当今模式识别和人工智能领域的一个重要研究方向,对于维护国家安全和社会稳定、打击各类犯罪活动具有十分重大的意义。本文介绍了人脸识别技术的概念、发展历史及常用人脸识别方法。并探讨了人脸识别面临的难题,最后对人脸识别未来的发展和应用做一个简要的展望。
关键词:人脸识别;数字图像处理;特征脸
引言:人脸是人类视觉交互中最重要的模式,人脸识别技术(FRT)是模式识别和人工智能领域的一个前沿课题。在新兴的信息安全应用领域,人脸识别技术提供了一种更为安全可靠易用的身份鉴别手段,从而提升整个网络信息系统的安全性能。
1 人脸识别技术概述
人脸识别技术就是通过计算机提取人脸的特征,并根据这些特征进行身份验证的一种技术。人脸与人体的其他生物特征一样与生俱来,它们所具有的唯一性和不易被复制的良好特性为身份鉴别提供了必要的前提。同其他生物特征识别技术相比,人脸识别技术具有操作简单、结果直观、隐蔽性好的优越性.科技情报开发与经济,2008,18(21):155-157.
识别技术范文3
【关键词】语音识别 语言模型 声学模型 人工智能
使用智能手机的朋友们都会对语音助手产生极大的兴趣,不管是微软的Cortana,还是苹果的Siri,都是将语音识别融入现代技术的典范。Z音识别是解决机器“听懂”人类语言的一项技术,也是人工智能重要部分。
语音识别技术(speech recognition),也被称为自动语音识别 (ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而前者的目标是语音中所包含的词汇内容。
探究语音识别技术的框架、应用与发展有利于全面了解语音识别。本文将从语音识别简介、主流语言识别框架以及语言识别近年来的发展三个方面探究语音识别。
1 语音识别简介
1.1 传统语言识别技术发展
对语音识别技术的研究可以追述到上世纪五十年代,1952年贝尔研究所Davis等人研究成功了世界上第一个能识别10个英文数字发音的实验系统,开创了语音识别的先河。上世纪六十年代,人工神经网络被引入了语音识别。上世纪七十年代以后,大规模的语音识别在小词汇量、孤立词的识别方面取得了实质性的进展。传统语音识别技术最大突破是隐式马尔可夫模型的应用,这一模型极大提高了语音识别的准确率[1]。
1.2 语言识别的应用
作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别一直受到各国科学界的广泛关注。如今,随着语音识别技术的研究的突破,其对计算机发展和社会生活的重要性日益凸现出来。在现实生活中,语音识别技术的应用相当广泛,它改变了人与计算机交互的方式,使计算机更加智能。和键盘输入相比,语音识别更符合人的日常习惯;使用语言控制系统,相比手动控制,语音识别更加方便快捷,可以用在工业控制、智能家电等设备;通过智能对话查询系统,企业可以根据用户的语音进行操作,为用户提供自然、友好的数据检索服务。
2 语音识别框架
目前主流的语音识别框架可以分为以下几个模块:信号处理,特征提取,声学模型,语言模型,解码器。
2.1 信号处理
信号处理模块是对语音文件进行预处理。声音是一种纵波,在识别语音时,输入为WMV,MP3等格式的文件会被转换成非压缩的纯波文件wav格式。然后在进行语音识别前,需要检测该文件中的语音信号,该技术被称之为语音活性检测[2]。使用语言活性检测技术可以有效降低噪音,去除非语音片段,提高语音识别的准确率。经典的语音活性检测算法由如下步骤组成:
(1)使用spectral subtraction等方法对语言序列进行降噪。(2)将输入信号的分成区块并提取特征。(3)设计分类器判断该区块是否为语音信号。
2.2 特征提取
特征提取目的是提取出语音文件的特征,以一定的数学方式表达,从而可以参与到后续模块处理中。在这一模块,首先要将连续的声音分成离散的帧。每一帧的时间既要足够长,使得我们能够判断它属于哪个声韵母的信息,若过短则包含信息过少;每一帧时间也要尽量短,语音信号需要足够平稳,能够通过短时傅里叶分析进行特征提取,过长则会使信号不够平稳。分帧时使用如下改进技术可以有效提高识别准确率:相邻的两帧有所重叠减少分割误差,将与临近帧之间的差分作为额外特征,将多个语音帧堆叠起来。通过分帧处理,连续的语音被分为离散的小段,但还缺乏数学上的描述能力,因此需要对波形作特征提取。常见的方法是根据人耳的生理特征,把每一帧波形变换成一个多维向量。因此,这些向量包含了这些语音的内容信息。该过程被称为声学特征提取,常见的声学特征有MFCC、CPE、LPC等。
MFCC是目前最常用、最基本的声学特征,提取MFCC特征可以分为如下四个步骤:首先对每一帧进行傅里叶变换,取得每一帧的频谱。再把频谱与图1中每个三角形相乘并积分,求出频谱在每一个三角形下的能量,这样处理可以减少数据量,并模仿人耳在低频处分辨率高的特性。然后取上一步得到结果的对数,这可以放大低能量处的能量差异。最后对得到的对数进行离散余弦变换,并保留前12~20个点进一步压缩数据。通过特征提取,声音序列就被转换为有特征向量组成的矩阵。
2.3 声学模型
声学模型是语音识别中最重要的组成部分之一,其用于语音到音节概率的计算。目前主流的方法多数采用隐马尔科夫模型,隐马尔可夫模型的概念是一个离散时域有限状态自动机。
隐马尔可夫模型HMM如图2所示,是指这一马尔可夫模型的内部状态x1,x2,x3外界不可见,外界只能看到各个时刻的输出值y1,y2,y3。对语音识别系统,输出值通常就是从各个帧计算而得的声学特征,输入是由特征提取模块提取的特征。用HMM刻画语音信号需作出两个假设,一是内部状态的转移只与上一状态有关,另一是输出值Y只与当前状态X(或当前的状态转移)有关,这两个假设大大降低了模型的复杂度。HMM的打分、解码和训练相应的算法是前向算法、维特比算法和前向后向算法。
早期的声学模型使用矢量量化(Vector Quantification)的方法,使其性能受到VQ算法的极大影响。对于连续取值的特征应当采用连续的概率分布如高斯混合模型或混合拉普拉斯模型等。为了解决模型参数过多的问题,可以使用某些聚类方法来减小模型中的参数数量,提高模型的可训练性。聚类可以在模型层次,状态层次乃至混合高斯模型中每个混合的层次进行。
2.4 语言模型
语言模型音节到字概率的计算。 语言模型主要分为规则模型和统计模型两种。相比于统计模型,规则模型鲁棒性较差,对非本质错误过于严苛,泛化能力较差,研究强度更大。因此主流语音识别技术多采用统计模型。统计模型采用概率统计的方法来揭示语言单位内在的统计规律,其中N-Gram简单有效,被广泛使用。
N-Gram基于如下假设:第N个词的出现只与前面N-1个词相关,而与其它任何词都不相关,整句的概率即为各个词出现概率的乘积。词与词之间的概率可以直接从语料中统计N个词同时出现的次数得到。考虑计算量和效果之间的平衡,N取值一般较小,常用的是二元的Bi-Gram和三元的Tri-Gram。
2.5 解码器
解码器是语音识别系统的核心之一,其任务是对输入信号,根据声学、语言模型及词典,寻找能够以最大概率输出该信号的词串。在实践中较多采用维特比算法[3]搜索根据声学、语言模型得出的最优词串。
基于动态规划的维特比算法在每个时间点上的各个状态,计算解码状态序列对观察序列的后验概率,保留概率最大的路径,并在每个节点记录下相应的状态信息以便最后反向获取词解码序列。维特比算法在不丧失最优解的条件下,同时解决了连续语音识别中HMM模型状态序列与声学观察序列的非线性时间对准、词边界检测和词的识别,从而使这一算法成为语音识别搜索的基本策略。
维特比(Viterbi)算法的时齐特性使得同一时刻的各条路径对应于同样的观察序列,因而具有可比性,Beam搜索在每一时刻只保留概率最大的前若干条路径,大幅度的剪枝提高了搜索的效率。Viterbi-Beam算法是当前语音识别搜索中最有效的算法。
3 语音识别技术的发展
近几年来,特别是2009年以来,借助机器学习领域深度学习研究的发展,以及大数据语料的积累,语音识别技术得到突飞猛进的发展。
在模型方面,传统语音识别模型逐步被神经网络替代,使用神经网络可以更好地提取特征,拟合曲线。使用人工神经网络来提高语音识别性能的概念最早在80年代就提出了,但当时高斯混合模型在大词汇语音识别上表现得更好,因此人工神经网络并没有进行商业应用。随着相关技术的进一步发展,微软研究院利用深度神经网络建立了数千个音素的模型,比传统方法减少了16%的相对误差。其在建立起有超过660万神经联系的网络后,将总的语音识别错误率降低了30%,实现了语音识别巨大的突破[4]。
同时目前多数主流语言识别解码器采用了基于有限状态机的解码网络,该网络将语音模型、词典、声学共享音字集统一为大的解码网络,大幅度提高了解码速度。
在数据量上,由于移动互联网的急速发展,从多个渠道获取的海量语言原料为声学模型和语言模型的训练提供了丰富的资源,不断提升语音识别的准确率。
4 结语
语音是人们工作生活中最自然的交流媒介,所以语音识别技术在人机交互中成为非常重要的方式,语音识别技术具有非常广泛的应用领域和非常广阔的市场前景。而随着深度神经网络发展,硬件计算能力的提高,以及海量数据积累,语音识别系统的准确率和实用性将得到持续提高。
参考文献:
[1]S基百科编者.语音识别[G/OL].维基百科,2016(20160829)[2016-08-29].
[2]维基百科编者.语音活性检测[G/OL].维基百科,2016(20160629)[2016-06-29].
[3]维基百科编者.维特比算法[G/OL].维基百科,2016(20160920)[2016-09-20].
[4] Dahl G E, Yu D, Deng L, et al. Context-dependent pre-trained deep neural networks for large-vocabulary speech recognition[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2012, 20(1):30-42.
识别技术范文4
目前,应用最广泛的自动识别技术大致可以分为光学技术和无线电技术两个方面。本文主要介绍自动识别技术在无线电技术方面的应用。
1射频识别技术简介
20世纪80年代,由于大规模集成电路技术的成熟,射频识别系统的体积大大缩小,使得射频识别技术进入实用化的阶段,成为一种成熟的自动识别技术。
射频识别技术是利用射频方式进行非接触双向通信,以达到识别目的并交换数据。它与同期或早期的接触式识别技术不同。RFID系统的射频卡和读写器之间不用接触就可完成识别,因此它可在更广泛的场合中应用。
典型的射频识别系统包括射频卡和读写器两部分。
射频卡是将几个主要模块集成到一块芯片中,完成与读写器的通信。芯片上有EEPROM用来储存识别码或其它数据。EEPROM容量从几比特到几万比特。芯片仅需连接天线(和电池),可以作为人员的身份识别卡或货物的标识卡。卡封装可以有不同形式,比如常见的信用卡及小圆片的形式等。与条码、磁卡、IC卡等同期或早期的识别技术相比,射频卡具有非接触、工作距离长、适于恶劣环境、可识别运动目标等优点。
在多数RFID系统中,读写器在一个区域内发射电磁波(区域大小取决于工作频率和天线尺寸)。卡片内有一个LC串联谐振电路,其频率与读写器发射的频率相同。当射频卡经过这个区域时,在电磁波的激励下,LC谐振电路产生共振,从而使电容内有了电荷。在这个电容的另一端,接有一个单向导通的电子泵,将电容内的电荷送到另一个电容内储存。当所积累的电荷达到2V时,此电容可作为电源为其它电路提供工作电压,将卡内数据发射出去或接取读写器的数据。读写器接收到卡的数据后,解码并进行错误校验来决定数据的有效性,然后,通过RS232、RS422、RS485或无线方式将数据传送到计算机网络。简单的RFID产品就是一种非接触的IC卡,而复杂的RFID产品能和外部传感器接口连接来测量、记录不同的参数,甚至可与GPS系统连接来跟踪物体。
工作原理如图1所示。
2射频识别技术的分类
射频识别技术主要按以下四种方式分类。
(1)工作频率
根据工作频率的不同可分为低频和高频系统。①低频系统一般指其工作频率小于30MHz的系统。其基本特点是:射频卡的成本较低、标签内保存的数据量较少、阅读距离较短(无源情况,典型阅读距离为10cm)、射频卡外形多样(卡状、环状、钮扣状、笔状)、阅读天线方向性不强等。低频系统多用于短距离、低成本的应用中,如多数的门禁控制、动物监管、货物跟踪。②高频系统一般指其工作频率大于400MHz的系统。高频系统的基本特点是射频卡及读写器成本均较高、卡内保存的数据量较大、阅读距离较远(可达几m~十几m)、适应物体高速运动性能好、外形一般为卡状、阅读天线及射频卡天线均有较强的方向性。高频系统多应用于需要较长的读写距离和高的读写速度的场合,像火车监控、高速公路收费等系统。
(2)射频卡
根据射频卡的不同可分成可读写(RW)卡、一次写入多次读出(WORM)卡和只读(RO)卡三种。RW卡一般比WORM卡和RO卡贵得多,如电话卡、信用卡等。一般情况下改写数据所花费的时间远大于读取数据所花费的时间(常规为改写所花费的时间为s级,阅读花费的时间为ms级)。WORM卡是用户可以一次性写入的卡,写入后数据不能改变,且比RW卡要便宜。RO卡存有一个唯一的号码,不能逐改,保证了安全性。RO卡最便宜。
(3)射频卡的有源与无源
射频卡可分为有源及无源两种。有源射频卡使用卡内电池的能量、识别距离较长,可达十几m,但是它的寿命有限(3~10年),且价格较高;无源射频卡不含电池,利用读写器发射的电磁波提供能量,重量轻、体积小、寿命长、很便宜,但它的发射距离受限制,一般是几十cm,且需要读写器的发射功率大。
(4)调制方式
根据调制方式的不同还可分为主动式和被动式。①主动式的射频卡用自身的射频能量主动地发送数据给读写器。②被动式的射频卡,使用调制散射方式发射数据。它必须利用读写器的载波调制自己的信号,适宜在门禁或交通的应用中使用。因为读写器可以确保只激活一定范围之内的射频卡。
目前使用的多数系统中,一次只能读写一个射频卡。射频卡之间要保持一定距离,确保一次只能有一个卡在读写区域内。读写距离长,射频卡之间的距离就要大,应用起来很不方便。现在的射频卡具有防碰撞的功能,这对于RFID来说十分重要。所谓碰撞是指多个射频卡进入识别区域时信号互相干扰的情况。具有防碰撞性能的系统可以同时识别进入识别距离的所有射频卡,它的并行工作方式大大提高了系统的效率。
3国际射频识别技术发展状况
射频识别技术在国外发展得很快。RFID产品种类很多,像德州仪器、Motoro1a、Philips、Microchip等世界著名厂家都生产RFID产品。他们的产品各有特点,自成系列。射频识别技术被广泛应用于工业自动化、商业自动化、交通运输控制管理等众多领域。如澳大利亚将它的RFID产品用于澳机场旅客行李管理中并发挥了出色的作用;瑞士国家铁路局在瑞士的全部旅客列车上安装RFID自动识别系统,调度员可以实时掌握火车运行情况,不仅利于管理,还大大减小了发生事故的可能性;德国BMW公司将射频识别系统应用在汽车生产流水线的生产过程控制中等。
据有关权威数据显示,射频识别产品在全世界的销量以每年25.3%的比例增长。由此可见,射频识别技术具有广阔的市场前景。
4射频识别技术在我国的发展
我国政府在1993年制定的金卡工程实施计划,是一个旨在加速推动我国国民经济信息化进程的重大国家级工程,由此各种自动识别技术的发展及应用十分迅猛。现在,射频识别技术作为一种新兴的自动识别技术,也将在中国很快地普及。
目前,我国的射频识别技术在下列几种应用中发展前景较好。当然,这里仅仅罗列了射频识别技术应用的一部分。任何一种技术如果得到普及,都将会孕育一个庞大的市场。射频识别将是未来一个新的经济增长点。
4.1安全防护领域
(1)门禁保安
将来的门禁保安系统均可应用射频卡。一卡可以多用。比如,可以作工作证、出入证、停车卡、饭店住宿卡甚至旅游护照等,目的都是识别人员身份、安全管理、收费等等。好处是简化出入手续、提高工作效率、安全保护。只要人员佩戴了封装成ID卡大小的射频卡、进出入口有一台读写器,人员出入时自动识别身份,非法闯入会有报警。安全级别要求高的地方、还可以结合其它的识别方式,将指纹、掌纹或颜面特征存入射频卡。
公司还可以用射频卡保护和跟踪财产。将射频卡贴在物品上面,如计算机、传真机、文件、复印机或其它实验室用品上。该射频卡使得公司可以自动跟踪管理这些有价值的财产,可以跟踪一个物品从某一建筑离开,或是用报警的方式限制物品离开某地。结合GPS系统利用射频卡,还可以对货柜车、货舱等进行有效跟踪。
(2)汽车防盗
这是RFID较新的应用。目前已经开发出了足够小的、能够封装到汽车钥匙当中含有特定码字的射频卡。它需要在汽车上装有读写器,当钥匙插入到点火器中时,读写器能
够辨别钥匙的身份。如果读写器接收不到射频卡发送来的特定信号,汽车的引擎将不会发动。用这种电子验证的方法,汽车的中央计算机也就能容易防止短路点火。
另一种汽车防盗系统是,司机自己带有一射频卡,其发射范围是在司机座椅45~55cm以内,读写器安装在座椅的背部。当读写器读取到有效的ID号时,系统发出三声鸣叫,然后汽车引擎才能启动。该防盗系统还有另一强大功能:倘若司机离开汽车并且车门敞开引擎也没有关闭,这时读写器就需要读取另一有效ID号;假如司机将该射频卡带离汽车,这样读写器不能读到有效ID号,引擎就会自动关闭,同时触发报警装置。
(3)电子物品监视系统
电子物品监视系统(ElectronicArticleSurveillance,EAS)的目的是防止商品被盗。整个系统包括贴在物体上的一个内存容量仅为1比特(即开或关)的射频卡,和商店出口处的读写器。射频卡在安装时被激活。在激活状态下,射频卡接近扫描器时会被探测到,同时会报警。如果货物被购买,由销售人员用专用工具拆除射频卡(典型的是在服装店里),或者用磁场来使射频卡失效,或者直接破坏射频卡本身的电特性。EAS系统已被广泛使用。据估计每年消耗60亿套。
4.2商品生产销售领域
(1)生产线自动化
用RFID技术在生产流水线上实现自动控制、监视,提高生产率,改进生产方式,节约了成本。举个例子以说明在生产线上应用RFID技术的情况。
用于汽车装配流水线。德国宝马汽车公司在装配流水线上应用射频卡,以尽可能大量地生产用户定制的汽车。宝马汽车的生产是基于用户提出的要求式样而生产的。用户可以从上万种内部和外部选项中,选定自己所需车的颜色、引擎型号和轮胎式样等。这样一来,汽车装配流水线上就得装配上百种式样的宝马汽车,如果没有一个高度组织的、复杂的控制系统是很难完成这样复杂的任务的。宝马公司在其装配流水线上配有RFID系统,使用可重复使用的射频卡。该射频卡上带有汽车所需的所有详细的要求,在每个工作点处都有读写器,这样可以保证汽车在各个流水线位置,能毫不出错地完成装配任务。
(2)仓储管理
将RFID系统用于智能仓库货物管理,能有效地解决与货物流动有关的信息管理,不但增加了处理货物的速度,还可监视货物的一切信息。射频卡贴在货物所通过的仓库大门边上,读写器和天线都放在叉车上,每个货物都贴有条码,所有条码信息都被存储在仓库的中央计算机里,与该货物有关的信息都能在计算机里查到。当货物出库时,由另一读写器识别并告知中央计算它被放在哪个拖车上。这样,管理中心可以实时地了解到已经生产了多少产品和发送了多少产品。
(3)产品防伪
伪造问题在世界各地都是令人头疼的问题,将射频识别技术应用在防伪领域有它自身的技术优势。防伪技术本身要求成本低,且难于伪造。射频卡的成本就相对便宜,而芯片的制造需要有昂贵的芯片工厂,使伪造者望而却步。射频卡本身有内存,可以储存、修改与产品有关的数据,利于销售商使用;体积十分小、便于产品封装。像电脑、激光打印机、电视等产品上都可使用。
(4)RFID卡收费
国外的各种交易大多利用各种卡来完成,而我国普遍采用现金交易。现金交易不方便也不安全,还容易出现税收的漏洞。目前的收费卡多用磁卡、IC卡,而射频卡也开始占据市场。原因是在一些恶劣的环境中,磁卡、IC卡容易损坏,而射频卡则不易磨损,也不怕静电及其它情况;同时,射频卡用起来方便、快捷,甚至不用打开包,在读写器前摇晃一下,就完成收费。另外,还可同时识别几张卡.并行收费,如公共汽车上的电子月票。我国大城市的公共汽车异常拥挤、环境条件差,射频卡的使用有助于改善这种情况。
4.3管理与数据统计领域
(1)畜牧管理
该领域的发展起步于赛马的识别,是用小玻璃封装的射频卡植于动物皮下。射频卡大约10mm长,内有一个线圈,约1000圈的细线绕在铁氧体上,读写距离是十几cm。从赛马识别发展到了标识牲畜。牲畜的识别提供了现代化管理牧场的方法。
(2)运动计时
在马拉松比赛中,由于人员太多,有时第一个出发的人同最后一个出发的人能相隔40分钟。如果没有一个精确的计时装置,就会出现差错。射频卡应用于马拉松比赛中,运动员在自己的鞋带上很方便地系上射频卡,在比赛的起跑线和终点线处放置带有微型天线的小垫片。当运动员越过此垫片时,计时系统便会接收运动员所带的射频卡发出的ID号,并记录当时的时间。这样,每个运动员都会有自己的起始时间和结束时间,不会出现不公平竞争的可能性了。在比赛路线中,如果每隔5km就设置这样一个垫片,还可以很方便地记录运动员在每个阶段所用的时间。
RFID还可应用于汽车大奖赛上的精确计时。在跑道下面按照一定的距离间隔埋入一系列的天线,这些天线与读写器相连,而射频卡安装到赛车前方。当赛车每越过一个天线时,赛车的ID号和时间就被记录下来,并存储到中央计算机内。这样到比赛结束时,每个参赛选手将会有一个准确的结果。
4.4交通运输领域
(1)高速公路自动收费及交通管理
高速公路自动收费系统是射频识别技术最成功的应用之一。目前,中国的高速公路发展非常快,而高速公路收费却存在一些问题:一是在收费站口,许多车辆要停车排队,成为交通瓶颈问题;二是少数不法的收费员贪污路费,使国家损失了相当的财政收入。RFID技术应用在高速公路自动收费上,能够充分体现它非接触识别的优势——让车辆高速通过收费站的同时自动完成收费,同时可以解决收费员贪污路费及交通拥堵的问题。利用射频识别技术的不停车高速公路自动收费系统是将来的发展方向;人工收费,包括IC卡的停车收费方式,终将会被淘汰。预计在未来10年内,高速公路自动收费系统将有数十亿元的需求。
在城市交通方面,解决交通日趋拥挤问题不能只依赖于修路。加强交通的指挥、控制、疏导,提高道路的利用率,深挖现有交通潜能也是非常重要的;而基于RFID技术的交通管理系统可实现自动查处违章车辆,记录违章情况。另外,公共汽车站实时跟踪指示公共汽车到站时间及自动显示乘客信息,会给乘客带来很大的方便。
(2)火车和货运集装箱的识别
在火车运营中,使用RFID系统很大的优势在于:火车是按既定路线运行的,因此肯定要通过设定的读写器的地点。通过读到的数据,能够得到火车的身份、监控火车的完整性,以防止遗漏在铁轨上的车厢发生撞车事故,同时能在车站将车厢重新编组。起初的努力是用超音波和雷达测距系统读出车厢侧的条码,现在被RFID系统取代。射频卡一般安在车厢顶边,读写器安在铁路沿线,就可得到火车的实时信息及车厢内装的物品信息。
目前,射频自动识别系统的安装遍布全国14个铁路局。2001年3月1日,铁道部正式联网启用车次车号自动识别系统,为自备车企业、合资铁路和地方铁路实现信息化智能运输管理提供了重要良机。
识别技术范文5
1指纹采集和处理
目前指纹光学采集技术已十分成熟且使用广泛,其具有使用时间长、温度变化适应能力强、分辨率高和价格便宜等特点。企业大部分购置笔记本电脑办公,且多数配备指纹识别器。对于未配置指纹识别器或台式电脑也可通过配置外置USB指纹识别器(或指纹采集仪)来实现指纹数据采集和识别。在首次登录访问受保护的信息系统时需要完成用户注册,注册过程需采集用户指纹样本信息,并将用户帐号和指纹样本信息进行关联保存到指纹数据库中,以便身份鉴别匹配时提取指纹样本。为了提高方案的可用性,避免因个别手指损伤而导致不能正常通过鉴别登录信息系统,一个用户帐号可同时绑定多个手指指纹样本信息。在注册和登录时通过指纹识别设备采集的指纹为指纹原始图像,需经过专业的指纹图像处理技术处理以提高指纹图像质量和数据准确性。目前国内外主要的指纹图像技术处理包括指纹图像增强、指纹图像平滑处理、二值化处理和细化处理等步骤。
1.1指纹图像增强处理指纹图像增强处理是指纹识别非常重要的过程,其效果的好坏直接影响指纹特征提取的正确性。该过程目的主要针对因手指损伤引起的脊线中断和汗、水渍等引起的脊线谷线不明显、脊线粘连、污迹等问题,利用指纹图像增强算法消除脊线中断,增强指纹脊谷对比度,使得指纹图像更加清晰,提高指纹特征值提取的准确性。
1.2指纹图像平滑处理指纹图像平滑处理是从指根据纹图像的纹形特征,分析指纹图像的灰度分布规律,通过基于方向均值滤波的指纹图像平滑算法处理,让采集到的指纹图像脊谷线灰度级变得均匀一致。
1.3指纹图像二值化处理通过指纹识别器采集到的指纹图像中,各象素的灰度是不同的,并按一定的梯度分布。指纹图像二值化处理是指通过设定灰度级阈值,判定指纹图像上的像素是不是嵴线上的点,将灰度指纹图像变换为由0和1表示的黑白图像。指纹图像二值化后,可大大减少数据量,并可简化指纹图像细化处理。
1.4指纹图像细化处理指纹图像细化处理是将指纹嵴线的图像宽度降为单个像素的宽度,得到指纹嵴线的骨架纹形图像的过程。这个过程进一步减少了指纹图像数据量,清晰化了嵴线形态,方便对指纹特征提取,并提高特征提取的准确性。
2指纹特征的提取和匹配
指纹图像经过技术处理后下一步进行指纹特征提取,指纹的验证匹配过程是通过对比指纹特征来完成,本方案核心就是通过指纹的验证匹配过程完成用户身份的鉴别。指纹识别技术定义了指纹的两类特征来进行指纹的验证:总体特征和局部特征。在考虑局部特征的情况下,只要满足13个指纹特征点重合,就可以认定为同一个指纹。指纹的总体特征包括:纹形(环型,弓型,螺旋型)、模式区、核心点、三角点、式样线、纹数。指纹的局部特征是指指纹上的节点的特征,这些具有某种特征的节点称为特征点,包括:特征点的类型(脊端点、分叉点、歧点、孤立点、环点、短纹)、方向、曲率、位置。基于指纹识别技术的身份鉴别系统核心为指纹图像特征提取,在所有指纹的局部特征中脊端点及分叉点(图3(b))是指纹细化图像的主要特征,本文利用这两种主要特征创建指纹特征向量。经过二值化后的指纹图像像素点的灰度值只有(0表示背景点灰度)和(1表示纹线点灰度),假设被检点为P,其相邻的点分别由P1,P2…,P(8图3(a))表示,则可通过3×3的向量组记录被检点P的8个相邻点灰度值,设Cn(P)为交叉数,Sn(P)为像素8相邻纹线点数,根据3×3的向量组计算交叉数的公式为。具体的算法为:(1)以被检测点P为起点,对P的8个相邻点沿指纹脊线进行搜索,当公式计算结果满足脊端点与分叉点判定时(图4)分别进行标记;(2)以同样的方法对步骤(1)中已标记的点的8个相邻点进行计算标记,直到所有的指纹像素点完成标记或无法再组成8个相邻点向量组。系统终端在采集到指纹图像后处理并提取指纹特征,根据指纹特征分类分析并记录相应的特征数据,指纹特征数据在注册过程中将作为指纹样本保存到指纹数据库。在用户登录受保护的信息系统时,采集的指纹经过特征提取后和保存在指纹数据库中的指纹特征样本进行逐项对比,通过用户身份鉴别的方可访问信息系统。
3指纹信息加密传输和存储
系统终端采集到的指纹信息在经过提取指纹特征后,指纹特征信息需经过网络传输和指纹样本保存完成注册和指纹身份鉴别。在指纹特征信息传输和存储过程中存在一定的安全隐患,为了防止指纹信息被窃取或恶意篡改,本文增加了加密解密模块加强用户指纹信息的安全性和保密性。本方案中采用RSA非对称公钥加密技术,该方式不需要进行密钥传递,极大的保证了密钥的安全。所有经过网络传输的指纹信息都经过了RSA加密技术加密,且指纹数据库中保存的也是经过加密后的指纹信息。
4双重身份鉴别流程
本文提出的基于指纹识别技术的双重身份鉴别方案中对于指纹的使用主要分为2个场景,用户指纹信息注册和用户登录系统指纹鉴别。因用户指纹信息注册较用户登录指纹鉴别流程简单,固不再阐述。用户登录系统指纹鉴别流见下图:(1)用户在终端输入用户信息:用户账号、静态密码和指纹信息;(2)指纹被采集后经过指纹图像处理,然后分析指纹特征信息并完成指纹特征信息提取,最后对指纹特征信息进行加密;(3)系统客户端向应用服务器发出登录信息请求,携带经过加密后的用户信息和指纹信息;(4)应用服务器收到登录请求后直接向指纹鉴别服务器发出鉴别请求,携带加密的用户信息和指纹信息;(5)鉴别服务器收到请求后对用户信息进行解密,根据用户账号查询指纹数据库和用户账号绑定的指纹注册样本。首先对用户账号和静态密码进行验证,完成第一次鉴别。然后解密用户注册的指纹样本并逐一和请求的指纹特征信息进行匹配,完成第二次鉴别。两次身份鉴别通过后响应应用服务器通过身份鉴别,同时保存用户登录日志到数据库;(6)应用服务器收到身份鉴别通过响应后通知系统终端并允许登录。
5安全性分析
在未具备双重身份鉴别能力的系统中,使用静态密码登录存在密码被窃取或泄露的风险,系统会被恶意操作或信息泄露。本文提出的双重身份鉴别采用了生物识别技术,利用了指纹识别的方式完成用身份鉴别。因人体指纹的生物特征具有稳定、唯一和准确等特性,以及指纹具有易携带、易采集、不易丢失、不可复制等特点,可百分之百的对用户身份进行鉴别,同时保存的用户登录指纹日志可作为不可抵赖证据。所有用户指纹信息的传输和存储都经过加密处理,确保了用户指纹信息不被泄露和窃取。
6结论
识别技术范文6
关键词:TVM纸币处理模块;纸币面值识别;粘连字符分割;结构识别
中图分类号:U231+.1 文献标识码:A 文章编号:
前言
随着科技的发展,很多行业都出现了基于人民币纸币识别技术的智能化无人收费系统,节省了大量的人力资源。人民币纸币的识别技术不仅可以应用在自动售货售票上,也可以应用到银行的自动存取款机,手机营业厅的自动交费机等,在地铁AFC系统中TVM机上也使用了人民币纸币识别技术。AFC系统的全称是Automatic Fare Collection System,是一种由计算机集中控制的自动售票(包括半自动售票)、自动检票以及自动收费和统计的封闭式自动化网络系统。
目前已有的识别方法主要是利用统计方法进行识别,如尺寸比较法、模板匹配、人工神经网络等。人民币纸币在流通中不可避免的会沾染污迹或磨损。这些方法虽然能快速识别出纸币的面值,但纸币上的微小污迹或其他图像噪声对识别结果影响很大,甚至出现无法识别或错误识别的现象。为此提出以提高识别准确率为目的的识别方法,使用粘连字符分割和句法识别的方法来识别纸币的面值。
1 西安地铁二号线TVM纸币处理模块
纸币处理模块是识别乘客投入到自动售票机的纸币的机械模块,安装在TVM上,可无方向性的识别当前流通的所有币种的人民币纸币。二号线的自动售票机中采用G&D BIM2020(德国捷德)系列纸币识别器。纸币识别器对纸币的放入无方向性要求,无论乘客如何投入纸币,都不影响纸币识别器对纸币的识别功能,经过识别后合法的纸币将被保存到纸币钱箱,不符合参数指标的纸币通过退纸币口返还给乘客,并有明确标识指示,由TVM机系统完成声音提示。纸币识别器识别功能完整,拓展性强,适应今后人民币防伪技术的发展趋势。
2纸币面值识别技术
2.1 面向识别
要进行人民币纸币面值识别,首先要确定人民币纸币的面向。只有确定出面向,才能准确定位纸币要识别的特征区域。面向可分为:正面正向、正面倒向、反面正向和反面倒向。在进行识别前应先进行预处理,如倾斜校正、滤波等处理。在面向识别中,采用目前常用的方法,即根据灰度来确定。这种方法识别速度快,准确率高。对纸币图像分割成9块区域,根据每一块的灰度进行比较,可以得出纸币的面向。
2.2面值识别
人民币纸币识别对准确率要求很高,识别算法应在保证高识别率的基础上尽可能的提高识别速度。提出的识别方法将粘连字符分割应用到纸币识别中并采用句法方法进行识别,这种方法受纸币的污迹影响很小,即使有一些微小磨损或污迹也能准确识别。
2.2.1字符提取及分割
以50元面值的人民币为例,对数字50定位后需要将两个字符分割开,而5和0连接的很紧密,粘连在一起,直接分割将损害字符的完整。因此需要使用特殊的处理算法。先将数字字符滤波并进行边缘提取,得到50的空心字符,充填后进行细化,得到图1:
图1细化后图像图2分割后数字5和0的图像图3 图4
此时字符依然是粘连的。在二值图像中,白色像素点的值为1,黑色像素点值为0。对图像每一列找出最上端为1的点和最下端为1的点,行数相减,得到差值K。最上端为1的点为,最下端为1的点为,。然后从开始向下,把到之间的点的值都改为1,此时字符图像已经分离,可以轻易的将字符分割开。分割后也可以做一下简单的去毛刺处理。如图2所示,是被分割出来的字符5和0。对字符的识别,这里采用结构识别的方法。
2.2.2字符的识别
将字符图像分割成四个象限,如图3所示,按几何的方法对象限排序,即右上角为第一象限,左上角为第二象限,左下角为第三象限,右下角为第四象限。之后判断每个象限的笔画。根据笔画的不同,列出代表笔画特征的表格,如图4,可以得出如下结果:
结构描述格式为:是否空心;第一象限笔画;第二象限笔画;第三象限笔画;第四象限笔画。
数字0可以描述为:19876;数字1可以描述为:03333;
数字2可以描述为:05842;数字5可以描述为:02425;
对要识别的数字,将其描述出来的字符串进行匹配识别。对字符串进行匹配,就是对两个分别具有m和n个符号的字符串X和Y,衡量他们之间的相似度,具体定义为:将字符串X变换成Y需要的字母编辑次数。将描述要识别的数字的字符串设为X,需要匹配的模板字符串为Y。采用LevenShtein距离法即编辑距离算法,以矩阵的形式给出将X变成Y的所有可能编辑的操作,然后根据这个矩阵算出最终结果。将表述要被识别的字符的字符串X与其他模板字符串依次匹配,算出LevenShtein距离,距离最小的,就是符合匹配的字符。
3试验结果
下载的不同面值纸币图像共50张,包括第五版及新第五版人民币纸币的正面和反面图像,其中绝大多数是流通时间较长的纸币。在MATLAB 7.0中仿真,对纸币图像进行识别。其中正确识别49张,错误识别1张。错误的原因是该纸币破损和污迹比较大,已经影响到正常的流通。试验中对可以正常流通的纸币,即使有一些小的污迹和破损,也能正确的识别。
4结论
论文中的识别方法能很好的克服字符上的污迹影响识别率的问题,同时也很好的解决了字符粘连而无法分割的问题。如字符上沾有污迹,在细化处理的时候可以很好的弱化污迹带来的影响,在用结构方法进行识别的时候可以尽可能的排除污迹的影响,达到准确识别的目的。文中的方法把统计识别和句法识别方法相结合,实验结果表明,在该方法下对不同面值的纸币进行识别,识别率可以达到99%以上,因此该方法有很好的实用性。
参考文献