前言:中文期刊网精心挑选了匹配算法论文范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
匹配算法论文范文1
>> 算法与模型 快速图像匹配算法及其水下导航应用 刍议华帝战略选择与匹配 入侵检测模式匹配算法的研究与改进 论文相似度匹配算法的研究与实现 字符串匹配算法比较与分析 正向最大匹配分词算法的分析与改进 基于模拟退火算法的P2P借贷平台的债权匹配模型 基于轮廓特征点的三维模型相似性匹配算法 一种基于语言学特征的本体匹配改进算法 动作与音乐的节奏特征匹配模型研究 基于SIFT算法与RANSAC算法的X射线图像匹配研究 电影语言与影片风格的匹配问题 基于启发式算法的品牌模型的选择 软件可靠性模型选择的SRMS算法 双目立体视觉区域局部匹配算法的改进及其实现 软件工程过程模型及其选择 混合Copula模型选择及其应用 模式匹配查询算法研究 指纹快速匹配算法研究 常见问题解答 当前所在位置:l 德国
[4]
ZAKI T, ESSAADY Y, MAMMASS D, et al. A hybrid method ngramsTFIDF with radial basis for indexing and classification of Arabic document [J]. International Journal of Software Engineering and Its Applications, 2014, 8(2): 127-144.
[5]
SIDOROV G, VELASQUEZ F, STAMATATOS E, et al. Syntactic dependencybased ngrams as classification features [C]// MICAI 2012: Proceedings of the 11th Mexican International Conference on Artificial Intelligence, LNCS 7630. Berlin: Springer, 2013: 1-11.
[6]
YI Y, GUAN J, ZHOU S. Effective clustering of microRNA sequences by ngrams and feature weighting [C] // Proceedings of the 2012 IEEE 6th International Conference on Systems Biology. Piscataway: IEEE, 2012: 203-210.
[7]
BOURAS C, TSOGKAS V. Enhancing news articles clustering using word ngrams [C] // DATA 2013: Proceedings of the 2nd International Conference on Data Technologies and Applications. London: dblp Computer Science Bibliography, 2013: 53-60.
[8]
GHANNAY S, BARRAULT L. Using hypothesis selection based features for confusion network MT system combination [C] // EACL 2014: Proceedings of the 3rd Workshop on Hybrid Approaches to Translation (HyTra). Stroudsburg: Association for Computational Linguistics, 2014: 2-6.
[9]
SIDOROV G, VELASQUEZ F, STAMATAOS E, et al. Syntactic ngrams as machine learning features for natural language processing [J]. Expert Systems with Applications, 2014, 41(3): 853-860.
[10]
HAN Q, GUO J, SCHTZE H. CodeX: combining an SVM classifier and character ngram language models for sentiment analysis on Twitter text [C]// SemEval 2013: Proceedings of the Second Joint Conference on Lexical and Computational Semantics (*SEM), Volume 2: Proceedings of the Seventh International Workshop on Semantic Evaluation. Stroudsburg: Association for Computational Linguistics, 2013: 520-524.
http://p.nus.edu.sg/~antho/S/S13/S13-2086.pdf
[11]
BESPALOY D, BAI B, QI Y, et al. Sentiment classification based on supervised latent ngram analysis [C] // CIKM 11: Proceedings of the 20th ACM International Conference on Information and Knowledge Management. New York: ACM, 2011: 375-382.
[12]
MILLER Z, DICKINSON B, HU W. Gender prediction on Twitter using stream algorithms with ngram character features [J]. International Journal of Intelligence Science, 2012, 2(4A): 143-148.
[13]
WRIGHT J, LLOYDTHOMAS H. A robust language model incorporating a substring parser and extended ngrams [C] // ICASSP 1994: Proceedings of the 1994 IEEE International Conference on Acoustics, Speech, and Signal Processing. Washington, DC: IEEE Computer Society, 1994: 361-364.
[14]
HACIOGLU K, WARD W. Dialogcontext dependent language modeling combining ngrams and stochastic contextfree grammars [C] // ICASSP 2001: Proceedings of the 2001 IEEE International Conference on Acoustics, Speech, and Signal Processing. Washington, DC: IEEE Computer Society, 2001, 1: 537-540.
[15]
SIU M, OSTENDORF M. Variable ngrams and extensions for conversational speech language modeling [J]. Speech and Audio Processing, 2000, 1(8): 63-75.
[16]
ZHOU S, GUAN J, HU Y, et al. A Chinese document categorization system without dictionary support and segmentation processing [J]. Journal of Computer Research and Development, 2001, 38(7): 839-844. (周水庚,关佶红,胡运发,等.一个无需词典支持和切词处理的中文文档分类系统[J].计算机研究与发展,2001,38(7):839-844)
[17]
GAO Z, LI X. Feature extraction method based on sliding window application in text classification[J]. Science & Technology Information, 2008(34): 23-24. (高振峰,李锡祚.基于滑动窗口的特征提取方法在文本分类中的应用[J].科技信息:学术版,2008(34):23-24.)
[18]
PENG H, LONG F, DING C. Feature selection based on mutual information: criteria of maxdependency, maxrelevance, and minredundancy [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005, 27(8): 1226-1238.
匹配算法论文范文2
关键词:模式匹配;藏文音节;BM算法
中图分类号:TP393.08
藏文网络舆情是当前必须关注的舆论涌现与信息传播现象。近几年藏文网络舆情的数量呈现递增的增长趋势,网络信息的传播途径也呈现出多样化和复杂化。由于藏文网络的这些显著的特点,藏文信息处理相对滞后于英文和中文等,短时间内迅速的获取大量信息则不容易。另,目前藏文网站大量的涌现,网页数量巨大,处理起来速度相对慢,以往藏文网络舆情页面的统计都是基于手工统计实现的,效率低,很难对网络舆情的变化做出快速响应。模式匹配技术是内容过滤的核心技术,是计算机信息技术领域研究的基础问题之一,研究敏感词作为模式串的藏文模式匹配算法具有重要的研究意义。
BM算法是Boyer和Moore提出的一种字符串快速匹配算法。其基本思想是从右向左的把模式字符串同文本做比较。开始时仍是P的最左边与T的最左边对齐,当在某一趟比较中出现不匹配时,计算模式串右移的距离,把模式串向右移动该距离,再进行从右至左的匹配,同时应用到了两种启发式规则,即坏字符规则和好后缀规则,来决定向右跳跃的距离。
1 BM算法在藏文中的改进
藏文字符匹配中应用BM算法时,必须结合藏文文字特征,对BM算法进行改进以符合藏文的特点,提高匹配效率。
1.1 藏文文字结构及编码特点
藏文是由多个基本字符通过纵向叠加组成的字符串,构成一个完整藏文词素的基本单位是由藏文中的“音节分割符tsheg bar”来确定。一个或多个音节构成一个藏文词。音节,则是由音节分割符(音节点)或者其他藏文标点符号来划分的。一个音节中基字符是不能被省略的,其余相关构件都可以减少掉一个或几个这样仍然可以成一个音节(藏字)。七个构件中辅音字母在各部位依据藏文语法要求都有一定限制并不是所有的辅音字母都能够做前加字或者后加字等。
藏文在计算机中进行编码时一个音节需要用多个编码来表示,长度是不定的,这使得藏文在信息系统中的实现非常的麻烦。
(1)国内的几种藏文处理系统将藏文作为整字给予编码。将藏文垂直组合的部分作为一个处理单元编码(预先进行垂直组合,称为垂直预组合,垂直预组合后的字符称为藏文字丁),比如北大方正的报刊排版系统、华光藏文排版和同元藏文处理系统、激光照排系统等,这几个系统都有各自的编码方案这类编码采用双字节进行编码。这样,具有完整构件组合的藏字(即一个音节最多由4个字丁组成)。因此,国内的这几种编码方式一个音节就最多有4个编码。国家标准的扩A和扩B编码方案采用的是也是整字编码方案。
(2)国外的几种藏文编码方式也是采用整字编码方案,但是将带元音的字丁与元音分离后分别进行了编码。一个藏文音节最多就由5个字丁组成,即一个藏文音节由5个编码组成。
(3)ISO/IEC 10646藏文基本集是国际标准的编码方案,它完全将藏文视做拼音文字,字丁则是通过字母的动态组合实现的。即将一个藏文音节拆分成不同构件的独立的部分,对每一个构件都单独进行编码。采用国际标准后一个藏文音节最多由7个编码组成。基于不同编码的方式使得一个音节的编码个数不同,即使具有相同编码个数的同一种编码方案,由于编码范围不同编码值也将不一致。1997年,我国的藏文基本字符集被收入了国际标准ISO/IEC 10646《信息技术通用多八位编码字符集》。藏文编码标准得到了统一。故本匹配算法以小字符集国际编码标准(ISO/IEC 10646)编码进行讨论。
依据藏文采用小字符集编码中音节字的特点:
(1)具有完整构件的音节具有7个编码且每个编码都是两个字节,则对一个藏文音节字的表示则最多需要14个字节,最少也需要两个字节。匹配过程中只有在一个音节的所有字节都相等的情况下,一个藏文音节才匹配成功。
(2)藏文音节与音节之间由音节点分割,在小字符集中该音节点为0X0F0B。
1.2 基于藏字特征改进的BM算法
改进后的BM模式匹配算法的具体思路:
(1)用模式串P的尾字符与文本串T进行比较,结果失配,且文本串字符不为音节点,则模式串P右移到下一个出现的音节点处在新的位置继续比较。
(2)用模式串P的尾字符与文本串T进行比较,结果匹配,再把模式串第一个字符与文本串T比较,结果匹配。则将模式串与文本串T由右向左依次比较。当所有字符都能匹配上时,则找到字符串返回查找结果并结束;如果模式串第一个字符与文本串T比较,结果不匹配,则:
求move(o)=First(OT)-First(OP),将模式串移动move(o)个字符。
其中First(OT):表示文本串T出现的第一个音节点;First(OP):表示模式串P出现的第一个音节点。move(o):距离差值;
(3)用模式串P的尾字符与文本串T进行比较,结果匹配,再把模式串第一个字符与文本串T比较,结果匹配。则将模式串与文本串T由右向左依次比较。如果在模式串P的某一字符x失配,则转4;
(4)如果失配的字符x在模式P中没有出现,则:
求:First(x):从x起始的字符到第一个出现的音节点的距离。那么从字符x开始的m(模式串的长度)+First(x)个文本显然不可能与P匹配成功,直接全部跳过该区域即可,则模式串移位m+First(x)个位置;
(5)如果失配的字符x在模式P中出现,则:以该字符进行对齐。设move(x)为P右移的距离,m为模式串P的长度,max(x)为字符x在P中最右位置。作模式串移位:[m-max(x)]+First(x)。
通过上对面算法的分析,我们可以看出,改进后的BM算法可以减少比较的次数,提高匹配的速度。
2 结束语
越来越多的藏文出版作品在以数字化方式存储,网络上的藏文资料也日益增多,改进针对西文以及中文的搜索算法,寻找适合藏文文字特点的字符查找算法是值得研究的。改进的BM模式匹配算法就是利用藏文字符构字特征以及编码特点,改变了BM算法的比对方式,从而提高匹配的效率。
参考文献:
[1]江涛,于洪志.基于藏文文本的网络舆情监控系统研究[A].全国计算机安全学术交流会论文集[C],2006.
[2]闵联营,赵婷婷.BM算法的研究与改进[J].武汉理工大学学报,2006(03):528-530.
[3]殷丽华,张冬艳,方滨兴.面向入侵检测的单模式匹配算法性能分析[J].计算机工程与应用,2004(24):46-47.
[4]扎西加,珠杰.面向信息处理的藏文分词规范研究[J].中文信息学报,2009(04):113-117.
[5]严蔚敏,吴伟民.数据结构[M].北京:清华大学出版社,1999.
作者简介:春燕(1977-),女,藏族,讲师,硕士研究生,主要研究方向:藏文信息处理、数据挖掘。
匹配算法论文范文3
关键词:图像匹配;归一化交叉算法;小波变换;多尺度;塔式结构
中图分类号:TP399 文献标识码:A文章编号:1009-3044(2011)23-5698-03
NCC Algorithm Optimization Based on the Wavelet Multi Scale
FU Yan-li
(Shandong SHENG DA Construction Group Limited Company, Jining 272000, China)
Abstract: Algorithms based on pixel gray value are already very common in mage template matching problem, which normalized cross correlation algorithm (Normalized CROSS Correlation. NCC) is one of the classic algorithm based on gray matching, and is widely applied, but the algorithm also has the disadvantages of high time complexity. Multi scale theory and the multiple resolution image are representation and analysis of relevant, i.e. a digital image can be expressed as a multiple resolution sub-images collection. Its characteristic cannot be found in a resolution while in the characteristics of another resolution is easy to find, the wavelet multi-scale analysis is an important tool, known as mathematical microscope, can be used to construct different adaptive filter with improved filter convergence, which is also one of the advantages of wavelet transform. Image after wavelet decomposition, in the lowest layer of the low frequency sub image resolution, retaining only the most information of image, that is after wavelet transform of image of a feature. Based on the wavelet multi scale NCC algorithm not only optimize the algorithm itself at the same time optimization based on gray matching search path, so that guarantee the NCC algorithm accuracy, and reduce the matching time, and also the simulation experiments show that this algorithm is effective.
Key words: image matching; normalized cross algorithm; wavelet transform; multi-scale; tower structure
图像匹配是对两幅图像找其对应的映射关系或根据已知模式到另一副图中寻找相应的模式。图像匹配是一种极其重要的图像处理和分析技术,无论在图像理解还是在视觉计算中都具有重要作用和地位,其成功应用到航空航天、地球物理信息、海洋船载导航和地理特征探测、工业生产、医疗卫生等,因此图像匹配技术越来越受到人们的重视和青睐。
图像匹配的实用的技术方法一般分为两大类,即基于灰度匹配和基于特征匹配。基于灰度匹配是把待匹配图像中的某一像素点的灰度邻域作为匹配模板或者称为子窗口,在参考图中搜索具有相同或者相似灰度值分布的对应的邻域,从而实现两副图的匹配。基于特征的图像匹配不是利用图像中的像素值进行匹配,而是通过灰度导出符号特征(如:拐点、角点、边缘线段、图像轮廓)实现图像的匹配。前者作为一种基本的匹配方法之一,在很多地方得到了充分的应用,可以充分利用图像的所有信息、尤其适合在图像仅有平移和模板图像中非零项比较少的情况下,便于匹配的实现。但是弱点也是很明显的,即对图像的几何变形、光照强度、对比度都很敏感,并且计算量大,不适合实时匹配。后者利用从图像得到的符合特征作为匹配的基元,有效的克服了前者的弱点,但是特征匹配过于依赖图像的特征点,并且特征点的提取涉及到几何和图形形态学的计算,没有统一的模型可以利用,需要对不同图像选择不同的自适应特征,需要额外的特征提取的计算,往往计算也比较复杂。
1 归一化交叉相关算法
归一化交叉相关算法[1] (Normalized Cross Correlation.简称NCC)定义如下:
假设模板图像w(s,t)的尺寸为m×n,其中m,n往往取奇数,参考图像f(x,y)是一个大小为M×N,(1≤m≤M, 1≤n≤N),则:
(1)
其中a=(m-1)/2,b=(n-1)/2
由于表示模板的能量所以是一个常量,,当模板移动距离比较小时,也近似一个常量,所以为使D(x,y)最小则需要达到最大值,由于对w(s,t)和f(x,y)的副值的变化比较敏感,所以定义归一化互相关函数为:
(2)
其中a=(m-1)/2,b=(n-1)/2
为了进一步克服噪声的影响和理想状态匹配时C(s,t)相同值太多,还进一步简化(2)式即:
(3)
其中a=(m-1)/2,b=(n-1)/2,Ef,Ew分别为f(x,y)和w(s,t)的期望。
当C(s,t)达到最大值时,两图匹配成功。
通过对NCC算法的理论分析,不难发现:为了让算法达到理想状态进行图像匹配,牺牲时间,换取了理想的匹配。通过对公式(1)(2)(3)分析,可以看出公式越来越复杂,计算量越来越大,匹配的时间越来越多,由于小波变换可以作为一个平滑过滤器来使用,所以小波变换可以消除图像的幅值和图像的噪音,因此选择了NCC算法的中的公式(1),这样就可以节省大量的计算时间,提高匹配的速度。
2 小波变换的多尺度分析
小波在1987年首次作为分析工具首次出现,小波是多尺度分析的重要工具,被誉为数学上的显微镜[3],因为小波变换具有时间-频率局部化的特点,即在小波变换中,时间窗函数的宽度与频域函数窗口的函数的都是一个常数,根据测不准原理,他们的乘积也是一个常数。在对低频分析是可以加宽时间窗,减少频率窗;而对于高频分析是,可以增高频率窗,减少时间窗,这种特性被称为“自适应窗口特性”所以小波的这种特性是小波变换能提高为多尺度分析的基础,可以用来构建不同的自适应滤波器以改进滤波器的收敛性。
小波多尺度分析的表示:以多分辨率来解释图像的一种有效并且容易理解的结构就是图像金字塔如图1。一副图像金字塔是一系列以金字塔形式排列的分辨率逐层降低的图像集合。0层是N×N的图像,对0层的图像进行小波亚抽样,可以达到一个原图四分之一的较粗略的缩略图。这个过程是可以重复进行直到N层,这时图像是1×1的图像。这时图像的分辨率也从0层最高到N层逐次下降,是原来图像的四分之一。这样一个图像的金字塔结构共(logN 2+1)层,或者有这么多不同的图像组成,并且图像所用的容量只是原来的图像的4/3N2。
多尺度小波的特点[3]:1)多尺度小波具有窗口自适应的特性,即可以使图像的小波分析聚集到间断点、奇异点和边缘,体现了局部特点;同时也可以获得全局的视点。这个特性是小波变换独有的,对非稳定性和快速变换的信号的分析特别有用的。2)小波变换相当于一组多分辨率的带通滤波器。利用这个特性,可以将图像的信号分解为如图1所示的频率子带上,在每个子带可以用小波变换进行处理。3)多尺度小波分解图像的所有子图的和等于原图像的大小,即不增加存储空间。4)分解后的图像,没有信号损失,保证图像的完整性,便于对低频和高频的处理和上层对下层的实时重建。
3 基于小波多尺度的匹配算法
多尺度小波匹配主要利用了小波多尺度的特性对待配图和参考图进行金字塔式分解,结构如图1,匹配基本流程如图2所示,具体步骤如下:
1)首选判断待配图和参考图的大小,一般待配图比参考图像小多,这时就是在参考图中寻找待配图的位置;反之就是在待配图中搜索作为目标的参考图的过程。两者原理是一样的,所以匹配算法是基于前者论述和测试的。
2)判断待配图和参考图的灰度光照强度、对比度、物体在拍摄时的遮挡情况以及空间几何等,这些都会对基于灰度匹配造成错误的匹配,进行图像匹配前的预处理。
3)以上两步看作图像预处理的过程。接下来选择小波,这步非常重要,本课题选择了Daubechies(db4)小波,因为此小波在运动估计中应用非常广泛,可以很好的保留低频中图像的绝大部分信息,去掉高频信号中的噪声,是一个行之有效的小波。然后利用小波的多尺度特性将待配图和参考图像分解为N层,结构如图1,待配图和参考图未分解的图像为0层(有些文献是将原图定义1层),从低到上,分解的最大层为N层(或者分解的最大尺度为N层),在MATLAB中实现小波变换的最大层的函数是wmaxlev()。但是为了保证低频的中含有未解图的绝大部分信息,尤其是灰度变化比较剧烈的区域,一般分解的层次为:一维分解的分解尺度N不超过5;二维的分解尺度N不超过3。第N层图像的尺寸和大小都是原图来1/(N+1)2。
4)通过前三步,待配图和参考图的原图被分为N层不同频率子图的集合,现在可以在分辨率最低的N层进行待配图的子图与参考图的子图进行匹配。采用了经典灰度相似度量算法:归一化交叉相关算法NCC进行对待配图和参考图进行匹配。整个匹配过程就是将N层的待配图看作模板,匹配的实现基本过程:1)在第N层利用归一化交叉相关算法NCC进行匹配,即求出(1)式的最大值;找出对应匹配区域;2)在N-1层按照N层的算法,再在对应匹配区域进行NCC匹配;3)重复第5步直到0层;4)输出匹配结果。
4 仿真实验
本算法使用Matlab2007b进行了大量的仿真实验,图3是选择了最著名lena图进行算法的仿真说明。
结果分析:
1)为了与其他文献在匹配速度和精确度的可比性,选择了其中的一组著名图像:lena图,如图3和图4中的A图所示。进行尺度为2的小波分解,两幅图像中的尺度为2的低频子图,基本上无法辨认,即所需要的信息基本上都被过滤,所以在第2层匹配是无法匹配的,根据第4节的匹配步骤,只能在第1层子图匹配,匹配实验的结果证明是可行的。
2)将这幅lena的待配图和参考图如表1所示的各种算法进行匹配。通过表1可以看出,此算法是可行的。
5 结束语
论文的创新是首选剖析了NCC算法,选择了算法的中间过渡式作为本算法的一部分,好处是减少图像匹配的计算量,同时也保证了匹配的精确度;采用了小波变换的多尺度特性,优化了匹配的搜索策略,提高了匹配的精确度和匹配的时间,所以结合两者的特点可以很好的完成某些领域中图像的实时匹配。
参考文献:
[1] Gongzalez R C,Woods R E.Digital Image Processing[M].2nd Edition (DIP/2e).北京:电子工业出版社,2005.
[2] 李强,张钹.一种基于图像灰度的快速匹配算法[J].软件学报,2006,17(2):216-222.
[3] Luigi Di Stefan.Stefano Mattoccia Fast template matching using bounded panial correlation[J].Machine Vision and Applications,2003(13):213-221.
[4] Bamea D I,Silverman H F.A class of algorithms for fast digital image registration[J].IEEE Trans on Computers,1972,C-21:179-186.
[5] 郑运平,陈传波.一种新的灰度图像表示算法研究[J].计算机学报,2010,33(12):2398-2406.
[6] 李健,梁琨.基于小波多分辨率分析的快速图像匹配[J].陕西科技大学学报,2006,24(6):81-84.
[7] 刘莹.基于灰度相关的图像匹配算法的改进[J].应用光学,2007,28(5):537-540.
[8] 杜杰.两种基于灰度的快速图像匹配算法[D].大连:大连海事大学,2007.
[9] 范俐捷,王岩飞.一种新的基于灰度的图像匹配方法[J].微计算机信息,2007,23(30):296-297.
[10] 范新南,朱佳媛.基于小波变换的快速图像匹配算法与实现[J].计算机工程与设计,2009,30(20):4674-4676.
匹配算法论文范文4
关键词:双边匹配理论;发展;应用;金融市场
中图分类号:F830 文献标识码:A 文章编号:1674-2265(2013)06-0020-04
2012年的诺贝尔经济学奖得主研究的一个重要问题是如何使不同的市场主体匹配起来,并且达到一个稳定的状态。同其他市场一样,金融市场的一项重要的功能就是把市场的一方主体与另一方主体匹配起来。但是如何使双方达到一个稳定匹配的状态,使匹配更有效率,是当前金融市场面临的一个核心问题。本文将对双边匹配理论的发展与应用进行梳理,并重点对该理论在金融市场的应用问题进行研究。
一、关于双边匹配理论
(一)双边匹配理论的起源与发展
罗思(Roth,1985)是最早明确公开提出双边匹配概念的,他不仅明确地界定了“双边”和“双边匹配”的概念,而且分析了双边匹配的现实案例。罗思认为双边就是指事先被指定好的两个互不相交的集合,而双边匹配是指在这些市场中双边人的匹配。
2012年诺贝尔经济学奖的颁布丰富了双边匹配问题的研究方法。诺贝尔经济学奖得主提出了“稳定匹配”的概念,从而使匹配由“个人理性匹配”①走向了“稳定匹配”。沙普利(Shapley)采用合作博弈理论,在比较了不同匹配方法的基础上,用“G—S算法”来保证总能获得稳定的匹配,这一算法还可对各方试图操纵匹配过程的做法加以限制。罗思在沙普利的理论基础上,通过一系列的研究,发现稳定是市场机制运行成功的关键因素,并运用这些研究成果重新设计了现有的很多市场匹配机制,使匹配更有效率。
(二)双边匹配理论与搜寻—匹配理论的关系
搜寻—匹配理论与双边匹配理论都起源于20世纪60年代,搜寻—匹配理论研究的是在“摩擦市场”中,哪些因素会影响求职者的求职策略、工作搜寻强度及失业持续时间,以及如何匹配市场上的空缺职位和失业者;而双边匹配研究的是在具有双边市场特征的市场上,如何使市场双方主体匹配起来,并且形成稳定的状态。戴翔(2012)指出,搜寻—匹配理论的核心思想是:因为现实中存在着各种交易摩擦,从而产生了搜寻与匹配成本,这最终会致使交易的不顺利;双边匹配理论的核心是双边市场的双方人如何达到一个稳定的匹配状态。搜寻—匹配理论的研究方法包括匹配函数、劳动力市场基准模型——DMP基准模型;双边匹配理论的研究方法包括G-S算法、H-R算法、线性规划方法等;搜寻—匹配理论主要应用在网络金融信息等方面,双边匹配理论的应用方面更广,主要包括劳动力市场、人与组织匹配、电子商务、器官捐献和金融市场的风险投资、企业合并、银行信贷等方面。
(三)稳定的双边匹配与有效配置②的关系
有效配置状态就是指处于帕累托最优状态。稳定匹配的概念强于帕累托最优匹配,因为每个稳定匹配是帕累托最优的,然而不是每个帕累托最优匹配都是稳定的。帕累托最优要求没有两个人希望匹配在一起并且需要对方的同意。相比之下,稳定匹配要求没有两个人希望匹配在一起,无论对方是否同意。
二、双边匹配理论在国内外的应用
学者们对双边匹配问题进行深入研究并加以提炼,针对现实中的双边匹配问题进行了分析,尝试用双边匹配决策理论来解释具体的现象和问题。双边匹配理论的研究结合实际应用背景进行了有实用意义的扩展,广泛地应用于很多领域。
(一)双边匹配理论在国外的应用
1. 实习生与医院的双边匹配。实习生与医院的匹配是匹配理论较早的运用。在美国有一个制度,医学院的学生毕业后都要到各医疗机构实习。在早期,医学院毕业生实习市场比较无序,双方匹配很不稳定。为了达到稳定匹配,这个市场引入了“全国住院医生匹配项目(NRMP)”,刚开始比较成功,但后来NRMP也遇到了问题。1995年罗思和他的同事合作,对已有的匹配算法进行了改进,从而使这个市场运行更加稳定。
2. 学生与学校的双边匹配。学生入学匹配问题也是较早提出的双边匹配问题之一,匹配双方是学校和学生。学生在学校的录取优先权排序是学校对学生的偏好排序,而学生对学校的偏好排序是传统匹配理论中的排序,匹配的目标是使学生与学校都达到满意的结果。张、塞特曼和谭(Teo、Sethuraman和Tan,2001)对新加坡小学生升入中学进行了研究,研究发现小学生和学校在匹配过程中诚实地表达自己的偏好有利于形成稳定的匹配结果。
3. 人—组织双边匹配理论的应用。关于人—组织的双边匹配,目前主要有两种观点:大多数学者认为人—组织的匹配就是组织成员的个人特征与组织特征之间的相互包容性;少数学者认为人—组织的匹配是组织成员的个人特征与组织特征之间的互补性。克里斯托夫(Kristof,1996)认为一致性匹配就是组织的价值观、目标、文化等基本特征与个人的价值观、目标、人格等基本特征在很大程度上都一样,而互补性特征就是组织和个人双方的特征可以互为补充。另外,卡普兰(Caplan,1987)构建了关于个人—组织匹配的模型,包括需要—提供匹配和要求—能力匹配两种模型。其中需要—提供匹配就是组织能提供满足个人需要的岗位;要求—能力匹配是个体的能力能够适应组织的需要。
4. 电子商务中双边匹配的应用。匹配理论在电子商务方面的运用起于20世纪,并一直运用到现在,而且运用面更广、更灵活。郑(Jung,2000)用人工智能的方法来研究电子商务中的双边匹配问题,并且获得了稳定的匹配结果。萨尔尼和克劳斯(Sarne和Kraus,2008)建立了在电子商务中面向多个人的分布式的双边匹配机制。
(二)双边匹配理论在国内的应用
国内关于双边匹配的研究起步较晚,相关的理论研究相对滞后,研究成果主要是应用方面,但是应用研究范围相对较窄,研究的领域主要包括高考招生、劳动力市场、电子商务和金融市场等。
1. 高考招生中的双边匹配理论应用。双边匹配理论在高考招生中应用的研究范围涵盖了稳定匹配方案的存在性、研究方法的选择、信息环境对匹配效率的影响等。温忠麟(2006) 使用操作性方法验证了校方优先方案和考生优先方案,即稳定匹配的方案是存在的。李坤明(2010)分析了完全信息条件和不完全信息条件下考生的偏好,表明信息环境对高考录取机制配置效率有重要的影响,反过来高考录取机制又对信息环境具有依赖性。
2. 劳动力市场中双边匹配理论应用。张成(2010)借鉴双边匹配理论在国外劳动力市场的应用,并结合国内劳动力市场的特点,利用双边匹配理论的语言建立模型对我国大学毕业生劳动力市场进行描述。赵希男等(2008)构建了组织中人—岗匹配的纵向匹配度和横向匹配度测算模型来测算人与岗位的匹配程度,并通过实际案例证实了模型的有效性。
3. 电子商务中的双边匹配理论应用。近年来电子商务飞速发展,在电子商务中基于电子中介买卖双方的匹配问题,是一个典型的双边匹配问题。对双边匹配理论在电子商务中应用的研究是由理论到实证层层推进的。徐晓辉和陈剑(2000) 从产品和服务的标准化程度、顾客对产品网上销售的态度和顾客体验度三个方面,提出了一个判断产品是否适合在网上销售的标准框架,从而开启了对产品电子商务匹配度的初步探讨。基于电子商务业务的特殊性,可能出现多对多的情况,张振华、贾淑娟等(2008) 将Gale-Sharply和H-R算法从理论上扩展到了“p-k”的情况,以处理多对多双边匹配问题。
三、双边匹配理论在金融领域的应用
在我国金融领域,有些市场是研究双边匹配理论的天然场所,但是国内外学者们对双边匹配理论在金融领域的应用只有一些具体金融方面的研究,至今未形成一个体系。目前的研究主要在风险投资项目、企业并购、投资以及银行信贷方面得到应用。
(一)双边匹配理论在风险投资中的应用
在市场经济活动中风险投资商与风险投资项目或者创业者的匹配是一种典型的双边匹配模式,最优秀的风险投资商期望能够选择最好的风险投资项目,最好的项目也期望能有一个最优秀的风险投资商对其投资。 索伦森(Sorensen,2007) 采用定量分析方法分析了风险投资商与风险投资项目的双边匹配效应,认为双边匹配模式对风险投资商和风险投资项目产生双向的正的积极影响。在国内,曹国华、胡义(2009)认为,风险投资家和创业者的合作都是为了获得最大价值,所以两者之间建立稳定的匹配关系非常重要。他们根据自身的评价标准选择与对方建立匹配关系的理论基础,建立了风险投资家和创业者之间的双边匹配模型,并加以应用。
(二)双边匹配理论在企业并购中的应用
目前,双边匹配理论在企业并购中应用的研究比较零散,大都是从企业并购活动的某一个方面来研究的,如战略匹配、资源匹配等单个方面的研究,缺乏一个系统性的研究。
刘仲英等(2004)研究了企业并购活动中的战略匹配问题,建立了EKMS柔性和环境不确定性的匹配模型。马锐军、张勇(2006)分析了企业并购中人力资源匹配的问题,他认为人力资源的匹配要以人的能力为核心的管理和人力资源能力建设为主要内容。张海珊(2007)将企业并购活动中的资源匹配分为资产匹配和能力匹配,并通过建立BP神经网络模型来判断并购双方总体的匹配性。
(三)双边匹配理论在银行信贷中的应用
双边匹配理论在银行信贷方面应用的研究比较少。文胜(2006) 认为我国银行信贷市场存在着两个有完全不同运行机制的市场——目标客户信贷市场和非目标客户信贷市场。目标客户信贷市场的议价过程可以采用递延接受算法,结果稳定;非目标客户信贷市场如果采用递延接受算法,运行结果不稳定,因此需要设计一个中央化的匹配程序以保证结果的稳定。张继军(2011)通过分析中小企业贷款现状和贷款难的原因及城市商业银行为中小企业贷款的实际案例,认为小银行和中小企业的贷款需求是匹配的。
银行和贷款客户之间的稳定匹配,对于银行来说,可以规避客户的违约风险、减少银行的不良贷款、实现银行的稳健经营;对于贷款客户来说,稳定匹配可以减少贷款客户的搜寻成本、贷款成本,实现企业的持续稳定经营。所以学者们有必要深入的研究双边匹配理论在银行信贷中的应用。
四、结论与启示
通过对目前国内外关于双边匹配研究文献的回顾与综述可以发现,国外学者对双边匹配问题进行了大量探索性的研究,并取得了一系列的研究成果。学者们在研究中明晰并扩展了双边匹配理论的应用背景,探索了匹配的目标和获得稳定匹配结果的算法,并尝试在研究中用双边匹配思想来阐明并解决现实中大量存在的、不同参与主体之间的匹配问题。2012年诺贝尔经济学奖的颁布必然将双边匹配理论的研究和应用推向一个新的阶段。
毋庸置疑,双边匹配理论尚处于发展过程中,还有许多尚待进一步明确的具体问题。另外,国内学者对双边匹配问题的关注和研究还相对较少,研究内容也较为分散。但是,在我国金融领域,有许多市场是研究双边市场理论的天然场所,尤其是在双边市场条件③下运作的银行卡市场。作为一种典型的双边市场,市场需求和供给均呈现独特性,发卡机构必须围绕双边用户的联合需求提品和服务、必须协调双边用户的需求以达到均衡。因此,加强对发卡机构、特约商户、持卡人、银行卡组织等多方匹配机制的研究,能从根本上提高银行卡市场的匹配效率,这对于竞争不断加剧的银行卡市场④而言,无疑是增强银行卡市场竞争力的有效途径。
注:
①匹配研究是从“个人理性匹配”概念入手的。如果每个人对其派遣结果是可接受的,这就是个人理性匹配。
②有效配置意味着在资源和技术条件限制下尽可能满足人类需要的运行状况。帕累托最优状态表示,当事物的状态在给定的约束条件内时,通过重新改变这种事物的状态使之满足可用的约束条件,已经不可能使任何一个人的处境按照自己的观点来说变得更好。
③罗切特和蒂罗勒(Rochet和Tirole,2004)将双边市场定义为,通过一个或几个平台能够使最终用户相互作用,并通过合理地向每一方收费而试图把双方维持在平台上的市场。双边市场涉及到两种类型截然不同的用户,每一类用户通过共有平台与另一类用户相互作用而获得价值。
④截至2011年底,银行卡发卡量累计超过28.5亿张,同比增长18%。银行卡跨行交易全年超过16万亿元、104亿笔,同比分别增长44%、24%。其中,POS跨行交易13.4万亿元,同比增长47%;ATM跨行交易2.3万亿元,同比增长37%。刷卡消费额超过16万亿元,同比增长超过50%,占社会消费品零售总额的比重预计超过40%,比2010年提高约6个百分点——中国行业研究网。
参考文献:
[1]Gale,Shapley.1962.College Admissions and the Stability of Marriage [J].American Mathematical Monthly, 69,(1).
[2]Roth,mon and Conflicting Interests in Two-sided Matching Markets[J].European Economic Review,27,(1).
[3]Teo C.P,Sethuraman.J,Tan.W.P.2001.Gale-Shapley stable marriage Problem revisited:issues and applications[J].Management Seienee,47(9).
[4]李坤明. 基于双边匹配理论的中国高考录取机制研究[D].华南理工大学硕士论文,2010.
[5]张成. 双边匹配理论及其在我国大学应届毕业生劳动力市场的应用[D].华南理工大学硕士论文,2010.
[6]赵希男,温馨,贾建锋. 组织中人岗匹配的测算模型及应用[J].工业工程与管理,2008,(2).
[7]徐晓辉,陈剑. 关于产品电子商务匹配度的研究[J].南开管理评论,2000,(4).
[8]张振华,贾淑娟,曲衍国. 基于稳定匹配的电子中介匹配研究[J].控制与决策,2008,(4).
[9]李晓慧. 基于优先级的双边匹配方法在B2B电子商务中的应用研究[D].西安电子科技大学硕士论文,2010.
[10]张海珊. 战略并购双方的匹配性研究[D].北京交通大学博士论文,2007.
匹配算法论文范文5
关键词:就业信息采集;搜索引擎;中文分词;索引算法;
中图分类号: TP311 文献标识码:A 文章编号:1009-3044(2013)13-3081-03
1 概述
1998年以后随着高校扩招,高校毕业生急剧增加,毕业生的就业形势显得一年比一年严峻,2013年的毕业生人数达到690万。面对如此严峻的就业形势,毕业生及时有效的获取就业信息成为毕业生就业过程中最为关键的一环,因此毕业生就业信息的收集工作成为了高校就业指导工作的重要组成部分,只有让毕业生及时、准确、全面地掌握就业相关信息,才能使毕业生获得更多的求职机会,高校的就业指导工作才能更好的发挥作用。
四川大学吕婷同学在《论我国大学生就业体系的构建》的统计数据中显示,大学生在就业过程中获取就业信息的最主要渠道是校园招聘会,占23.2%,其次就是学校的就业公告栏,占20.2%,两者合计达到了43.4%, 再次为通过其他网络获取就业信息,达到16.3%,而政府招聘会、报纸、人才市场和亲戚朋友等就业信息渠道都在9%左右,[1]可见大学生在就业过程中更依赖从高校的就业信息渠道获取就业信息。
由于高校行政管理体制分割以及高校的保护主义,各高校毕业生就业信息网上提供的就业信息基本是分立甚至是隔绝的,鲜有院校相互合作、共享就业信息。这种高校高度自治的就业信息网站建设局面形成了数量庞大的信息孤岛。这样的信息孤岛看似保护了本校毕业生得利益,实际上也给毕业生的就业信息获取带来了诸多困难,因此建立高校毕业生就业信息搜索引擎为毕业生提供丰富的、及时的、有针对性的就业信息成为需要我们解决的一个课题。
2 垂直搜索引擎概述
垂直搜索的本质是对垂直门户信息提供方式的一次简化性的整合。它服务于某项功能的。而垂直搜索引擎是为垂直搜索服务,对网页中某类信息进行一次简化性的整合,通过关键词抽取出有用的数据进行处理,然后再返回给用户。
垂直搜索引擎的优点[2]:
1)稳定的用户群体
垂直搜索引擎为用户提供的并不是上百甚至上千万相关网页,而是范围极为缩小、极具针对性的具体信息。因此,特定行业的用户更加青睐垂直搜索引擎,是垂直搜索引擎的长期、稳定的群体。
2)搜索结果精确,查准率高
用户使用Google等通用搜索引擎的方式是通过关键词的方式实现的,是语义上的搜索,返回的结果倾向于知识成果,比如文章,论文,新闻等;垂直搜索也提供关键词来进行搜索,但被放到了这一行业知识的上下文中,返回的结果更倾向于信息、消息、条目等。
3 简介
笔者通过C#结合建立一个针对高校毕业生就业信息的搜索引擎,能够对高校毕业生就业信息网的信息进行采集、下载、分析、实现中文分词并建立索引,最后采用网页的形式为用户提供就业信息的检索。
搜索引擎各部分的主要功能描述如下:
1)采集站点管理
该模块用于管理垂直搜索引擎抓取的数据来源,即用于管理垂直搜索引擎需要采集的就业信息站点。为满足各种不同类型的高校对于就业信息的不同需求,系统允许高校根据自身的地域、专业特色、行业特性设置符合自身需求的就业信息网的网址信息,例如对同城高校和同行业高校的就业信息网进行采集,也可以让学生用户向服务器提供建议网站,通过这样的功能既提高了搜索引擎的专业性,也使得数据库中增加了很多学生认为对自己很有用的信息。
2)高校毕业生就业信息采集器
就业信息采集器是C#多线程技术实现的一个就业信息采集机器人,该机器人通过采集站点管理模块提供的目标站点目录作为入口,对目标采集站点中的就业信息进行采集,并将采集到的就业信息进行去HTML标签后存储到数据库,同时将网页保存至服务器作为后期网站快照的依据。
3)中文分词器
众所周知,英文是以词为单位的,词和词之间依靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。例如,英文句子I am a student,用中文则为:“我是一个学生”。计算机可以很简单通过空格知道student是一个单词,但是不能很容易明白“学”、“生”两个字合起来才表示一个词。该功能模块把采集到的就业信息切分成有意义的词,中文分词的准确与否,常常直接影响到对搜索结果的相关度排序。
4)索引器
索引库的建立关系到用户能否最迅速地找到最准确、最广泛的就业信息。索引器通过扫采集器采集的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户。
5)用户查检索功能
该功能通过友好的查询界面,为用户提供高校毕业生就业信息的垂直搜索,并输出搜索的结果。
5 高校毕业生就业信息搜索引擎的关键技术
5.1就业信息采集器的实现的关键技术
笔者通过利用c#多线程技术实现就业信息采集器,采集数据时使用“从严采集”策略,即对当前采集页面进行分析和判断,仅采集主机地址或IP地址属于采集目标站点的就业信息,超出目标站点的信息进行忽略,这种从“严抓采集”的策略有效的限定了采集的范围,提高了就业信息采集的准确性和采集效率,节约了服务器的存储空间。从严抓取策略的关键代码如下:
5.2中文分词器实现的关键技术
在中,分词是核心库之一, 目前的内置的分词库很不完善,实际应用价值不高,如果只使用拉丁语系,那么使用内置的分词可能足够了,但是对于中文分词肯定是不行的,因此我们必须构造自己的分词方法ChineseAnalyzer。
分词器中具体的分词程序需要通过在Next()方法来实现。在Next()方法中的words是采用正向最大匹配算法或逆向最大匹配算法分词后的一个词列表,通Next()方法将输入的文本分割成一个个Token。 关于正向最大匹配算法或逆向最大匹配算法分词笔者不再赘述。
5.3索引器实现的关键技术
在中IndexWriter类是索引中负责操作的核心,它负责把索引文件写入存储介质,是控制逻辑存储转换为物理存储的纽带。Document类是一条虚拟记录,可以理解为数据里的一行,它一般记录了需要用到的一个文档的属性。Field类就是数据库里的一列。一个文档有标题,内容,招聘时间,招聘地点这四个属性的话,那么就需要四个Field保存这些属性,然后把四个Field加入到Document中,就有了一行记录。
5.4用户查询检索功能实现的关键技术
Web应用相对于Winform应用来讲,Web应用具更加有完善的布局能力,包括能够基于文本流进行布局,包括各种段落、图片,段落中文字的左中右对齐,段首的缩进,行间距,避头尾字符用户的查询功能
笔者在具体实现中使用的IndexSearcher、Query、QueryParse、Hits4个搜索核心类和.Highlight类实现搜索功能。
6 系统的界面实现
7 结论
笔者研究了垂直搜索引擎的主要原理和技术,通过使用C#多线程技术及开源项目设计并实现了一个高校毕业生就业信息搜索引擎系统,并在系统中重点研究了就业信息的采集和中文分词、索引、检索等关键技术。随着高校毕业生就业形势日趋严峻,高校毕业生就业信息搜索引擎在实际运用中将高校毕业生就业信息的信息孤岛连接在一起,为广大毕业生和用人单位搭建一个畅通的无障碍的沟通桥梁,间接实现了就业信息共享,提高了高校就业工作的效率、保证了就业信息提供的及时性和针对性,在高校就业信息化建设中具有十分重要的意义。
参考文献:
[1] 侯月娥. 论高校毕业生与用人单位之间就业信息的不对称[J].太原大学教育学院学报, 2009(27)(增刊):126-127.
[2] 百度百科[EB/OL].http:///view/7491.htm.
[3] 百度百科[EB/OL].http:///view/5049915.htm.
[4] 邱哲,符滔滔.开发自己的搜索引擎[M].北京:人民邮电出版社,2007.
[5] 李志更,唐志敏.国外基于电子政务的公共就业服务的实践与启示[J]. 电子政务,2010(5):3-10.
[6] 肖甦.浅谈俄罗斯高校毕业生就业的管理系统.[J].外国教育研究,2007,34(7):69-71.
[7] 高金勇,冯奕兢.基JSP与lucene的学前教育资源检索系统的设计与实现.[J]硅谷,2012(10):161-162.
匹配算法论文范文6
关键字:车联网 IPV6 路由协议
中图分类号:TP39 文献标识码:A 文章编号:1672-3791(2015)09(a)-0012-02
随着信息技术的高速发展,网络通信的界限也在不断扩张,1999年提出了物联网概念,其主要核心是每一个物件都可以寻址,每个物件都可以控制,每一个物件都可以通信。车联网技术作为物联网技术应用于智能交通领域的一种具体体现,同时也是一个物联网大有可为的重点领域之一。它的技术组成一般包括车辆之间的网络链路、车辆与路边通信结点之间的网络链路、路边结点之间的相互网络链路、以及上述通信节点的集合等等网络要素。
1 车联网的特点和研究内容
1.1 车联网的特点
随着国内车辆和各地公路的智能化的发展,更多的车辆和公路边的基础设施都开始安装各种数据通信设备。车联网是自组织网络的一个新的研究和应用领域,已逐渐成为无线网络以及智能交通领域热门的研究课题。车联网是一种特殊的自组织移动网络,除了具备普通物联网的特点与问题,也有着自己的特点和问题:
(1)高动态特性:车联网当中的网络结点以车辆为主,车辆位置变化较快,导致拓扑变化更频繁、链路存活的周期更短。
(2)网络管理:由于网络管理面较广,需要适当的路由算法来解决节点定位和地址自动分配等问题。
(3)噪声:车联网环境中的车辆之间的通信受到的干扰因素很多,其中包括天气状况、马路边各种构造的建筑物、道路情况、车辆移动速度等。
(4)不可靠的网络链路和间歇的网络连接: 由于车辆高速运动原因,AdHoc网络中的链路连接也是动态多变的。
1.2 研究内容
该论文研究主要内容分以下三部分:
(1)介绍车联网技术的基本架构原理,对其基于移动互联的工作流程、动态车辆寻址定位等技术进行了分析,分析讨论该论文的关健技术。
(2)探讨车联网环境中的结点问题,提出了基于车载终端识别和地图匹配的简单交通状态判别算法。
(3)讨论车联网技术的广泛应用,车联网是一种全新的概念,目前还在继续研究还探讨 ,其具有广阔的应用前景和商业价值,会为社会的进步做出很大贡献。
2 车联网的关健技术
2.1 车联网技术的寻址
IP协议是当今因特网的核心协议,随着Internet技术的飞速发展,IPv4技术已日渐成熟,然而IPv4协议技术也在随着网络应用的多样化而面临着许多难以解决的问题:IPv4地址空间即将耗尽、移动性差和配置复杂等特性。IPv6技术的提出能很好的解决上述问题。移动IPv6技术随着IPv6技术的不断研究而得到快速发展,移动互联网已成为未来互联网络的发展方向之一。
由于车联网是高速动态的移动网络,在研究的过程中必然要用到移动IP协议技术。移动IP是一种网络层的移动解决方案,具有可扩展性、可靠性和安全性并能使节点在切换链路时仍能保持正在进行中的通信。移动IP提供了一种路由机制,使移动节点可以一个永久的IP地址连接到任何变化的链路上。
2.2 车联网中存在的结点
首先给大家介绍一种系统―网络化物理系统(CPS),其在国际上是一种利用计算技术监测和控制物理设备行为的深入嵌入式系统。CPS目前是当今国内外研究的一种热点技术,涉及网络技术、通信技术、和单片机等等各种学科,CPS结点就是物联网中必要的一部分 。根据车联网技术的具体使用环境和服务的需求,需要在车联网当中主要通信设备主要选取有源CPS结点, 固定通信设施当中的主要设备采用互联网CPS结点。其中由于有源CPS结点的计算能力、存储能力和联网能力等方面均优于无源CPS结点。另外,有源CPS结点能够更好的支持快速移动性,具备主动感知等各种性能。互联网CPS结点除了具备有源CPS结点的基本性能外,还有网络控制和网络管理接入等功能,安全性比较高,稳定性强于有源CPS结点,所以在车联网中一般作为固定基础设施,例如电子警察、路灯等。
2.3 车联网下的交通判别算法
车联网技术所采集到的大量网络中的车辆定位数据,通过车辆终端识别技术可以对采集到的车辆各种信息进行数据的分类统计,并记录大量车辆的平均速度和速度峰值。通过地图匹配算法,对道路路网下的各个路段的交通情况分别进行判断和监控。其中地图匹配技术与车载终端识别分别保证了数据来源的针对性和正确性,是大规模路网交通状态判别实现的基础。路网中不同区域所在路段存在的差异决定要使用不同的判别方法对整个路网的交通状态进行判别。因此为了得出路网中的车辆速度峰值、车辆平均速度以及路口排队数量与当前交通状态中存在的离散型关系,利用应用最广泛的解决离散型性问题的分类预测方法――决策树学习ID3算法,对整个路网的交通状态进行判别。
ID3算法是一种贪心算法,用来构造决策树。主要解决的问题是为树的每个结点选取要测试的实例属性,D3算法起源于概念学习系统(CLS),以信息熵的下降速度为选取测试属性的标准,即在每个节点选取还尚未被用来划分的具有最高信息增益的属性作为划分标准,然后继续这个过程,直到生成的决策树能完美分类训练样例。
3 车联网的应用
在国际上,日本的VICS和美国的IVHS等系统通过道路和车辆之间建立有效的网络通信,基本已经实现了车联网。而RFID和Wi-Fi等无线技术近年来也在交通运输领域智能化管理中越来越得到了广泛应用。在未来的车联网时代,无线通信技术和传感技术是是实现车联网的关键,并且之间会是一种互补的关系,比如当车辆处在转角等传感器不能识别的盲区时,无线通信技术就会发挥作用;而当无线通信的信号丢失时,传感器又派上了用场。作为众多无线应用的典型代表,车联网时代的到来必将推动更多无线技术的应用和普及,也会再一次看到了移动宽带需求的迅猛增长。
4 结语
该文浅要探讨了车联网的概念、车联网的体系结构、车联网环境下的关键技术以及车联网能够提供的各项服务等内容,以期能够为将来车联网技术的进一步深入研究提供一些思路。与此同时也应该意识到,车联网涉及的技术学科众多,车联网的普及应用还任重道远,需要相关领域的专家学者们开展更深的研究工作,为车联网的美好将来付出更多的努力。
参考文献
[1] 王建强,吴辰文,李晓军.车联网架构与关键技术研究[J].微计算机信息,2011,27(4):156-158.