前言:中文期刊网精心挑选了计算机技术研究方向范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
计算机技术研究方向范文1
关键词:语义检索;概念语义树;语义相似度
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2011)16-3809-02
Research on Method of Semantic Similarity Based on Concept Semantic Tree
HAN Xin, QIN Fan
(School of Electronics and Computer Science and Technology, North University of China, Taiyuan 030051, China)
Abstract: At present, the application of information retrieval has been widely used, but it is still a difficult thing to be accurate in the specific field of searching. This paper provides a semantic similarity calculation method based on the concept semantic tree, considering the concept of the semantic relations, hierarchies, and inheritance and other factors, as much as possible to improve retrieval efficiency in specific areas of information, and at final, demonstrate the feasibility of the method by experiment.
Key words: semantic retrieval; concept semantic tree; semantic similarity
传统的信息检索都是基于关键词查询的,因此在检索时可能会出现一堆用户并不真正需要的信息,导致查询结果的准确率很低,查全率也不令人满意,会出现“表达差异”,“词汇孤岛”等问题。语义检索就是把信息检索从传统的基于关键词层面提高到基于语义的层面,从语义方面着手,分析概念之间的内在联系,利用语义来组织、存储和获取信息,信息和语义的结合,使信息变成计算机可识别的知识,从而系统能识别出用户所需要的信息,提高检索的查准率和查全率。
1 语义相似度
语义相似度是对语义相似性的定量表示,语义相似度计算是信息检索、数据挖掘、知识管理等领域的基本问题。在信息检索中,语义相似度能够更多的反映文本概念是否符合用户的查询要求,相似度越高,说明文本内容与用户的查询请求越接近。
刘群、李素建[1]基于实例的机器翻译,提出语义相似度就是两个不同上下文本中的本体概念,在不改变文本的句法及语义结构的情况下可以互相替换的程度。如果位于不同上下文本中的两个概念词语在不改变文本的句法及语义结构的情况下可以互相替换的可能性越大,则说明二者的相似度就越高,否则相似度就越低。
当两个语义概念元素x,y相似时,用sim(x, y)表示两者之间的相似度,形式上,相似度计算满足[2]:
1)相似度的值为[0,1]区间中的一个实数,即sim(x, y)∈[0,1];
2)如果两个对象是完全相似的,则相似度为1,即sim(x, y) = 1 当且仅当x = y;
3)如果两个对象没有任何共同特征,那么相似度为0 ,即sim(x, y) = 0;
4)相似关系是对称的,即sim(x, y) = sim(y, x)。
2 概念语义树
使用层次化的树状结构来描述概念之间的逻辑关系,这种语义化的概念树为检索算法提供语义基础,在检索过程中不同的概念之间也有一定的相似性和相关性,因此需要处理概念树中祖孙节点、兄弟节点等不同类型的关系,我们考虑用概念间的相似度对其进行描述和量化,以提高检索的准确率为了计算概念相似度,作如下定义[3-4]:
定义1:在本体概念的树状层次结构中,如果概念A和概念B之间存在这样的关系:A是B的祖先,则称A和B为同支概念。概念A称为A和B的最近根概念,记为R(A,B),而A、B之间的距离dist(A,B)=dep(B)-dep(A),其中depth(C)为概念C在层次结构中的深度。如图1(a)所示。
定义2:在本体概念的树状层次结构中,如果概念A和概念B之间存在如下这样的关系:A不是B的祖先并且B也不是A的祖先,则称A和B为异支概念。如果概念R是A和B最近的共同祖先,并且是符合此条件的所有节点中距离概念树的根节点最远的一个,则称R为A和B的最近根概念,记为R(A,B),且A、B之间的距离为dist(A,B)=dist(B,R)+dist(A,R),如图1(b)所示。
定义3:概念C 称为概念A 和B 的语义相关概念,当且仅当概念C 满足如下的条件:当A, B 为同支概念时,C 在以A 为根的子树中且不在以B 为根的子树中;当A,B 为异支概念时,C 在以R 为根的子树中且不在以A 或B 为根的子树中。
在计算语义相似度时,A和B各自的子概念数以及它们的语义相关概念数对相似度计算结果也有影响, 当A,B为同支概念时,A的子概念由B的子概念和A,B的语义相关概念组成,前者所占的比重越大,则概念A,B的语义相似度越大;当A,B为异支概念时,R的子概念由A 的子概念、B 的子概念以及A,B 的语义相关概念三部分组成,前两部分的比重越大,则A,B 的语义相似度越大。
1)当A,B为同支概念时,A与B之间的语义关系为:
式中,m表示概念B的子概念数,n表示概念A的子概念数。
2)当A,B为异支概念时,A与B之间的语义关系为:
式中,m表示概念B的子概念数,n表示概念A的子概念数,X表示A与B最近根概念的子概念数。
定义4:两个概念之间的语义距离,是指在语义树中连接这两个概念的最短路径的长度。语言学研究认为,两个概念的语义距离越大,其相似度越低;反之,两个概念的语义距离越小,其相似度越大,两者之间可以建立一种简单的对应关系。特别地当两个概念之间语义距离为0 时,其相似度为1;当两个概念之间的语义距离为无穷大时,其相似度为0。两个概念之间的语义距离表达式为:
式中,distant(A,B)表示概念A与B之间的语义距离,weighti表示连接A,B的最短路径上第i 条边的权值。
定义5:概念的深度是指该概念与语义树根的最短路径中所包括的边数。因为在语义树中,每一层的概念都是对上一层概念的细化,由此可见,在语义距离相同的前提下,两个概念的深度和越大,概念之间的相似度越大;两个节概念的深度差越小;概念之间的相似度越大。概念深度的表达式为:
式中,depth(A)表示概念A的深度,n表示概念A与语义树根之间的最短路径中所包括的边数。
3 语义相似度计算方法
考虑概念语义树中概念之间的层次关系、继承关系及语义关系,我们提出下面这个关于语义相似度的就算方法:
其中:Level(A,B)表示概念之间的语义关系对相似度的影响;
Distant(A,B)表示概念之间的语义距离对相似度的影响;
Depth(A,B)表示概念之间的深度对相似度的影响。
但对概念语义树中层次结构分以下这两种情况考虑:
1)当A,B为同支概念时,A与B的语义相似度为:
2)当A,B为异支概念时,A与B的语义相似度为:
α,β,γ为调节因子,且α+β+γ=1.
4 实验结果
选取如图2一个简单的实例来计算语义相似度。
选参数α=0.6,β=0.3,γ=0.1,可得到“计算机”与其余各节点之间的语义相似度为:
参考文献:
[1] 刘群,李素建.基于《知网》的词汇语义相似度计算[J].Computational Linguistics Chinese Language Processing,2002,7(2):59-76.
[2] 李玲.面向流程诊断的企业知识相似度匹配工具研究与开发[D].哈尔滨:哈尔滨工业大学,2006.
[3] 王进,陈恩红,施德明,等.一种基于语义相似度的信息检索方法[J].模式识别与人工智能,2006(6):2-6.
计算机技术研究方向范文2
关键词:古典文献数据库 公共古典文献数据库 文献检索服务系统
计算机技术的飞速发展,为古典文献研究的现代化提供了坚实的基础,其贡献是有目共睹的。然而,计算机技术在古典文献研究中的运用仍然存在着极为严重的缺陷也是不容回避的。笔者近几年来主持并直接参加设计“e书库”数据库的过程中,感到有必要将自己的一些想法提供给正在设计有关软件的计算机专业人员、愿意使用该类软件的专家学者们参考。
一、我国古典文献数据库建设的历程
自古以来,历代学者对古典文献整理与研究一直沿袭手工操作的方式,然而自上世纪80年代后,计算机技术开始涉入到古典文献研究中,对传统的古典文献整理与研究方法(自然也对一切需要使用古典文献资料的专业研究)起到了极大冲击。
首先简单回顾一下计算机技术在古典文献研究领域内发展的历程。上世纪80年代初,我国一些图书馆、大专院校及科研机构陆续开始大规模地利用计算机设计并建立数据库。大致说来有两类数据库,一类是书目数据库,一类是文献数据库。南京图书馆于90年代初率先建立书目数据库,对读者检索有关书目起到了极大的帮助。之后,各地图书馆纷纷效尤,类似的书目数据库很快就普及了。虽说至今各地图书馆的书目数据库的检索方式,仍存在机读编码格式不统一的问题,然而书目数据库提供的方便快捷的查询功能,对读者来说无疑是一件大好事,具体到学术研究来说,至少为研究者提供了一个比较方便的查找有关古典文献的实用工具。
在建立书目数据库的同时,一些大专院校与科研机构开始研发各自的文献数据库。从数据制作格式来说,大致可以区分为两类,一类是图像格式,即将按原著内容扫描成PDF图像文本,另一类是元数据格式,即录入文献文本内容(或扫描并转化为电子文本)导入数据库,并转换成可阅读与检索的数据库机读格式。一般说来,无论是PDF格式还是元数据格式,它们数据库容量都较大,也提供了较为原始的检索方式,为学术研究提供了不小的帮助。从上述两类制作格式的数据库来说,PDF图像文本可以直接阅读图像文字,但总体说来不太适应古典文献整理与研究的需要。而元数据格式较为精致,初步具备了较为方便的常用的功能,可以检索、作卡片等等。
古典文献数据库从收录的文献内容来说,大致可以分为两类:一类是类目数据库,即按“类”收录有关图籍,如经学类、史学类、文学类以及甲骨文、金文或出土文献资料、石刻资料等等,另一类是综合数据库,如《四库全书》、《四部丛刊》、《国学宝典》之类数据库。
大陆最早的古典文献数据库是河南大学的《宋人笔记检索系统南宋主要历史文献》,建立于1987年。之后,各种数据库纷纷涌现,比较重要的有南京大学、河南大学、苏州大学联合研制的《计算机甲骨文信息处理系统》、中国社会科学院《全唐诗》、《先秦魏晋南北朝诗》、《全上古三代秦汉三国六朝文》、《十三经》、《全唐文》、《诸子集成》等数据库、北京大学《全宋诗》数据库、南京师范大学《全唐五代宋词》数据库、四川大学《宋会要辑稿》数据库(与海外合作)等等。港台古籍数字化起步较早,均采用繁体字形式。1984年台湾中央研究院历史语言研究所开始研发《汉籍全文资料库》,香港中文大学则有《汉及以前全部传世文献》、《魏晋南北朝全部传世文献》、《竹简帛书出土文献》数据库等等。其中《竹简帛书出土文献》收录《马王堆汉墓帛书》、《武威汉简》、《睡虎地秦墓汉简》、《银雀山汉简》、《居延汉简释文合校》及其它散见简牍共140多万字的竹简帛书出土文献,价值颇高。
值得注意的是,这些数据库主要是提供给本单位研究人员使用的,当然也有部分数据库对外开放,为其他研究者提供一定帮助。虽然这些数据库有种种限制,但它们无疑为古典文献的研究(当然包括其它专业的学术研究)提供了方便。之后,随着网络技术的发展,各科研机构、大专院校、各地方的图书馆、以及其它数以百计的网站向用户提供收费或不收费的古籍文献检索服务,甚至还提供古籍文献的下载服务。显然,这些工作的开展,为学术研究的现代化提供了极为有力的支持。至今为止,据笔者所查索到的除科研机构、大专院校、各地图书馆数据库之外,提供各种文献下载的中文网站至少在200个以上,其中就有不少古籍文献下载的网站。这些古典文献数据库或有关网站的建立,确实为古典文献整理与研究乃至其它学术研究提供了极有价值的帮助。
二、目前存在的问题
当然,我们也应该清醒地看到,在古典文献数据库大量涌现的同时,一些潜在的问题与数据库本身的缺陷严重地制约着古典文献数据库的正常发展。
从古典文献数据库技术发展角度来说,笔者认为大致经过三个发展阶段。第一阶段是PDF图像文本数据库,其数据来源主要是以扫描方式获得,形成PDF图像文本。这种图像文本优点是直观,与原书分毫不差,但它的缺点是功能极其单一,仅可供浏览图像和简单地检索书目。虽然第一阶段的数据库功能极少,但毕竟能方便而直观地阅读文献了,因此引起了学者们广泛的兴趣。必须指出的是,由于功能太少,这类数据库难以进一步发展。
第二阶段是元数据数据库,以香港迪志公司投资、书同文数字化技术有限公司设计、上海人民出版社出版的《四库全书》、书同文数字化技术有限公司设计、万方数据电子出版社的《四部丛刊》、尹小林《国学宝典》、南开大学永川公司的《二十四史》,以及大陆、港台等大专院校或科研机构制作的较大型的数据库为代表。它们的优点是具有较多的基本功能,如检索、卡片、打印等功能,有些还附加了日历查询、字典、音乐背景等附加功能。然而,它们都不允许对数据库内的文本错误进行修订、没有图表处理能力、不提供功能升级服务(某些软件提供所谓新版本,实际上只是增加一些文献文本,并未真正提升软件服务功能)。而且由于各自为政,开发者大都采取自定义方法来自造非常用的生僻词,因此各种数据库之间字库不能相互兼容。这一阶段的古典文献数据库也有吸收第一阶段数据库有图像的优点,如上述提及的《四库全书》就附有图像,以利研究者核对文字。该阶段绝大多数数据库注意到版权问题,但仍有一些数据库在版权上出现较大问题,乃至引起法律纠纷。
计算机技术广泛地涉入文科研究领域,各种古典文献数据库纷纷建立,当然给古典文献整理与研究的现代化提供了极其有利的帮助,然而,在笔者看来,目前计算机技术在这一领域中的运用形成纷乱无序的“战国时代”,有许多亟待解决的问题,否则将会影响或说削弱计算机技术在古典文献研究(乃至其它学术研究)中巨大作用。对此弊病,笔者拟作一概述,企望引起有关部门、数据库开发者及使用者的重视,以期真正使计算机技术对古典文献整理与研究起到更大的促进作用。大致说来,主要问题有以下几个方面:
其一,缺乏整体领导与规划,国家投资与收益不对称。当然,首先应该看到,国家有关部门已经着手做了一些规划,也实施建立一些比较大的古典文献数据库,如2002年10月,国家科技图书文献中心受科技部的委托,牵头联合中国科技信息研究所、国家图书馆、上海图书馆、中科院图书馆、北京大学图书馆等单位,启动了我国数字图书馆标准规范建设项目。这一项目的目的就是力图建立我国比较统一和规范的数字图书馆标准,自然也会对建立古典文献数据库有较大的借鉴与参考的价值。又如北京大学《中国基本古籍库》、上海图书馆《古籍影像光盘制作及检索系统》等等,也由国家有关部门投入大量资金,而且已经启动并完成了部分内容。不过也应该强调,由于国家没有制定出一个比较符合国内数据库发展状况的真正有价值的规范体系,因此这些项目的承担者仍是各自为政,数据库之间并不能兼容,不可能形成技术“合力”。再从所取得的社会效益或说实际使用价值来看,也不尽人意。因为至今为止建立的各种数据库仍人为地设置许多障碍,无法使它们实现较大的使用价值。数据库由国家投资,收益自然应该归国家,或者成为不收费的公益数据库,但目前收益既不归国家,又未能成为公益数据库,这不能不说是个极大的遗憾。实际上,数据库制作者无偿利用国家投资进行了开发,制作完成后却获得相当丰厚的收益,使人感到有“国家投资,个别单位图利”的印象。笔者不反对交纳一定使用费用,但收费单位一定应该说明收费后去向,绝不允许产生国家投资而由个别单位乃至某些个人得利的情况。
其二,开发商嗜利忘义,数据库错误严重。除上述由国家投资开发的古典文献数据库外,还有一些有一定技术实力的软件开发商加入到古典文献数据库的开发中来了。比较而言,各科研机构、大专院校及各地图书馆建立的古典文献数据库质量较高,而开发商则很少关注数据库中的文献质量。我们承认确有少量开发商制作的数据库质量较高,如迪志公司开发的《四库全书》之类,然而象《四库全书》这样的数据库确实凤毛麟角,难以寻觅。我们发现,甚至有些开发商仅仅是把文本进行文字扫描导入,疏于校对,因此文本错误百出,难以卒读。由于利益驱使,绝大多数开发商都以“独自开发”为己任,数据库设计相互保密,互不兼容,使用户深感不便。这些问题已严重地影响到古典文献数据库的正常发展了。
其三,热门文献数据重复,冷门文献数据罕见。虽说目前数据库品种繁多,但由于考虑到使用者对文献内容的需求,因此许多开发者热衷于开发那些热门数据,而一些比较冷门的文献则鲜有人问津。实际上,冷门的文献并非是没有学术价值的文献,只是使用人较少而已。因而,目前不但数据库中文献内容重复现象极为普遍,甚至同名同姓的数据库也有不少,如《四库全书》就出现了武汉大学版、上海人民出版社版等数种不同版本。且不说那些数量繁多、质量也不甚高的数据库浪费了多少人力物力,其实也使用户陷入无可适从、欲舍不能的境地。用户往往为了某些少量文献内容不得不购买和安装整个数据库操作系统,而且这些庞大的数据库大量占据硬盘空间,导致计算机运行速度大为减慢。而那些允许网上检索的文献数据库又往往容量极大,上网检索者多,导致“交通阻塞”!
其四,技术关卡重重,难以互相兼容。各开发者既鉴于不同开发目的与技术条件,又为防止他人解密,因此在开发过程中在数据库某些程序中人为设置技术障碍,以保障自己利益不受损害。自然,开发者需要投入大量人力物力,保障本身利益不受损害是无可非议的。然而也由于人为地设置了障碍,却使各种文献数据库之间不能兼容,无法形成合力,先进的技术反而成为技术壁垒。实际上,这一情况大大浪费了宝贵的人力资源与财力,对古典文献的开发与利用有百害而无一利。另外,由于技术壁垒,在古典文献数据库的文字方面更导致许多问题。我国古籍常用汉字大约为4万余个,这还不包括超过2万个异体字及数千甲骨文、金文等古文字。然而我国目前在计算机上采纳的国标字库(GB)和扩展字库(GBK),两者相加也只有27000余字,这与我国古籍常用汉字数量相比,实在差距太大。因此,如此小的字库与需求相比确实是捉襟见肘。为了弥补这一缺陷,一些软件设计者就采取在自定义区自造字(乃至占据字库中扩展B的位置)、有些也用图片方式来填字。而这些自造字、图片字,拷贝到WORD文本之后,由于内码位置的差异就变成其它字了,从而导致文本错误。
其五,功能单调,难以真正为科研服务。建立较早的古典文献数据库功能比较单调,只能做些简单检索、拷贝,没有更为先进的功能,不能适应学术研究的需要。后来的一些古典文献数据库也存在类似问题,例如《四库全书》的检索功能,虽说可以采用添加“作者”、“书名”等限定条件,但检索结果只是罗列一排出处,无法直观地了解检索到的具体内容。而且《四库全书》也没有提供更多的功能给用户,因此这一巨大的工程仍远远不能满足用户的需求。况且这一数据库目前已经“定型”,不再继续开发,使用户对此深感遗憾。而其它古典文献数据库设计者的思维大多仍停留在“文本之争”当中,重复着原来设计思想的错误,没有更多地开发为科研服务的有效功能,因此在笔者看来,这一做法显然不可能真正摆脱古典文献数据库目前面临着的困境。
其六,学术圈地,使人心有余而力难用。解放后,一些国家级出版社化费了极大的精力,组织专家点校了不少重要古籍,为学术研究的发展作出了极大贡献。然而时至计算机时代的来临,却出现了“版权”的问题。一些制作者忽视了国家有关版权法规,直接利用了一些出版社的成果来牟取经济利益,理所当然地会产生版权纠纷。笔者以为,保护版权是每个学者乃至每个公民应尽的责任,根本毫无讨价还价的余地。然而问题是,现在一些出版社由于各种原因,没有对自己已出版的点校过的古籍进行开发,而愿意开发这些古籍资源者却无法涉入其中,导致他们处于既想开发这一宝藏又无法回避版权问题的尴尬境地,这就使众多需要使用者望洋兴叹。如果有关出版社不愿授权,那么想要开发这些古籍者只能返回到没有标点的原始文本中去。这种情况确实使每一个希望使用古典文献数据库的用户感到极其失望,而且严重影响了古典整理与研究的现代化进度。
上述种种现实情况,已经是制约计算机技术对古典文献整理与研究支持的瓶颈了,如果不解决这些问题,计算机技术即使再发达,恐怕也难以对古典文献整理与研究予以真正意义上的支持与帮助。
三、如何解决古典文献数据库存在的问题
古典文献数据库存在的问题是十分明显的,那么如何解决这些问题,以利学术研究(当然包括文献研究)的迅速发展?笔者以为现在应该设计和开发出新一代文献数据库的软件。按照笔者设想,这代软件应该以建立能自由升级的公共古典文献数据库为目的,是一种以提供强大功能为主、彻底解决版权问题的数据库,实际上是建立一个规模巨大的功能相对完善的学术研究资源库。所谓公共古典文献数据库是综合性数据库,只能由国家有关部门作为主要规划者,它应该尽可能地包罗我国传世古典文献、碑刻资料和出土文献等。在此基础上允许建立适应每个研究者研究范围的个性化的文献检索服务系统。个性化的文献检索服务系统是指每个具体研究者所拥有的安装在各自计算机上的文献检索服务系统,它拥有一定数量的适合自己研究的范围的古典文献文本。其实,各个研究者并不需要一个“包罗万象”的规模极其巨大的数据库,即使象占据6至7个G硬盘的《四库全书》,具体到一个研究者真正需要的内容并不是全部,而是其中一部分内容。
问题的关键在于公共古典文献数据库与个性化文献检索服务系统两者之间的技术“契合”,即两者互相兼容的程度。公共古典文献数据库应该与个性化文献检索服务系统有所区别,公共古典文献数据库应该侧重于文献数量的完善、完备,而个性化文献检索服务系统则应该考虑其功能强大。因此,从本质上说,公共古典文献数据库应该是一个统一的设计比较周密、与其它个性化数据库在技术上能实现良好兼容的的数据库;而个性化文献检索服务系统应该是“百花齐放”式的但必须能与公共古典文献数据库兼容而非各自为政的小型数据库。两者关系是源与流的关系。鉴于此,笔者以为目前应该从两个层次上来解决问题,一是尽快建立公共古典文献数据库;一是继续开发个性化文献检索服务系统。
根据笔者近几年的实践,感到要解决这些问题并非不可能的。其实只要认真对目前计算机技术在古典文献整理与研究中存在的问题作一分析与梳理,重点突破一些瓶颈问题,应该说是能解决上述这些问题的。那么怎么才能突破上述这些瓶颈呢?笔者以为以下几个方面是值得考虑的。
其一,加强总体规划,建立公共古典文献数据库。作为一个具体单位来说,谁也没有可能建立一个包罗万象的古典文献数据库,因此,这只能由国家有关部门组织人力物力来完成。其实,就目前来说,国家投入资金并不少,但由于制度原因,只是向某些重点院校或科研单位、向重点项目投入巨资,而这些单位建立起各自为政的古典文献数据库、期刊数据库,虽然也为学术研究作了一些贡献,但不可否认的是,由于各自设计思路不同,相互之间不能兼容,已经妨碍到数据库进一步发展了。以笔者愚见,国家有关部门应该主动负起责来,加强领导,重新考虑古典文献数据库的立项问题,组织力量、投入资金,真正建立起一个规模巨大、能为绝大多数研究者利用的公共古典文献数据库。同时也应该考虑所立项的古典文献数据库与其它数据库(如现代文献数据库、当代文献数据库、期刊数据库等)之间的兼容关系,只有这样,或许若干年之后就能建立起一个价值极大的能真正为学术服务的公共古典文献数据库,乃至包罗一切文献的数据库。当然,就公共古典文献数据库来说,可以进行适量收费服务,但主要仍应该定位在“公益”上,不以“利”为主,这样才能真正建立一个有价值的公共古典文献数据库来。
其二,数据库内容与文献检索服务系统分离。这个问题与上述问题是紧密关联在一起的,如果不能真正做到数据库内容与文献检索服务系统分离,那么目前“列国纷争”的面貌是不可能真正解决的。
我们知道,一个古典文献数据库实际上是两大部分组成的,一是古典文献数据库内容,即数据库所包括的文献文本,二是对这些数据进行管理的文献检索服务系统。其实目前所见有关古典文献数据库都是“两者合一”,即既包含一些文献数据内容,又有具体的操作服务系统。事实上,这些古典文献数据库在功能上明显存在缺陷的。就目前古典文献数据库管理形式来说,一是网络管理,一是个人管理。前者是网络数据库,一般是单位所拥有的数据库,即我们所说的网络版,后者是安装在个人电脑中的个人版。就功能来说,网络版没有必要具有卡片、文本修订、书签等个性化的功能,个人版应该具有做卡片、文本修订、书签、文献管理等个性化的功能。就文献数量来说,网络版自然力求文献内容丰富,尽可能包罗文献文本,而个人版实际所需要的文献数量是根据各自研究需要而定的,因而强行“规定”使用所有文献内容并不值得肯定。就文献内容来说,网络版与个人版都应该允许不断地增加其数据库文献内容,但不同的是,网络版应该是只增不减,而个人版应该允许用户根据研究需要自由增减文献内容。
在笔者看来,应该从单纯的文本内容竞争的思维中解脱出来,进入以文献检索服务系统竞争为主,文本竟争为辅的体系,或许是解决古籍文献数据库的出路。也就是说,擅长计算机技术的开发者(开发商)应该注重文献检索服务功能的开发与完善,而具体文本的整理可由研究学术的专业人士来完成。这样,开发者就可能开发出比较成功的文献检索服务系统,而数据库中的文本也由于专业人士的加入而能大大提高文本的准确率,然后合成为一个规模较大的公共古典文献数据库。当然,输入和整理古典文献文本可以采用投标(或以申报项目形式)来确定,规定统一格式,要求保证文本的正确率达到一定比例,完成后再分别导入这一公共古典文献数据库中;经过若干年努力,最终能形成一个规模巨大、适应于学术研究的公共古典文献数据库。我想,采取这种措施不但节省了大量重复投资,真正做到人尽其才,物尽其用,而且一旦建立起这个规模巨大的公共古典文献数据库,可以解决了目前数据库泛滥、文本错误太多、重复劳动等弊病,而且真正能做到广大学者对古典资源“共享共有”。
在此基础上,各个开发商可以力求开发学者们个性化的文献检索服务系统,它无须考虑文献文本内容,但必须功能强大、操作方便,并与公共古典文献数据库完全兼容,学者们通过“购买”文本或其它方式来方便地组建自己的数据库,这样或许会给学术研究带来真正的方便。
还须补充的是,我国的古典文献中有大量表格与图片,而由于技术原因,目前所有古典文献数据库都没有导入原著的表格与图片,极个别数据库有少量图片也是不能检索,这是目前众多古典文献数据库的重大失误之一。其实只要真正化力气去探索,这个问题是不难解决的。因为笔者曾作过设计并反复试验,只要设计合理,图片与表格不但可以导入数据库,而且都是可以在数据库中进行检索。
其三,加速确定字库方案,以利数据库健康发展。当然,要真正解决公共古典文献数据库问题,还必须解决字库问题。目前,国家虽然组织专家在论证有关字库问题,然而由于进程不快,远远落后于当今计算机技术发展的需要。按照笔者的看法,应该建立一个以Unicode字库为基础的、适应汉语古籍需要的、并与国际接轨的真正有中国特色的字库。这就需要抓紧工作,迅速落实扩展字库B的内码。同时根据我国汉字的具体特点,对自定义区域的6400字的内码配置也应该有所规范,这样才能使汉语字库统一问题落实到实处。如果真能做到如此,那么就能真正解决目前古典文献数据库之间字库互不兼容问题。
与字库相关联的是字体问题。古典文献数据库应该考虑到古代文献对文字的特殊需要,笔者以为凡是古代文献数据库中的文本应该保留繁体字,以防繁简不分而导致文义偏差。就目前计算机技术来说,解决这一问题是毫无困难的。其实用繁体字输入文本早已不是问题,而扫描古籍文本再转换成文字的技术也十分成熟,如北京书同文公司的“数码翰林”OCR识别系统,应该说是极有价值的识别软件,对绝大多数繁体文字能够正确识别。如果能再进一步加以改进,使扩充字库数量并与Unicode字库兼容,那么古代文献的文字识别问题是可以得到解决的。应该强调的是,古代文献以繁体字导入数据库,但应该允许在数据库中自由进行繁简转换,换句话说,若需要使用繁体字时,文本可以保留繁体字,而需要简体时,可以十分方便地转换成简体,这样就适应用户对繁简体的不同需要了。
其四,彻底解决古典文献版权问题。这是困挠计算机古典文献数据库建设的重要难题之一。自然,这一问题要真正得到落实确实存在相当困难的,因为版权保护工作任重道远!不过,即使困难再大,古籍文献数据化的发展的潮流是不可能停止的。笔者以为,有关出版社在维护自身法定的版权权益的前提下,应该从大局出发,在收取一定数量的报酬前提下,允许制作有关古典文献的数据库,以利学术研究的发展。至于报酬多少可以也应该实事求是地酌情商定,国家有关部门应该主动与那些出版社协调,亦可将目前大量分散投入到各课题中的资金中抽出部分来补偿有关出版社,双赢互利,以求突破版权瓶颈,早日解决这一棘手的问题。
与此相关的是古典文献电子文本的版权问题,这也是个极难处理的问题。因为用户若贪图小利,版权意识不强,不愿化费代价使用电子文本,就容易产生“盗版”问题,如此就使得制作古典文献电子文本者的正当利益大受损失。按笔者设想,如果真正能够由国家有关部门主管古典文献数据库建设工作,那么就可以设想建立公共古典文献数据库规定导入数据库的文献文本都给予一个“统一编号”,没有统一编号的文献就不能直接导入公共古典文献数据库和个人使用的文献检索服务系统中,也就是说,个人使用古典文献电子文献必须化费一定的代价才能取得使用权,这样就可以保证制作古典文献电子文本者的一定收益,防止版权意识不强者侵权使用。同时由于古典文献电子文本都有了统一编号,那么也就可以防止某一具体文献文本重复录入的问题。即使有部分重复,古典文献电子文本也可以在用户选择过程中优胜劣汰。
其五,建立公平的交易平台。建立庞大的公共古典文献数据库当然需要投入巨大的资金,而这种古典文献数据库自然不是每一个普通研究者购买得起的。在笔者看来,大专院校、科研机构应该在经济允许的前提下购买有关数据库,以供教学、研究之需。当然也应该允许个人在交纳一定数量的经费后,自由上网使用这一数据库,并允许购买(下载)一定数量的古典文献文本,自行导入各自的文献检索服务系统,以利建立个性化的有实用价值的数据库。如果真能做到这样的话,那么就将会促进学术研究的迅速发展。
计算机技术研究方向范文3
(1)计算机技术
计算机技术是当代信息社会中的核心技术,具有明显的综合特性,主要包括计算机硬件、软件及计算机应用等技术。计算机作为一个完整系统,运用了系统结构、系统管理、系统维护及系统应用等方面的系统技术,其部件技术则涵盖了计算与控制、信息输入输出、信息储存等关键技术,计算机器件技术是计算机整个系统的物质基础,往往标志着计算机技术的变革。计算机软件主要包括系统软件、支撑软件和应用软件。随着网络技术的迅猛发展,系统软件在网络化、并行化及智能化等方向日趋成熟。软件开发方法作为软件开发技术研究的核心和基础,经历了结构化、面向对象的技术阶段,目前发展到了基于构件的新型软件开发阶段。计算机技术已广泛应用于工业、商业、金融、教育、医疗等各个领域,使我们的工作、学习和生活真正开始与数字化接轨,与信息化接轨。
(2)计算机技术发展的趋势
计算机系统目前采用的硬件体制与专门逻辑已不能适应软件日趋复杂的发展要求,客观上迫切需要创造出服从于软件发展的新体制。并行、联想、专用功能化以及硬件、固件、软件相复合,是新体制的重要研究方向。计算机软件技术主要呈现出网络化、融合化、可信化、智能化、工程化、服务化的发展趋势,软件工程的研究热点将主要集中在软件重用、构件技术、中间件、标准化技术等方面。纳米计算机、量子计算机等高性能计算机的研究是计算机应用技术发展的必然趋势,它将使计算机的运算速度提高数十亿倍,大大增强计算机的运算、逻辑操作、信息存储及处理能力。计算机智能化与巨型化的结合也是未来计算机技术的发展趋势,智能化可以使计算机在现代科学基础之上模拟人的思维逻辑过程及人的感官行为,代替人们进行日常的听说读写想等行为过程;巨型化则主要突出巨型计算机的包容量大、运算能力强,功能强大等方面的特性。
2通信技术与计算机技术的融合
(1)计算机网络通信技术
计算机通信技术不但具有较高的传输效率、较短的呼叫等待时间,还具有较强的抗干扰能力、很好的兼容性和多样化的通信形式。当计算机通信技术与大容量、高速率的通信网络深入融合后,计算机网络通信技术应运而生,极大地推动了诸多领域的信息化水平,已广泛应用于经济、军事、生产、教育、科学技术及日常生活等各个领域。新世纪计算机网络通信技术的重要特征是数字化、网络化和信息化,它本质上是一个以计算机数据处理和网络通信为核心的信息时代,许多国家都正在致力于研究和制定本国信息基础结构的规划,这使计算机网络通信技术的发展进入了一个新的历史阶段,其应用范围和应用领域正得到不断拓展,对人类产生了极为深远的影响。
(2)信息技术
信息技术作为现代化高科技的先导性技术和关键性技术,其核心还是计算机和通信技术。知识和信息资源通过计算机的收集、整理、加工,转换为新经济时代的新商品———知识产品,因此我们形象地将计算机比喻成知识产品的“加工厂”。如果说计算机是现代社会中的一个个“神经元”细胞,那么由程控交换机、光纤网、通信卫星及其他现代化通信设备构成的覆盖全球的通信网络就是现代社会的“神经系统”。随着新经济时代信息化日臻成熟,云计算、移动互联网和物联网等新一代信息技术的广泛应用,信息的增长速度越来越快,信息类型越来越丰富,做为重要的战略资源,信息的价值日渐凸显,因此许多科学家将传递信息的通信技术称作知识经济的生命线。随着现代通信技术的发展,已扩大了人类信息流动的范围,缩短了信息传递的时间。
(3)通信技术和计算机技术的融合发展趋势
随着通信技术和计算机技术的不断发展,二者融合的速度必将不断加快。现代通信网技术正朝着宽频带、大容量、远距离、多用户、高效率、高保密性、高可靠性、高灵活性的宽带化、个人化、智能化和综合化的方向发展,要求能够支持各类窄带和宽带、实时和非实时、恒定速率和可变速率的业务,尤其是支持多媒体业务。这些需求必然依赖于计算机技术强大的运算能力、处理分析能力和信息存储能力。反过来,计算机技术正朝着开放、集成、高性能和智能化的方向发展,要充分发挥计算机技术在高端科学计算方面、大数据处理、云计算方面的作用,促进科学研究取得新的突破,使人类的工作、生活更加高效,必须依赖于光纤传输网络、无线宽带网络等通信技术的进步。因此,计算机技术与通信技术相互依存、相互促进,二者的融合发展是必然趋势。
3结束语
计算机技术研究方向范文4
关键词:计算机科学与技术;发展趋势;信息化
引言
计算机科学与技术的发展及应用标志着人类已经进入到信息化时代,而随着社会科学技术的不断发展,计算机技术水平也越来越高,在推动社会发展和进步中发挥着越来越重要的作用。而随着社会的进步与发展,计算机科学与技术发展速度也会越来越快,其应用范围也会越来越广。在现代社会里,计算机科学与技术的作用是显而易见的,以计算机科学与技术为核心,我国社会经济将取得更好的发展成绩。
1 计算机科学与技术的发展现状
1.1 发展速度快、应用普遍
随着社会的快速发展,计算机科学与技术的发展速度越来越快。科技作为第一生产力,计算机技术的发展给科技生产提供了新的动力。计算机技术总是在实践中不断地完善和发展,以先进的计算机技术来带给人们更好的服务。而在当下,计算机科学与技术的应用也越来越普遍,已经渗透到社会发展的各个领域,给现代社会的发展带来了重大影响。
1.2 专业化、多功能化
在计算机科学与技术应用过程中,计算机科学变得越来越专业化,与各行各业的发展越来越紧密。在现代社会里,计算机科学与技术已成为各行各业提高自身竞争实力的有效途径,而计算机科学与技术的广泛应用带动了计算机科学的专业化发展。各行各业越来越看重专业化的人才培养,越来越看重产品的多功能性,而在现代社会里,只有多功能的产品,才能受到人们的关注。
2 计算机科学与技术快速发展的原因
2.1 社会发展的需要
在社会发展进程中,计算机科学与技术也在不断发展,可以说,计算机科学与技术是随着和会的发展而发展,计算机科学与技术是为社会发展服务的。起初,计算机的发展是为了满足时展对信息处理的需求。开始计算机性能也仅仅是满足了信息处理的需要,而且信息处理速度不够快。而在现代社会里,计算机的应用已经普遍化,社会发展对计算机性能要求也越来越高,而为了满足社会发展的需求,计算机科学与技术的研究也越来越深入,计算机科学与技术发展速度也越来越快[1-2]。
2.2 科技飞速发展的必然结果
在现代社会里,科技更新速度越来越快,科技的日新月异必然会带动计算机科学与技术的发展。技术作为社会发展的动力,随着信息技术的发展,人们对计算机科学与技术的研究也越来越深入,从而带动计算机科学与技术的发展,更好地满足社会发展的需求,推动社会的进步与发展。
3 计算机科学与技术在现代社会发展中的作用
在现代社会里,计算机科学与技术的应用越来越普遍,所起的作用也越来越提出。首先,计算机科学与技术的发展推动了经济的发展。在现代社会里,各大行业纷纷利用计算机来进行管理,在计算机技术的依托下,提高了企业管理水平和效率,实现了信息的贡献,为企业带来了更好的经济效益。对于企业而言,企业经济效益提高,企业在市场经济中的活跃度就会提高,从而推动经济的发展;其次,推动教育事业的发展。教育作为我国现代社会人才培养的主要途径,而计算机的出现丰富了教学方法和内容,有助于教育事业的更好发展;再者,计算机科学与技术的发展加快了工业社会向信息化社会转化进程。计算机技术促进了劳动资料的变革以及劳动方式的变革,现代信息技术为人们提供了更为方便、快捷的处理、存储和传递信息的手段;劳动生产率的提高给予人们日益增多的闲暇时间,即人们能够更多地从事各项事业的创造性活动[3]。
4 计算机科学与技术的发展趋势
4.1 智能化的发展趋势
计算机作为一种设备,它在现代社会发展过程中发挥着重大作用。然而随着社会的发展,计算机需要处理的数据越来越多,越多越大,计算机在运行过程中所暴露出来的问题也越来越多,普通的计算机已经难以满足当下对大数据的计算需求。而智能化的计算机将有望解决当前计算机面临的问题。展望未来,计算机的发展必然要经历很多新的突破。从目前的发展趋势来看,未来的计算机将是微电子技术、光学技术、超导技术和电子仿生技术相互结合的产物。在实际应用中,计算机可以通过独特的设计机构、平行技术等技术实现计算机运行过程中各种数据、指令的合理性分析,从而推动计算机科学与技术的智能化发展。在未来的发展道路上,智能化必将成为社会发展的主要趋势,利用智能化计算机可以完全取代人工,提高工作效率,更好地满足社会发展的需要[4]。
4.2 高性能的方向发展
计算机性能问题一直是计算机科学与技术研究的重点。当前,许多计算机都是通过采用合适的芯片来完成相关操作。而在信息时代里,计算机需要处理的信息数据量越来越大,各行各业对计算机性能要求也越来越高。就我国现阶段的计算机科学与技术水平来看,与世界发达国家还存在一定的差距,由于计算机技术水平有限,计算机性能还有待于提高。故此,在计算机科学与技术未来发展道路上,高性能的计算机研究已成为必然。只有加大计算机科学与技术的研究,才能提高计算机的系能,从而更好地满足实际发展的需要,发挥计算机的优越性[5]。
4.3 体验式的发展
所谓的体验式就是让消费者参与、体验和感受。在现代社会里,体验式符合了以人为本的现念,已成为社会各行各业相互竞争的一大举措,如企业开展产品体验,让消费者更好地感受产品的功能,从而促使消费者购买。对于计算机科学与技术而言,它是为社会发展所服务的,在计算机科学与技术未来发展道路上,就应当积极地朝着体验式的方向发展,不断去完善服务和运用理念。体验式是注重人的实际感受的,将人的需求和愿望通过科技的进步体现出来,更好地满足人的欲求。人是计算机操作和运用的主体,而计算机在当代越来越成为个人以及企业实现个人行为以及目的的途径,计算机的服务也只有更加去人性化,才能获得更好的市场反馈[6]。
5 结束语
综上所述,计算机科学与技术的发展已成为我国现代社会发展的重要一部分,正在逐渐渗透社会发展的各个领域。计算机科学与技术的发展改变了人们的生活、学习、工作方式,提高了社会发展速度。而随着计算机科学与技术研究的深入,计算机科学与技术也逐渐向着智能化、高性能化、多元化的方向发展,将真正地实现工业社会向信息化社会的转变,推动社会的更好发展。
参考文献
[1]郑宏莉.探究计算机科学与技术的发展趋势[J].黑龙江科技信息,2014,36:149-150.
[2]刘博.浅谈计算机科学与技术的发展趋势[J].计算机光盘软件与应用,2015,03:106-107.
[3]谢平.对计算机科学与技术发展趋势的探讨[J].计算机光盘软件与应用,2012,05:125-126.
[4]甘黛娴.计算机科学与技术的发展趋势探析[J].计算机光盘软件与应用,2012,06:97+96.
[5]吾买尔・孜亚吾东.计算机科学与技术发展趋势研究[J].电子世界,2013,15:16-18.
计算机技术研究方向范文5
本文结合网络日志数据挖掘技术,通过对Frame页面和SubFrame页面进行分析,提出基于改进的F
>> 基于数据挖掘的网络日志分析 Web日志挖掘中的数据预处理研究 Web日志挖掘的数据预处理研究 基于Hadoop的网络日志挖掘方案的设计 Web日志挖掘中的数据预处理技术研究 Web日志挖掘中的数据预处理技术研究与实现 网络日志随心记 网络日志引发的教学思考 高校网络日志大数据分析平台研究 数据挖掘预处理技术的研究 基于Python语言的网络日志处理系统设计 WEB日志数据预处理算法研究与实现 基于Web日志挖掘的页面兴趣度方法的改进 Web日志挖掘中预处理过程的具体研究 Web日志挖掘预处理中会话识别算法的优化 网络日志系统在教学应用中的研究 接受美学视野下的网络日志文学 写不一样的网络日志 微地震数据预处理方法研究 数据挖掘的预处理技术研究 常见问题解答 当前所在位置:l,top.html,left.html,main.html,…}
输出:判定策略
For each users session
{
currentframe=null
make_node(web)
if((cerrenframe, pid, ∈FS) make_tree(currentframe,web_left)
Else if pid, ∈dom(FS)
{curremtframe pidi make_decition_tree(currentframe,web_left}
else make_decition-tree(currentframe,web_rleft
if attribute_list=null{make_decition_tree(currentframe,web_right);}
else if(one ofattribute_list)>allgain
currentframe=test-attribute;
make_decition(ai,web_left)
Else generate_decision_tree(ai,web_right)
}
上述策略认为,访问站点的页面为根节点,具有信息增益最高的特征,currentframe变量记录web当前页面pidi。若当前页面pidi不属于frame页面,则归类左子树,反之当前页面pidi归入右子树。即pid,∈DOM(FS)。而frame页面的subframe页面归类左子树。这样一来,frame页面为决策树右树,subframe页面为决策树左树,subframe页面在会话识别阶段得到保留,以便后续路径补充。该方法优化了站点的组织结构,较好提升了网络日志数据预处理效率。
3 实验分析
我们通过Frame页面过滤预处理方法实验,验证本文提出的改进方法。实验提取700个日志所记录的访问页面,共20万条日志文件,结合本文提出的改进Frame页面网络日志数据挖掘预处理方法,与传统页面预处理方法进行对比测试。结果如表1所示。
在表1中,绝对支持度表示用户频繁访问页面的最小会话数,FSi表示用户频繁访问页面集合数,*为用户不感兴趣的页面集,表示页面集是用户感兴趣的,表示页面集用户感兴趣程度加强。实验表明,改进Frame页面过滤方法相比传统方法,预处理结果得到提高,因此,网络日志的数据挖掘效率得到加强。
4 小结
本文通过对网络日志数据挖掘预处理技术进行分析,结合预处理过程中的实际情况,着重考虑SubFrame页面剔除对站点组织结构的影响,提出了改进的Frame页面网络日志数据挖掘预处理方法,实验表明,该方法较好的提高了网络日志数据挖掘的预处理精度和效率。
参考文献
[1]方元康等.一种改进的Web日志会话识别方法[J].计算机技术与发展,2008,18(11):214-216.
[2]朱明.数据挖掘[M].合肥:中国科技大学出版社,2008:13-56.
[3]朱志国等.持久偏爱的Web用户访问路径信息挖掘方法[J].情报学报,2010,29(2).
[4]凌海峰等.基于混合蚁群算法的web用户会话聚类[J].计算机工程与应用,2013(22).
[5]韩法旺.Web日志挖掘数据预处理过程研究[J].南京工业职业技术学院学报,2012(2).
[6]凌海峰等.基于聚类的web用户会话识别优化方法[J].计算机应用研究,2012(8).
作者简介
龚垒(1984-),男,河南省淅川县人。现为南阳医学高等专科学校助教。研究方向为计算机应用技术。
计算机技术研究方向范文6
【作者简介】
赵春江现任国家农业信息化工程技术研究中心、北京农业信息技术研究中心和农业部农业信息技术重点开放实验室主任,北京农业信息化学会理事长。
长期从事农业和农村信息化技术研究应用工作,主要研究方向为农业智能系统和精准农业。
2009年,我国农业和农村信息化应按照“统筹城乡、协调发展,促进经济、拉动内需,改善民生,引导消费”的指导思想,围绕提高农村收入、做好公共服务、扩大就业渠道、改善生活条件等工作,加强农业信息技术研究开发和农村信息服务硬件条件建设,整合现有信息资源,大力推广应用低成本信息技术产品,提高农村信息服务能力。
精准农业与智能装备技术
1. 3S技术集成应用是重要方向。重点是充分利用全球定位系统、遥感监测系统、地理信息系统以及农业专家系统等技术,对整个农业生产的前期、中期、后期进行细化管理; 以3S技术为基础的农业资源管理、产业布局优化、农情监测、灾害预警、突发事件处理,以及面向政府职能部门的管理决策等需求,将成为信息技术快速发展的重要驱动力。
2. 无线传感器网络技术前景广阔。作为“普适计算”思想衍生的产物,无线传感器网络的优点和特点已经日趋得到认可,特别是无线传感器网络和已有的网络体系结构相互结合,将有利于解决当前农业生产中的信息现场在线采集问题,预期无线传感器网络在现代农业生产和管理中的应用前景会十分广阔。
3. 智能化农业装备是重要突破点。以信息技术和智能装备技术为支撑,综合现代种(养)植业管理方法,以提高农产品产量、品质和改善环境为目标的精准农业,已成为国际上现代农业发展的前沿,将是今后一定时期内信息农业的重要发展方向。集成遗传算法、模糊逻辑、人工智能技术,研制智能化的生产工具、智能装备(机械/仪器)、农业智能机器人等将是现代农业发展的重中之重。
农产品安全质量
全程信息化监管
十七届三中全会明确提出,“加强农业标准化和农产品质量安全工作,严格产地环境、投入品使用、生产过程、产品质量全程监控,切实落实农产品生产、收购、储运、加工、销售各环节的质量安全监管责任,杜绝不合格产品进入市场。支持发展绿色食品和有机食品,加大农产品注册商标和地理标志保护力度”。因此,面向主要农产品供应链管理,集成应用计算机技术和自动识别技术,构建农产品质量全程监管技术体系,对于加强政府对农产品安全的监管能力、满足消费者知情权、整体提升农产品的市场竞争力等都将起到重要作用。
1. 农产品生产过程质量控制软件需求旺盛。随着我国在农产品生产领域逐步推广GAP和HACCP体系,对基于该体系的农产品生产过程质量控制的软件需求将会日趋强烈,能够衔接无公害、绿色和有机农产品生产标准和实现定量化GAP风险分析是体现信息系统价值的关键,而运行在便携式PDA和手机等终端上的嵌入式信息系统产品,则特别适合我国当前农产品的分散式生产模式。
2. 汉信码和RFID技术将得到广泛应用。作为我国具有自主知识产权的成果,汉信码(GB/T 21049-2007)必然将在农产品供应链全程,尤其是产品包装标识领域得以大范围推广和应用; 条码及RFID读写器将向多功能、多接口、多制式、模块化、小型化、便携式、嵌入式等方向发展,RFID中间件技术将广泛应用于农产品供应链全程信息管理和传递。
3. 基于协同供应链的农产品流通信息化是必然趋势。农产品流通是完整的供应链体系,是完整的协同商务过程。一个农产品生产企业在农产品供应链中既是上游农产品物资供应企业的消费者,又是下游农产品加工企业的原料供应者。这一环环相扣的农产品协同供应链的信息化和智能化管理信息系统,是目前国内外研究机构和大型信息化产品供应商的研发方向。
4. 市场需要多途径溯源技术及制定标准规范。需要研究计算机网络、无线通信网络和电话网络对同一数据库的访问协议,开发支持短信网关、PSTN网关、IP网关的通用API,实现同一数据库下的多方式查询。最终实现计算机网络、无线通信网络和电话网络多途径追溯,并逐渐形成各途径溯源的标准规范。
农村信息化服务
1. 多网络集成和融合是必然趋势。农业信息的“最初一公里”、“最后一公里”、资源信息共享等是今后需要解决的突出问题,十七届三中全会提出“推进广电网、电信网、互联网‘三网融合’,积极发挥信息化为农服务作用”,为今后农村网络基础设施整合提供出了新的要求。基于计算机网络、电视网络、电信网络甚至卫星通信网络融合的集成应用将是我国未来农村信息发展的重点。