分割技术范例6篇

前言:中文期刊网精心挑选了分割技术范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

分割技术

分割技术范文1

【关键词】区域图像分割;边缘图像分割

1.图像分割技术

1.1 基于区域的图像分割

图像分割中常用的直方图门限法、区域生长法、基于图像的随机场模型法、松弛标记区域分割法等均属于基于区域的方法。

1.1.1 直方图门限法

直方图门限分割就是在一定的准则下,用一个或几个门限值将图像的灰度直方图(一维的或多维的)分成几个类,认为图像中灰度值在同一个灰度类内的像素属于同一个物体,可以采用的准则包括直方图的谷底、最小类内方差(或最大类间方差)、最大熵(可使用各种形式的熵)、最小错误率、矩不变、最大繁忙度(由共生矩阵定义)等。门限法的缺陷在于它仅仅考虑了图像的灰度信息,而忽略了图像中的空间信息,对于图像中不存在明显的灰度差异或各物体的灰度值范围有较大重叠的图像分割问题难以得到准确的结果。

1.1.2 区域生长法

区域生长是一种古老的图像分割方法,最早的区域生长图像分割方法是由Levine等人提出的。该方法一般有两种方式,一种是先给定图像中要分割的目标物体内的一个小块或者说种子区域,再在种子区域基础上不断将其周围的像素点以一定的规则加入其中,达到最终将代表该物体的所有像素点结合成一个区域的目的;另一种是先将图像分割成很多的一致性较强,如区域内像素灰度值相同的小区域,再按一定的规则将小区域融合成大区域,达到分割图像的目的,典型的区域生长法如T.C.Pong等人提出的基于小面(facet)模型的区域生长法,区域生长法固有的缺点是往往会造成过度分割,即将图像分割成过多的区域。

1.1.3 基于图像的随机场模型法

基于图像的随机场模型法主要以Markov随机场作为图像模型,并假定该随机场符合吉布斯(Gibbs)分布。使用MRF模型进行图像分割的问题包括:邻域系统的定义、能量函数的选择及其参数的估计;通过极小化能量函数从而获得最大的后验概率。邻域系统一般是事先定义的,因而主要是后面两个问题。

S.Geman首次将基于Gibbs分布的Markov随机场模型用于图像处理,详细讨论了MRF模型的邻域系统,能量函数,Gibbs采样方法等各种问题,提出用模拟退火算法来极小化能量函数的方法,并给出了模拟退火算法收敛性的证明,同时给出了MRF模型在图像恢复中的应用实例。在此基础上,人们提出了大量的基于MRF模型的图像分割算法。

1.1.4 松弛标记区域分割法

标记法(labeling)就是将图像欲分割成的几个区域各以一个不同的标号来表示,对图像中的每一个像素,用一定的方式赋之以这些标记中的某一个,标记相同的连通像素就组成该标记所代表的区域。

标记法常采用松弛技术来给图像中的各个像素赋予标记,一般可分为离散松弛、概率松弛、模糊松弛等三种。Smith等人最先采用松弛标记技术进行图像分割,以后人们又提出了大量的图像松弛分割算法。另外,松弛标记不仅可用于图像分割,还可用于边缘检测、目标识别等。

2.基于边缘的图像分割

基于边缘的分割方法则与边缘检测理论紧密相关,此类方法大多是基于局部信息的,一般利用图像—阶导数的极大值或二阶导数的过零点信息来提供判断边缘点的基本依据,进一步还可以采用各种曲线拟合技术获得划分不同区域边界的连续曲线。根据检测边缘所采用的方式的不同,边缘检测方法可大致分为以下几类:基于局部图像函数的方法、图像滤波法、基于边界曲线拟合的方法及活动轮廊法等。

2.1 基于局部图像函数的方法

基于局部图像函数法的基本思想是将灰度看成高度,用一个曲面来拟合一个小窗口内的数据,然后根据该曲面来决定边缘点。

其中这种方法比较适合于医学图像的分割。除了用Fourier模型来描述曲线外,近年来还研究了一些其它的曲线描述方法,如A.Goshtasby详细介绍了用有理Gaussian曲线和曲面来设计和拟合二维及三维形状的方法。R.Legault等人给出了一种曲线平滑的方法。M.F.Wu等人给出了一种双变量三维Fourier描述子来描述三维曲面。由于本人阅读文献有限,这里不多做介绍了。

2.2 图像滤波法

图像滤波法是基于如下理论的:即对滤波算子与图像的卷积结果求导,相当于用算子的同阶导数与图像做卷积。于是,只要事先给出算子的一阶或二阶导数,就可以将图像平滑滤波与对平滑后的图像求一阶或二阶导数在一步完成。因而,这种方法的核心问题是滤波器的设计问题。

常用的滤波器主要是高斯函数的一阶和二阶层数,Canny认为高斯函数的一阶导数是他求得的最优滤波器的较好似近,一般采用Laplacian算子求高斯函数的二阶导数得到LOG滤波算子,该算子由计算机视觉的创始人Marr首先提出。

2.3 基于边界曲线拟合的方法

基于边界曲线拟合的方法用平面曲线来表示不同区域之间的图像边界线,试图根据图像梯度等信息找出能正确表示边界的曲线从而得到图像分割的目的,而且由于它直接给出的是边界曲线而不像一般的方法找出的是离散的、不相关的边缘点,因而对图像分割的后继处理如物体识别等高层处理有很大帮助。

L.H.Staib等人在文献中给出了一种用Fourier参数模型来描述曲线的方法,并根据贝叶斯定理(Bayes),按极大后验概率的原则给出了一个目标函数,通过极大化该目标函数来决定Fourier系数。实际应用中,先根据对同类图像的分割经验,给出一条初始曲线,再在具体分割例子中根据像数据优化目标函数来改变初始曲线的参数,拟合图像数据,得到由图像数据决定的具体曲线。

2.4 活动轮廓法

活动轮廓(又称Snake模型)是一种可变形模型,最初由Kass等人提出。活动轮廓法边缘检测认为图像中各区域的轮廓线应为平滑曲线,各轮廓线的能量由内部能量及外部能量两部分组成,其中内部能量表征了轮廓线的光滑约束,图像能量由轮廓线上对应点的灰度、梯度和角点曲率半径等决定,而控制能量则代表了图像平面上固定点对轮廓线的吸引或排斥作用。

参考文献

[1]王慧燕.图像边缘检测和图像匹配研究及应用[D].浙江:浙江大学,2003:5-10.

[2]曾欢,王浩.图像边缘检测算法的性能比较与分析[J].现代电子技术,2006(14):20-21.

[3]游素亚,杨静.图像边缘检测技术的发展与现状[J].电子科技导报,1995(8):13-15.

[4]李骞,陈占伟.图像边缘检测新技术及其应用[N].许昌学院学报,2006(25).

[5]伍尤富.图像处理中边缘检测研究方法[J].舰船电子工程,2006(4):10-12.

分割技术范文2

杂家与专家:定位要准,相得益彰

在学校里,信息技术教师往往是个“多面手”:在校园网建设中,是网络建设、维护专家;在计算机出问题时是个熟练的维修工;在教学课件制作时,要熟练运用相关软件;在学校考试分数统计、汇总时又应是个编程专家;在学校各类重大、重要活动中,又可能是摄影师、音响师……这一切都说明信息技术教师是个名副其实的“杂家”,但这个“杂”的背后其实是“专”,信息技术教师要清醒地认识到,信息技术课的教育教学才是教师最重要的阵地,不能因为“杂务”而影响了“主业”。要尽力做到“一切东西懂一点,某一东西懂一切”,只有掌握了较为精深的专业技术,向专家型教师靠拢,成为不可替代的人才,才能真正赢得学校的尊重与信任和学生的尊敬与喜爱。

训练与讲解:目标要明,相互补充

实践性强、动手操作能力要求高,是信息技术课程的突出特征,首先,大部分的教学内容都是在计算机房内完成;其次,教学目标的达成也以学生是否能熟练操作、运用某种软件、掌握某种技术为标杆;再次,除了上课以外的时间,学生不太可能如同其他课程那样花费更多的时间。因此,要在极为有限的时间内提高课堂的有效性,这是信息技术教师必须时刻考虑的问题。上课时间的30%用于理论讲解、评价总结,教师要精心设计教学语言,清晰讲解,清楚表达,明确任务,不嗦跑题、晦涩难懂。其他70%的时间用于学生的实践操作,教师要巡回指导,做到耐心细致、不厌其烦。可以采取多种手段提高教学的有效性,如组建学习小组、培养“小老师”、设定项目目标等,这里不再赘述。

教材与拓展:角度要巧,相互辉映

信息技术本身就是一个开放的体系,所以信息技术相比其他的课程,变化更快而且无穷无尽,现有的信息技术教材往往很快就会落后,学生刚刚学习的知识、技能很快就会被淘汰。课程名称也由“BASIC语言”调整为“计算机基础”,到现在的“信息技术基础”,教学目标从掌握程序设计到计算机技术,到现在的提高信息素养……

基于以上认识,信息技术教师就应与时俱进,立足课内、放眼未来;立足课本,放眼世界,善于学习,及时捕获现代教育信息技术的发展趋势,不断刷新已有的知识体系。在处理教材时,大胆进行“二次开发”,授课内容要精心取舍,不断补充“新鲜血液”,增强时代感、时效感,把新思想、新技术、新发展引入课堂,提升学生的兴趣,开拓学生的视野。不仅要教会学生掌握基本的技能,更要教会学生学会学习,主动关注、获取计算机技术发展前沿信息,获得触类旁通、举一反三、自我更新已有知识体系的能力,“授生以渔”在这里有了更为具体的现实意义。

上课与反思:思考要深,相互促进

反思主要有两个途径:一是“自我反思”。教师通过上课,自己总结备课的得失、上课的成败、学生的反应等,在总结思考的过程中,自己的认识往往会得到升华,这是一种微妙与美妙并存的感受,这时,成功和失败都成了收获。二是“寻求外智”。“当局者迷,旁观者清”,很多时候,教师在上课过程中所呈现的优点和暴露的问题,如果没有别人指出来,他自己是很难发现自己的成功之处和不足之处的。这时,专家、同行甚至学生提出的建议、意见就显得十分宝贵,每次公开课、研究课之后,教师要就上课的特色亮点、缺点不足、教学技巧、起承转合等主动请教,特别是把诊断出的问题进行详细记录,便于在以后的课堂中调整、修改。

如果将上课比作一块璞玉,那么反思就是高明的雕刻师,能敏锐洞察到这块璞玉的优势、劣势所在,从而去劣存优,扬长避短,在一个个循环往复的磨炼中,美玉日趋成形,课堂日臻完美。

情感与技术:表达要真,共享和谐

信息技术教学,不仅是把知识“输入”到学生的大脑的过程,更是师生间和谐关系形成的过程、学生品德形成的过程、素养提升的过程。因此,信息技术教师走进课堂,不仅要带着技术,更要带着情感。

学生的个体差异性决定了教学的多样性,只有教学共性与学生差异性相得益彰,信息技术课堂中的师生关系才是和谐的。教师每接手一个新授课班级,首先做的就是尽快熟悉、了解相应班级情况,通过走访班主任、咨询其他任课教师、进行课堂观察等途径,了解学生的信息技术经验、兴趣爱好、学习偏好等,从而调整教学策略。越是注重学生的个体差异,越能提高每一个学生的学习成就感、收获率。笔者发现,学生家庭所处的社会阶层对教育成效影响很大,在信息技术的掌握上,来自农村家庭的学生信息技术水平没有来自城市家庭的学生高,后者往往在年龄较小时,有更多的机会接触计算机、网络等先进媒体,有些学生甚至因为成了信息技术课上的“小专家”、除教师以外的“民间权威”而受到其他学生的追捧;而前者则对计算机、软件、操作系统、网络等还充满着好奇、敬畏、神秘感,进而自卑。因此,如何处理这些“差异”就成为信息技术教师的重要工作,在教学过程中要尽力消除自身有意无意、显性或潜在的偏见,要让每个学生感受到来自教师的真诚的关注、亲切的关心。

结果与过程:评价要全,共同提升

笔者认为对信息技术的考核应该改变传统的“一考定终身”的考核方法,让学生充分享受信息技术学习的过程和乐趣,忠实记录他们技能达成的程度,一个有效的方法就是建立学生的学习档案。档案是一个学生成绩的有计划的汇编,收集了该学生已经达成的目标以及所采取的步骤,代表着教师、学生的协作努力,显示了学生在整个学期或学年在能力和技能上的成长,能完美地评估学生最后的掌握情况、思考结果,向教师、家长、学生本人展示出一个更为立体、丰富的结果。档案式的过程评价所提供的信息,是笔纸测试、“快照式”评价等其他测量工具所不能提供的。而且,信息技术课还可以利用本身优势,为每位学生建立一份独特的电子档案,这就更符合时代的要求、更契合时代的进步了。

主角与配角:认识要高,共担职责

分割技术范文3

摘 要: 差错复原技术已成为易发生差错信道下视频编码的重要组成部分。本文实现了一个基于数据分割和可逆变长编码的具有差错复原性能的H.263编解码器。通过利用数据分割、可逆变长编码、差错掩盖等技术,并利用第三代移动通信系统的信道差错模型对该编解码器的差错复原能力进行了实验。实验结果表明,在无线移动信道的恶劣环境下,在综合利用多种差错复原技术后,重建图像的主客观质量得到了明显的改善。

关键词: 差错复原 数据分割 可逆变长编码 H.263

点击查看全文

注:本文版权归本站所有,为黄金会员资料,只有黄金会员可以查看。

提示:您还没有登录 无法阅读全文 请先 登陆 注册 点击此处申请黄金会员

分割技术范文4

【关键词】三网融合物理网络有线电视网络

1、概述

“三网融合”成为业界关注的热点,人们普遍看好信息产业广泛的市场前景,各地政府和国内外有关企业也都跃跃欲试。那么,“三网融合”目前的现状究竟如何?在中国实现“三网融合”还存在哪些主要问题?“三网”各自的技术特点是什么?哪个才是三网融合后物理网络的最终选择?本文从以上几个方面入手,拟对“三网融合”走过的历程、目前的现状及其最终物理网络的选择作一些探讨和分析。

2、“三网融合”的现状及存在的问题

-所谓的“三网”,是指电信业务网、广播电视网和计算机网,但这并不是在物理概念上的分割,而是在业务上的分割。实际的网络(即物理网络)其实只有通信网和广播电视网,其名称也是因模拟领域业务和技术相关而形成的。因为在模拟领域,不同的业务对传输方法有不同的要求,因而形成不同的网络。因此,从某种意义上说,“三网”都是模拟传输的产物。在数字领域,所有的语言、文字、图片和图像等信息都是以“0”和“1”的数字信号出现,因此对数字网来说不存在几个网的问题,多个业务网完全可以共存于一个物理网中。信源的数字化导致了信息的汇聚,进而导致了三网的融合。

所谓“三网融合”,指的是将计算机网、电话网和电视网有机地融合起来,以降低总的成本投入,方便人们的使用,提高效率,产生更多的经济效益和社会效益。我们知道,技术进步总是从一个方向、一个领域或一种装置上逐步取得突破的,而人类对技术的需求却是以自我为中心的,而且是全方位的,这就是“三网融合”的原始驱动力。“三网融合”正逐渐成为世人瞩目的焦点,同时也孕育着巨大的市场机会。尤其是在二十世纪末,这一领域已经发生了突破性的变化。外国的大型计算机企业,如微软、索尼等公司,已经把“三网融合”作为其今后发展的业务重点而加以大力推进。前不久闹得沸沸扬扬的微软“维纳斯”计划就是瞄准了这一市场。就国内而言,北京、上海、青岛、重庆、江西等省市已经在开展这方面的探索,如上海广电集团研制的“SGIT三网合一”多媒体信息网络系统,就准备在在其公司开发的居民住宅小区进行试运行;而重庆华信高技术公司日前则声称其成功地开发了“三网合一”的HFC用户接入系统,能够利用有线电视网并行传输电视、电话和计算机信息;中信国安、海信电器等上市公司也已经在这一领域迈出了扎实的一步。总的说来,国内已有不少地方和企业瞄准了“三网合一”广阔的市场前景,准备或已经实施其抢占滩头的战略计划。但就目前而言,他们之中大多数还处于投入阶段,现阶段还没有收到显著的效益,但有一点是不容置疑的,那就是:国内、国外有远见的企业已经在悄悄瓜分这一市场,星星之火将在不久的将来将演成燎原之势。

纵观世界IT产业,自康柏和Digital之间的“世界购并”后,1998年6月全球的第二大电信公司棗北方电信以91亿美元收购了全球的第三大计算机网络公司棗贝网,标志着业务融合的屏障开始大片拆除,一个大范围的电信产业和计算机产业走向统一的浪潮即将来到。全新的企业形象将引出全新的产业格局。就国内而言,信息产业部的成立,标志着我国产业格局也将发生巨大的变化。但我国的电信网、有线电视网和计算机网是否能马上合并成一个统一的网络呢?由于长期的地方经济保护主义和传统经济模式的影响,加上电信和广播电视网本身技术层面及经营模式上的差别,要在我国实现三网融合,仍存在着大量亟待解决的问题。

我国三网的发展和数字化的实现,都是在原有业务上发展起来的。因此它们之间存在着不兼容的问题。如IP网近年来以惊人的摩尔速度发展,千兆路由器已进入实用阶段。但其IP协议是由互联网业务发展而来的,主要适用于小容量非实时业务,因此在用于大容量的广播电视时,大容量广播电视实时传输和质量控制方面仍存在着明显的问题。同时,经济可行性问题也非常突出。据有关资料统计,截止到1999年,我国互联网出口不足80Mbps,而上网用户已达140万户,占用通道平均5714bps,若考虑少数大容量用户,一般用户远小于这个数字,但来自每个用户的收益远远超过相应的有线电视,要在IP网上挤出几百兆来实现电视的接入是不可能的。同样,也很难要求在使用300-3400Hz带宽已经实现可观收入的情况下用原有通信网来实现电视的接入。有线广播电视网的业务是由其性质所决定的,主要是传播党、政府、人民需要的广播电视信息。当然,可以利用网络的优势,开发多功能业务。但想在网上完全取代固定电话公司的话音业务也是不现实的。因此,目前在一个网络中实现三种业务的三网合一是不现实的。这也是业界为什么逐步用“三网融合”取代“三网合一”的提法的主要原因。三网只有在社会主义市场经济的条件下,以原有业务为主,逐步开展其他网络业务,并引入适度的竞争,才能推进我国信息产业的发展,并进而逐步走向三网融合。

3、三网各自的技术特点及简要分析

电信业务网--电信业务网是以电话网为基础逐步发展起来。目前信息到户主要是双绞线,通过交换机与骨干网相连。电话网是最早进行数字化的,传输方式逐步向光纤到户发展,传输协议从准同步体系(PDH)到同步体系(SDH)进而到非同步转移模式(ATM)发展,但由于发展的不平衡,尚不能做到全网传输和交换的数字化。虽然有非对称用户环路(ADSL)和高速用户环路(VDSL)等方式,速率可以从几Mbps到几十Mbps,但整个网络的流通能力受到双绞线传输容量这一瓶颈的抑制。目前电话双绞线上网的主流频率为56K,其物理极限为64K,潜力非常有限。这将是电信业务网一个难以逾越的障碍。

计算机网计算机网络初期主要是局域网,远程网是在国际互联网大规模发展后才迅速进入平常百姓家庭的,目前主要依赖于电信网,因此同样受到到户双绞线传输容量和CABLEMODEM速度的限制,但其互联网协议众多的优越性正在被其他网络所采用。

广播电视网我国的广播电视网络是全国最大的公众信息网络,由于其带宽比电话要宽得多,因而其网络具有一定优势。特别是近十年来发展起来的广播电视网的后起之秀棗有线电视网,具有网络技术设备先进、光缆为主干线;贯通全国和各省市首府及其大部分的城镇;宽带双向光纤同轴电缆混合网(HFC)入户的优点;与电话接入方式相比,其传输的带宽约为电话线的一万倍,而且在有线电视的同一根同轴电缆上,利用频分技术,可以同时看电视、打电话、上计算机网,且互不干扰。而不象电信网接入时会出现不能同时上计算机网和打电话的现象。目前有线电视网已拥有用户终端数7700万户,是世界上用户规模最大的有线电视网络。但由于其发展不平衡,全国各地网络分配网带宽不一,使用器材离散性大等诸多原因,因而也只有在对现有网络进行不同程度的升级改造之后,才有进一步拓展广播电视业务以外的其它增值业务的可能。

从以上的分析中可以看出,目前三网在技术上各有长短,但有线电视网既可同时支持模拟业务和数字业务,又拥有丰富的带宽资源和广泛的受众资源,在适应性和可改造性方面,都占有一定的优势。在三网逐渐走向融合的大前提下,及早确定最终的物理网络,将避免重复低效的投资,有利于我国信息业的长远发展。我个人认为,无论是从技术角度还是从经济实用角度出发,广播电视网络中的有线电视网都将是三网融合之物理网络的最佳选择。

4、国内有线电视网发展中急需解决的几个主要问题

我国信息化基础建设的目标是“一个平台,三个网”。要想把有线电视网建成三网融合的基本物理网络,则必须解决好以下几个问题:

一是有线电视网的传输平台问题。1996年初,广电部拟制了全国有线广播电视网联网规划。这个规划的要点是:部、省级干线网以光缆联网,通过SDH、2.5G(16XSTM-1,每个STM-1为155Mbps),采用MPEG-Ⅱ数字压缩技术,接入网为宽带750MHz或860MHz单向或双向光缆同轴混合网(HFC),在传输功能上分别以广电节目为主的A平台和以数据传输为主的B平台。对于广播电视光纤网传输平台的选型,国内的专家持有不同的观点,但归结起来,主要是以下两种:一种是在干线光纤采用SDH体系的基础上,以视频、语音节目为主的技术模型,宜采用技术较成熟的ATM模型,即以ATM+SDH构架主干网。如浙江省的光纤干线网就是基于SDH的ATM光纤骨干网,开通了二个STM-1,其中一个用于视频及语音业务,另一个用于数据传输,目前已取得了较好的经济效益。又如南京有线电视台、青岛有线电视台已建成了ATM主干传输网,广东有线电视台建成了以SDH为平台的主干传输网;另一种观点认为:基于SDH的ATM模型,结构复杂,造价高,主张采用基于光纤网上的千兆比交换路由器,也就是以包交换为基础的IP平台。由于其传输距离不受限制,可以实现网络间无缝连接以及造价极低等优点,已越来越被人们所青睐。据报道,国际电信联盟ITU-T有关专家已经举行了数次会晤,逐步调整战略,规范、制定新的IP标准。我国的北京有线电视台已经制订了宽带IP骨干网的实验计划,北京丰台区有线电视台率先开通了全国第一个IP先导网与ISN网络平台(IPISN),网上的部分业务已进入了运行。总的来说,这两种观点究竟哪种更适合中国的国情,还需要一定的时间和和更多的实践来验证。目前还难以断言。

分割技术范文5

2、在右边的单元格,也就是B98单元格,我们点击工具栏上的求和工具。

3、接着出现了这个界面,我们按回车键就可以了。

4、这就是我们求出的总计销售额。

5、接着在销售额的右边,也就是C1单元格输入百分比。

6、在C2单元格,输入公式=B2/$B$98,这个公式中运用了符号$,这是“固定不变的意思”,也就是说,一会我们要复制C2内的公式到别的单元格,别的单元格会根据复试的位置改变公式中的变量,加上符号$以后,变量就不变了。如刚刚输入的公式,B2是一个变量,是会改变的,但是B98这个就不变了。B98是刚才得到的销售总额。

7、拖动单元格的右下角就可以快速填充下面的单元格。

分割技术范文6

关键词:数字标签;文档分割;数据块编码

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)18-0021-02

根据国家制定的电子文档相关管理规范,电子文档从开始创建到销毁的整个生命周期内,须对文件自身添加安全标记信息,并且记录文件在传输过程中的流转状态。但是,由于现有的电子文档防护技术无法实现文件的动态跟踪,同时也不能完成对电子文档从创建到销毁全过程的安全管控[1]。现有标签技术虽可对文件属性信息进行保存,然而却存在标签易被删除修改等问题[2]。本文针对现有标签技术无法保障电子文档隐私信息安全性的问题,设计了一种电子文档多属性数字标签,并且研究了基于标签的电子文档加密分割方法,确保电子文档在整个生命周期中的信息安全。

1 现有标签技术介绍

目前,对电子文档进行加密分割的方法研究较少,并且使用的标签技术都无法保障隐私数据的安全性。Heymann P等人所提出的标签技术中,由于未考虑到标签的时间属性,所以存在一定的局限性[3]。Goloder Sa等人虽然对标签技术的时间属性考虑周全,但由于其忽略了单个标签的可能性,所以导致其方法的应用具有一定的约束条件。Gilad Mishne根据关键信息的重要性,提出一种基于权重排序的标签管理方法。本文采用对电子文档整体进行分割后形成文档数据块组,然后对其中的每个数据块进行编码离散存储。这样即使某一部分数据块泄露,也不会导致整个文件泄密。

2 多属性数字标签的设计

多属性数字标签是与文档在逻辑上紧密关联,结构上融为一体的特定数据段。标签内包含文档属性、数字标签属性、行为属性以及日志属性等。其中文档属性主要包含与标签一一对应的电子文档的身份信息,标签属性则记录标签自身的身份识别信息,行为属性主要负责记录文件使用者的操作权限信息,日志属性主要工作就是记录文件在流转过程中的操作日志。电子文档在执行读取操作时,第一步工作是阅读多属性数字标签的属性信息,并依据数字标签里面的权限信息,判断用户操作权限。多属性数字标签应用过程如图1所示。

1)用户通过客户端向服务端发送文档读取请求,服务端接收到读取请求后,对用户身份进行审核。当访问某一文档时,服务端对其进行审核,判断其是否绑定有多属性数字标签,同时查询其标签中属性值的完整性。如果审核通过,则向客户端返回文件位置信息;如果审核未通过,那么返回请求失败。

2)客户端接收到服务端返回的文件位置信息后,再向管理者结点发送文件查询请求,管理者结点接收到由客户端发送的文件位置信息后,从该文件多属性数字标签中查询该用户操作权限,并返回结果信息。

3)用户操作结束后,多属性安全数字标签中可编辑或者打印次数减一。

3 电子文档分割存储方法

本文采用对电子文档加密分割存储的方法,确保文档隐私数据不被恶意窃取。首先将电子文档进行数据块分割,然后再将分割数据块进行编码,最后将编码数据块以离散的方式存储在服务端。数据块存储过程中采用了离散存储的方式,所以在每个存储设备中可能只存储很小一部分文档数据块,因而降低了电子文档被非法窃取的可能性。

3.1 文档加密分割算法

通过对电子文档进行先加密再分割的处理过程后,原文件从一个完整的数据文件划分成为若干个文件数据块,最后对这些数据块进行离散存储至云服务端。

3.2 文档数据块编码存储策略

至此流程结束。采用STAR码对分割块进行编码不仅保证了在存储数据块失效时,能够让余下的可用存储数据块来还原其数据,同时也确保系统的数据可用、可靠与安全。

4 测试结果分析

对于电子文档加密分割算法而言,文件分块的数目越多,容量越小,则安全性越高。然而,文件块越多,对数据存储系统的负载压力就越大,同时加密分割过程耗时也就越长。因此文件加密分割过程耗时长短主要取决于文件分块大小。

实验1:选取大小为170MB的电子文件进行加密分割实验,其中分割单位由1MB到10MB,测试结果如图3。

图3 文件分割测试汇总图

通过以上测试可得,当文件块大小选择为4~5MB时,电子文件加密分割算法的效率最高;同时如果文件块大小的选择大于6MB,文件分割过程耗时会随着分割单位的增大而成线性增长的趋势,降低了算法执行效率。所以以下实验暂时选取文件分割为4MB大小为基准进行。

实验2:通过选取不同大小的电子文件及固定文件分割长度来进一步了解文件大小对文件加密分割算法效率的影响。选取大小范围为100~1000MB递增的电子文件进行加密分割测试,分割长度以4MB为基准,测试结果如图4。

结合以上实验得出的数据进行分析,在文件分割基准大小为4MB并且保持不变的情况下,电子文件加密分割的效率与文件的大小成线性关系,文件加密分割算法的执行效率会随着文件自身大小的逐渐增大而逐渐降低。

5 结束语

对电子文档增加多属性安全标签,是电子文档自身具备防

扩散的能力,并通过文中的文档分割方法对其进行数据块分割,使一个完整的电子文档分割称为文档数据块组,并对数据块进行编码操作形成编码块,然后将每一个编码块离散存储至服务端。基于数字标签的电子文档分割存储方法提高了文档自身防护能力的同时,也极大地降低了文档因为部分存储空间暴露而导致隐私数据泄密的可能性,确保了隐私信息的安全性。

参考文献:

[1] 姜红德.文档加密技术防护信息泄密[J].中国信息化,2012(17):62-63.

相关精选