网络信息资源长期保存分析

网络信息资源长期保存分析

[摘要]

网络信息的快速增长与“易逝性”使各部门对网络信息保存的需求变得必要和迫切。20世纪90年代中后期以来,国内外开展了一系列网络信息保存项目。基于此,本文对网络信息资源存档(WebArchive)研究现状进行了总结,希望档案部门在网络信息资源长期保存方面取得发展。

[关键词]

网络;信息资源;存档

网络信息以呈现随机无序、爆炸式的指数增长,具有易逝性,网络信息资源的大量流逝问题(网络信息的存在周期为44天)引起了多方问题,如:教学中网址链接在使用时过期、网络虚拟遗产纠纷、游戏系统消失造成玩家经济和精神上的损失、人类社会的网络历史遗产的消失等问题,这些情况逐渐引起了各方关注。图书部门在对网络图书进行管理时,也管理了网络资源库中的一次文献、二次文献、灰色文献,通过对这些文献进行数据库建设并长期保存,随后开始进行网络出版物的保存和数据挖掘。创建信息资源或多种资源数据库是一种数字资源的档案化管理。这项工作做的比较好的是图书管理部门,其还协同法律、经济以及情报等多个部门参与工作,从而引起了多方对网络资源的重视。

1网络信息资源长期保存问题产生的背景

大数据时代,网络信息资源多格式存在,多渠道、爆炸式产生和增长,这为社会生活多方面提供了信息便利。但网络资源并不是任意获取,而是分等级的被人们获取,比如一次文献、二次文献或者灰色文献,政府网站中的政令信息、个人博客等。通过应用和总结,网络资源成膨胀式、难收集、难检索、易逝性呈现并消亡,因此许多有价值的网络信息资源亟待专人负责收集和保存。网络资源的特点决定了人们开始重视网络资源,重视对网络资源的开发来发挥其应有的作用,从而在大数据环境下为知识管理、信息挖掘提供资源。现在任何人都可以制作信息,个性化和全民性的信息生产多样化,已经无法控制。

2网络信息资源长期保存概念的界定

易混淆的概念主要有两个:一是客体方向,对客体界定的不明确;二是主体行为,即是主攻保存还是主攻利用。在客体方面,主要的表达方式集中在以下几个关键词上:数字资源、数字遗产、网络信息资源、网络资源。

2.1对客体概念辨析

数字资源是文献信息的表现形式之一,是将计算机技术、多媒体技术和通信技术融合而形成的以数字形式、存取和利用的信息资源总和。简单理解为基于计算机的信息资源总和。数字遗产是指互联网上的数字文化遗产,即以互联网为承载形态的文字作品、资料、图片和影音形成一种文化传承的遗产,也就是现在互联网上的读书频道、文化频道、博客、论坛、BBS以及空间等里面涉及的创作、记录等内容。数字遗产——互联网上的文章、资料、图片和影音的保存,基本上都处于“不稳定”状态,一旦遭到来自非用户操作的删除、更改,甚至商业网站亏损倒闭后,个人空间就会被注销,内容就会受到不可逆转的毁灭。网络信息资源是指通过计算机网络可以利用的各种信息资源的总和。其具体是指所有以电子数据形式把文字、图像、声音、动画等多种形式的信息存储在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。网络资源的外延更大一些,它除了信息资源外,还延伸到信息资源的引申资源,涉及关系网络和社群网络。而网络信息资源更偏向情报信息,与通过互联网获取的信息资源相比较而言,网络信息资源内涵于网络资源,网络资源是利用计算机系统通过通信设备传播和网络软件管理的信息资源。

2.2对主体行为的理解

网络信息资源存档会同网络信息资源长期保存这个概念相混淆。两者是相近但不相同的两个概念,双方都涉及网络资源以及网络资源的长期存取,即有关信息的共享问题。但是网络信息资源存档(WA)更注重对网络信息资源资源的建档和档案化管理。网络资源存档的内涵:有关主体有选择性地对具有长远保存价值的网络信息进行捕获、归档、存储等档案化管理过程,其基本目标是通过网络信息资源的存档,更全面、真实的反映和再现社会活动的本来面貌,并满足相关主体对网络信息的长远利用需求。具体有以下四点:一是WA的目的是再现社会活动的本来面貌,实现网络信息的长期保存和利用。二是WA的行为主体具有多样性。三是WA行为具有高度选择性。四是WA的行为程序具有规范性。笔者更倾向将WA定义为一种对网络信息资源档案化管理的行为。学界网络资源存档的理解还有:认为WA是一种对网页进行网页快照的行为。笔者认为网页快照无法满足多种格式的要求,目前视频和视频直播已成为网络较火的一种信息资源,这就是网页快照无法做到的。

3档案部门应对网络信息长期保存的措施

3.1从国家战略层面重视

从国家宏观战略方向看,笔者认为国家档案部门应采用顶层设计,统一领导,分层管理的方式来建设我国的网络信息资源保存项目。同时,对国外具有保存价值的网络信息资源有选择性的进行保存和研究。

3.2在政策上进行探索

当前,档案信息化建设也将许多档案信息资源上传到网络上,因此,这就更加给网络信息资源的保存增加了压力。政策上的保障是其前提,也是指引方向的引路灯。下面提出一些笔者的建议。从内容上,可借鉴我国台湾地区的WebArchive做法,台湾网络典藏项目针对各级政府网站、教育及学术机关网站(研究机构、社会教育机构及大专院校及所属系所网站)、图书馆网站(各大专院校图书馆、专门图书馆、公共图书馆、图书咨询学研究单位及图书馆团体网站)、重大社会议题网站(以政治、经济、文化等各个领域社会重大议题为向导,收藏与该议题论述相关的网站,如:环境保护、教育改革、媒体改革、金融改革、土地规划、全民反恐以及公民投票等)构建了一个庞大的、体系化的政府工作网络,该网络更便于政府各部门之间的互联、互通,在提高效率的同时,更好的服务群众。从格式上,通过对文字格式、视频、音频、游戏服务器等的保存,进行项目编目,除采用存储器阵列等方式,还可以开发新型存储器等。这些可以学习国外先进科技,也可以参考其他国类似的项目。

3.3在运行中寻求协作

网络信息资源存档保存,既需要档案部门率先引领,同时也需要计算机技术部门的配合,技术难题是攻坚克难的关键。不仅如此,法律、标准、政策、企业等都需要协同进来。因为这一项目的成功应用,将会对社会生产和管理、经营带来不小的变革,因此需要这些部门共同努力。

4网络信息资源长期保存存在的问题

4.1对WebArchive的重视和认识程度不足

许多游戏网站在运营十多年后,往往面临关闭服务器的境况。而该服务器的玩家却还在享受游戏带来的乐趣,当关闭服务器后,这类资源将面临永远消失的状况,如果WA项目忽视了此类资源,是否是对人类遗产的一大缺失。在21世纪的某些阶段,人类行为缺少了合理的解释,是因为未对当时网络信息资源的原生资源进行存档保存。因此,重视和重新认识网络信息资源,并对其进行档案化保存是一种对全人类记忆负责的表现,这些只是笔者了解到的某一种情况。对于政府机构、企事业单位来讲,都建设有自己的网站,对网站内容会进行及时更新,做好宣传,同时单位内部的业务也会通过网站进行沟通,这些原生的网络信息资源若不加以及时保存,待到查考时,将无从下手。

4.2资金投入少

技术和管理的革新,资金投入是硬性指标。只有大量的资金支持,才能在硬件更新上配备最好的设备。对于企业或政府而言,这类投入想要在短期内盈利,怕是很困难的。通常这种投入都伴随着时间而增长,很少有投资者能够具有前瞻性的看到长期投入对整体运作的意义,许多投资者和决策者很难做到有前瞻性的去审视对本企业的信息资源进行投入,更难看到这种投入的回报在生产和经营领域的贡献。

4.3技术含量低

网络信息资源存档保存所应用的计算机软件和开发软件形成的系统平台伴随着IT技术的不断翻新,需要不断更新。但是这目前在我国很难做到,因为许多档案尚属于国家非盈利部门,属于经营性企业的档案和网络信息资源也很难获得企业和部门的资金投入,这样就更难获得技术投入,许多部门的检索功能还停留在人工纸质和手动阶段。在技术方面我国较国外稍弱一些,但相信在借鉴他国发展历程并进行我国自主研发后,技术问题将迎刃而解,且指日可待。

4.4归档权限模糊

法律责任分配问题探讨至今尚无定论,相关人员需进一步同法律部门进行研究讨论。

作者:孙辉 单位:辽宁省水利水电勘测设计研究院

主要参考文献

[1]谢欢,郑永田.数字遗产保存:图书馆义不容辞的使命[J].图书馆论坛,2012(4).

[2]耿磊.对网页信息资源长期保存的若干思考——InternetArchive和WebInfoMall项目的启示[J].湖北档案,2012(2).

[3]黄峒胜.网络信息保存运动对我国图书馆建设的启示[J].图书与情报,2010(6).

[4]周佳贵.美国数字信息保存计划——NDIIPP及其对我国的启示[J].图书馆工作与研究,2006(1).

[5]周毅.网络信息存档:档案部门的责任及其策略[J].档案学研究,2010(1).

[6]周毅.论网络信息存档权及其生成[J].中国图书馆学报,2011(1).

[7]赵俊玲.挪威网络信息保存项目Paradigma[J].山东图书馆季刊,2004(3).

[8]谢春林.英、美、澳、挪网络信息保存政策的经验与借鉴[J].情报资料工作,2009(6).

[9]张小芳.数字信息资源长期保存体系研究[J].四川图书馆学报,2011(5).

[10]臧国全,田莉.数字保存供给与需求的影响因素解析——基于集体创作型Web数字资源保存的实证研究[J].图书馆理论与实践,2011(1).

[11]肖琬蓉.信息资源数字化建设质量控制研究[J].图书与情报,2010(5).

[12]何朝晖,戴龙基,肖珑.共建共享数字资源的可持续利用研究[J].大学图书馆学报,2007(2).

[13]郭家义.数字信息资源长期保存系统的标准体系研究[J].现代图书情报技术,2006(4).

[14]陈清文.网络信息资源保存研究综述[J].山东图书馆季刊,2006(1).

[15]孙红娣.论开放存取中的数字资源长期保存问题[J].图书馆学研究,2005(11).

[16]赖朝新.数字信息长期保存的主体研究[J].图书馆理论与实践,2005(2).

[17]宛玲,吴振新,郭家义.数字资源长期战略保存的管理与技术策略——中欧数字资源长期保存国际研讨会综述[J].现代图书情报技术,2005(1).

[18]邓富民.基于服务质量差距模型的服务质量特性构成分析[J].四川大学学报:哲学社会科学版,2004(5).