科学数据资源范例6篇

前言:中文期刊网精心挑选了科学数据资源范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

科学数据资源

科学数据资源范文1

关键词:“数据库原理”;课程;数学资源;建设

“数据库原理课程”是计算机课程之一,教学包括数据库理论、数据库技术与数据库的应用实践三个部分,可全面提高学生对数据库的了解以及应用水平。就目前来看,教W过程中教学资源不足的问题,对教学效率的提高阻碍较大。因此,建设教学资源成为了“数据库原理”课程改革的重点。

一、“数据库原理”课程简介

1.“数据库原理”课程内容

“数据库原理”课程是计算机课程的重要组成部分,由于其技术性较强,理论知识无法通过语言详细讲解,因此教师通常采用PPT进行教学,这样效率相对较高,学生的学习过程更加直观,理解也更加深入。除理论教学外,该课程还包括实践部分,实践教学通常采用上机操作的方法完成,教师要求学生亲自对数据库加以维护,以加深对知识的理解程度。

2.“数据库原理”课程教学现状

当前的教学模式,可在一定程度上提高学生的理论与实践水平,但却具有对教学资源以及现代化教学技术应用力度不足的问题。微课及网络教学是信息化技术下两种新型的教学方式,具有一定的适用性,可用于多种类型课程的教学过程中,可以有效拓展教学时间与空间,在提高教学效率方面优势显著。当前“数据库原理”课程教学,仍以课堂教学为主,课下学生的学习途径较少,长此以往,学生容易因为缺乏练习,影响学习效果。在社会及市场对人才素质要求越来越高的今天,对上述教学模式加以改革,已经变得极为必要。

二、“数据库原理”课程数学资源建设

1.数学资源的整合

(1)理论教学。理论教学内容以数据库理论知识为主,教学可在网络平台上进行。教师需将教学内容以电子教案的形式,到互联网上供学生学习。以“数据库原理”第一章为例,电子教案中需包括数据库管理的发展、数据库管理系统、数据库的发展形式三项内容,教师需将每一项教学内容细化,系统地展现给学生,使其能够参照电子教案自学知识。

(2)实践教学。实践教学的目的在于培养学生的数据库管理能力,以学生的上机操作为主。对此,学校可建立相应练习平台及数据库管理系统,如SQL Server等,使学生的操作水平在系统中得到提升。与传统的机房上机操作相比,上述方法拓展了练习的空间与时间,提高了练习的有效性。

(3)视频资源的制作与。教师可综合理论与实践教学内容,制作视频资源,并将其到互联网平台中,使学生可通过对视频资源的观看,直观地理解理论知识,并了解操作过程,降低学习难度。视频资源可采用微课模式下视频的制作方法加以制作,要控制每一段视频的时间,避免视频内容冗长繁杂,影响学生的观看兴趣。

2.教学资源的建设

(1)软件与硬件支持。由于教学资源需要以视频的方式,因此需具有录像及录音设备,硬件应包括摄像头、话筒、电脑等。软件可以以Camtasia Studio系列为主。

(2)具体建设过程。①启动Camtasia Studio软件,进入到教学资源录制程序中。②打开PPT课件并播放,根据需求,调整显示区域大小。③点击Camera,进入视频录制状态。④点击Audio按钮,完成声音测试。⑤点击REC,正式录制。⑥录制完成后,保存文件。⑦可点击屏幕右上角预览键,观看效果。⑧如视频资源不存在问题,则可以。

3.教学资源多样化水平的提高

(1)课程介绍。教师需在制作每一个教学视频前,做好课程介绍,使学生不必长时间观看视频,便能够马上了解此视频中所包含的内容。不同学生对不同知识的了解程度不同,因此视频观看需求也不同,将课程介绍置于教学前,可使学生及时筛选出自己所需要的资源,提高学生的学习效率。课程介绍应包括学习任务、学习方法、学习内容等多方面内容,使学生可全面了解视频的概况。

(2)视频讲座。教师可对答疑解惑过程中学生所提出的问题加以总结,选择学生学习难度最大的环节,作为视频讲座的主要内容。在视频讲座开始前,教师应搜集大量资源,以解决学生普遍存在的问题为目的展开讲座,确保学生通过讲座获得更大的进步。

(3)教学内容总结。教师以一章节为一阶段,对教学内容加以总结。以第二章“数据模型”为例,教学内容总结应包括数据模型种类总结、关系代数运算的总结、关系实体及参照完整性的总结等。教学内容总结应本着简洁明了的原则展开,避免赘述,使学生清晰地了解整个章节的脉络及基础知识内容,帮助学生理清学习思路。

三、结语

综上,教师应在利用相应教学软件的基础上,将理论与实践内容的教学整合为视频资源,以提高教学的直观性;并通过测试及总结教学内容的方法,为学生理清学习脉络,使其充分了解自身存在的弱点与缺陷,使教学水平及学生的学习效果得到全面的提高与改善。

科学数据资源范文2

[关键词]科技信息科学数据科技文献资源共享

[分类号]G359.21

1 前言

我国科技信息事业走过了50多年的光辉历程,由全国部委、行业和省地市县等各级政府预算支持的科技信息机构有近400个,从业人员近5万人。经过50余年的发展,中国科技信息事业已形成一个较为完整、系统并具中国特色的科技信息行业体系。半个世纪以来,中国科技信息事业为推动科技、经济、社会发展以及国家安全做出了重要贡献。目前,以中国科学技术信息研究所为代表的中国科技信息机构正快速发展,并逐步成为国家科技创新体系的重要支撑…。在计划经济时代,我国科技信息行业为国家科技、经济和社会发展做出了特殊的重要贡献。改革开放以来,面对复杂的市场经济形势以及知识信息时代的背景,科技信息行业一直没有停止对国家科技、经济和社会发展战略的深入探索。

科技部前部长徐冠华在“庆祝中国科技信息事业创立暨中国科学技术信息研究所创建五十周年座谈会”上,对中国科技信息事业未来发展提出了明确要求,首先就是要加速科技信息服务的专业化、网络化和社会化,促进科学数据与文献资源共享,面向全社会提供服务。从中可以看出科学数据理应是科技信息事业的重要组成部分,但对于科学数据的研究和应用是否应该成为科技信息机构长远发展战略的一部分,科技信息领域一直没有定论,本文将在对科技信息行业进行充分调研的基础上对该问题进行初步探索。

2 国内外科技信息机构从事科学数据研究的趋势分析

2.1 国际组织越来越重视基础性科技信息资源的整合与共享

国际科学联合会理事会(ICSU)今后将支持世界数据中心(WDC)系统发展成为数据者的网络和科学数据开放获取的图书馆。国际科技信息联委会(ICSTI)正考虑与国际科技数据委员会(CODATA)进行合作的可能性,2009年ICSTI大会的主题是“数据集中式的科学”,关注的焦点集中在e―science的建设以及高效的科学研究中数据的管理和获取问题,它将围绕数据生命周期展开讨论,议题包括已的科研成果集成、审核、整合、存档和保存等。ICSU、ICSTI、CO―DATA和WDC 4个在国际科学界有影响力的组织正在走向联合,由此带来了网络环境下科技文献、科学数据等科技信息资源的融合。

美国能源部科学办公室组织的“世界科学网”是由美国科技情报办公室开发和维护的,该网提供分布、纵深的网络数据库搜索服务。创建该网站的意图在于使其成为世界级的网络工具,让任何地方的任何一位科学家或任何人都能轻松地获得任一种语言或任一国家的搜索结果。该网站将依赖于每个参与国所出版的科学资源,科学数据资源也在该网站并提供服务。

2.2 图书馆、科技信息研究机构积极开展多种信息资源集成服务

当前,图书馆和科技信息服务机构正在面向服务对象,拓展传统的文献服务领域,广泛集成各种数据资源,同时收集科学数据、文献和网络信息等资源,并探索建立各类资源间的关联;部分科技信息机构还在尝试采用E―science的架构进行科技信息资源、计算资源和网络资源的整合。

德国国家科技图书馆(TIB)是德国科技信息的重要保藏和服务机构,提供了科学数据资源的目录服务,截止到2007年10月份,TIB已经通过DOI注册了475 276个数据集,12 546个科学电影剪辑,6 302个医学案例,342个技术报告和112个学习对象等,并部分实现了科学数据与科技文献的引用关联。韩国科学技术情报所(KISTI)在E―science框架下开展了科学数据资源的研究和建设工作。KISTI的E-science项目由韩国科技部资助,建设大型超级计算中心,集成高性能计算设备、大容量科学数据、人力资源来提高科学研究的生产力和效率。KISTI还与韩国生物多样性机构(KBIF)开展了生物多样性信息的共享实践。

中国科学院国家科学图书馆除了传统的科技文献服务功能外,其提供的跨界检索服务系统是由国家科学图书馆自主开发的、面向非文献型信息资源的集成检索服务平台。它通过集成第三方组织机构的开放科技信息资源,包括8类科学数据资源、62个数据库,为科研用户提供对科学数据、仪器设备、学术会议、科研机构、科学家等非文献型资源的集成检索服务。同时该馆还积极与科研院所开展合作,共同建设科技信息资源整合共享服务平台。“中国(西部)环境与生态科学知识积累平台”是由该馆兰州分馆与中国西部环境与生态科学数据中心合作共同建立的一个领域知识平台,提供文献资源与数据资源的统一检索服务。

地方情报(信息)研究所是地方科技信息共享平台建设的主力军。地方科技基础条件平台建设主要由地方情报所牵头承担,如广东、湖北、四川、陕西等省。以陕西省为例,陕西省科学数据共享平台主要提供陕西省重大科技创新项目的各种信息资源,由省科技信息所牵头,省生产力促进中心、西安地质矿产研究所、省微生物所共同承担。该平台包括一个门户网站(陕西省科学数据共享门户网站),两个科学数据中心(陕西省科技管理数据中心和陕西省地质与矿产资源科学数据中心),三个专业数据库(金相图谱数据库、XRD衍射实验数据指标数据库和陕西省微生物菌种资源数据库)。

2.3 科研院所在E―science的概念下进行文献、数据、工具方法、网络资源的集成和整合

欧洲生物信息学研究所是欧洲分子生物学网的一个特别节点,开展了多方面的生物信息服务和研究,将电子文献资源与生物数据库、信息工具结合,不仅加强内部数据的保存过程管理,也为公众提供更为丰富的服务。美国国家生物技术信息中心(NCBI)建立的信息服务平台中实现了数据与文献的关联.基因数据库与文献数据库通过唯一标识符建立链接,使得检索基因序列时能够查找到相关的文献。

中国科学院地理科学与资源研究所一直在进行科技计划项目产生的科学数据的整合共享研究和平台建设,该所在E―science的概念下即将组建的地球系统信息共享中心由孙九林院士牵头,依托“资源与环境信息系统国家重点实验室”搭建网络运行环境,在此基础上整合地学领域的文献资源、科学数据资源、地学模型资源,在地学领域开展远程科学研究。

2.4 资源环境类行业部委情报所成功转型为数据资源保障中心和战略情报研究中心

国土资源部信息中心(ICMLR)是国土资源部的直属事业单位,负责土地、矿产、海洋资源基础信息和资

源利用情况、变化趋势动态数据的收集、技术处理及预测分析,为政府部门提供决策支持和管理支持。改革开放以前,地矿行业对国外技术信息的需求主要由Ic―MLR来满足,改革开放后ICMLR及时放弃了作为主业的微观技术情报业务,转向为部领导提供国外战略情报,为地矿行业战略规划提供重要依据。随着信息化进程的推进,ICMLR又承担起国土资源部信息化(金土工程)的相关工作,投入十几亿经费,起到改变政府传统工作模式和工作方法的作用;在数据保障方面,国土资源数据(数据实体)全部汇交到信息中心。除了数据工作以外,国土资源部战略研究、规划、科技成果管理、综合统计、行政复议功能全部设在信息中心。至此,ICMLR已经从传统的技术情报服务机构成功转型为战略服务的数据保障机构和情报研究机构。

2.5 基本结论

因此,国内外的科技信息机构甚至包括一些专业的科研机构,都在进行科技信息的整合服务平台建设。图书馆、部分专业的信息服务机构在数字图书馆的框架下进行资源整合,专业的科研机构和部分专业的信息服务机构在E-science框架下进行整合。总之,科技信息机构都是在网络环境下,运用信息技术实现信息资源、知识资源和工具方法的整合。

3 科技信息机构从事科学数据研究与应用存在的问题

3.1 科技信息机构对从事科学数据领域的研究和应用工作的重视程度不够

目前科技信息机构的资源建设和服务绝大部分局限在文献资源。信息技术的飞速发展为信息服务提供了全新的技术手段,使服务的方式发生了根本改变,网络使信息资源的服务融合成为可能。从科技信息资源的用户角度看,他们有获得一站式的信息资源整合服务的需求,科技信息机构作为科技信息研究和服务的专业机构,应该解放思想,不局限于传统的、单一的图书文献资源的研究和服务,应着眼于更广泛的科技信息资源领域,树立大资源的概念,从而满足日益发展的科技创新活动需要。

3.2 科学数据资源比较分散,难于管理

数据同样需要长期保存和长期对外服务,需要有一个集中式的服务中心来整理、归档并对外服务,从而不断提升数据的使用价值。科学数据资源分散在各数据中心,尚没有建立类似文献信息的汇集和服务中心,长期以来并没有从整体上进行数据的整合与服务工作,科技信息机构想要在短时间内改变这种现状比较困难。

3.3 科技数据与科技文献资源的融合力度不够

科技文献不是科学研究的唯一信息资源和唯一成果产出,例如许多学科在科研过程中均会使用和产出海量的科学数据,网络信息资源也是经常使用的。目前两种资源的保存、流转和传播往往是独立运行的,如何将这些信息资源很好地结合在一起,进行统一的管理和维护,如何使其共同服务于科学研究活动,是一个迫切需要解决的问题。

4 科技信息机构从事科学数据研究活动的建议

4.1 在科技信息机构未来发展计划中纳入科学数据等非文献资源

从上述的分析可以看出,无论是国际科技信息组织,还是国内外从事信息服务的机构,如专业图书馆、情报(信息)所和科研院所的信息机构,都应具有为科技信息集成提供服务的功能,单一类型的科技信息服务已经不是未来发展的方向。例如图书馆在传统的文献服务之外增加了数据服务,数据(信息)中心在传统的数据服务之外增加文献服务,为科技创新提供信息支撑的各类科技信息已经密不可分。

因此在科技信息机构未来的发展战略中,应该将非文献型资源纳入到规划中来,在已有的文献资源之外,为科技界提供科学数据、网络信息等资源,更长远的可以考虑提供计算资源等,成为名副其实的“科技信息决策与服务机构”。

4.2 利用科技信息机构的自身优势开展科学数据研究工作

4.2.1 科技信息机构可以提供专业、完善的信息服务基础设施在近十几年的发展中,尤其是随着信息技术的发展,国家、部门、地方都对科技信息机构网络环境、基建环境、计算环境等都进行了大量的投资。在网络服务能力方面,多数单位都拥有了百兆以上的Inter―net出口带宽,一些单位甚至有千兆带宽。在数据存储、灾备、检索等方面,都建有规模庞大的数据存储系统、灾备安全系统、强大的资源搜索系统,这些基础设施对于从事科学数据研究也是必须的。

4.2.2 科技信息机构的人才资源是建设科学数据共享平台的重要力量科学数据资源建设、尤其是科学数据共享是一个跨学科、跨领域的系统工程,需要多种学科的人员共同参与实现,除了产生科学数据的科研人员外,科技信息研究人员也是一直不可或缺的重要力量。科技信息机构是面向整个科研领域的服务机构,拥有一批具有一定的计算机、外语基础,熟悉图书情报工作并具有理工科专业背景,能够开展特色服务的复合型人才队伍。科技信息机构的人力资源能在科学数据共享中起到桥梁作用,是建设科学数据共享平台的一支生力军,同时,由于科技信息机构的研究人员的参与,能够从科技事业全局的视角来参与系统的设计,强化了科学数据共享平台的服务意识。

4.2.3 科技信息机构可以提供中立的公共信息服务

科技信息机构是我国公共信息服务的主要承担者,其主要任务就是为公众提供优质的公共信息服务。在信息资源的产权方面,科技信息机构对本机构提供的信息资源只拥有分发权,与信息生产者无著作权和版权方面的冲突。科技信息机构从事科学数据服务,将突出公益的特色,不会损害各数据机构的利益关系,从而为在整个科学数据领域建立统一的服务体系提供了可能性。

4.2.4 科技信息机构可以提供基于科学数据和科技文献的增值服务科技信息机构一般收藏有国内外期刊论文数据库、国内外会议论文数据库、学位论文数据库、电子图书数据库等资源,纳入科学数据资源将进一步丰富其资源类型,在科学数据领域的论文会使用多种科学数据集作为研究支撑,而分析方法的文章又能对科学数据资源更深入、更广泛的使用提出应用方向,数据资源与文献资源的有效集成可以形成良性互动,将为在数字图书馆体系下建立科学数据与科技文献的联合查询提供依据,也必将成为科技信息机构新的信息服务增值业务。

4.2.5 科技文献中的成熟理论和建设经验可以应用在科学数据领域中 科技文献经过一百多年的发展,无论从文献的、载体、机构、知识产权等方面都已经很成熟,而科学数据作为科研产出的重要内容,其知识产权保护问题一直没有得到解决,且科学数据引用问题也是目前科学数据领域研究的热点之一,大量科学数据被用在科研以及文献中,但是并没有对其引用状况进行标识和应用,导致科学数据的价值并没有有效体现出来。科技文献领域建立了成熟的引文统计方法和服务系统,这些经验都值得在科学数据领域中进行推广和应用。

4.3 突出重点,体现科技信息机构从事科学数据研究活动的特色

为了和专业从事科学数据的机构既相互联系又有区别,科技信息机构将重点主要放在科学数据资源(其中包括公共科技管理数据资源)相关的建设和服务工作,开展科学数据中的公共科技管理数据的数据库建设和服务,例如科技人才库、项目经费库等;开展科学数据的目录服务,同时对科技信息资源管理与共享的共性技术问题开展系统的跟踪研究。

科学数据资源范文3

关键词 科学数据共享 国际科学数据服务平台 共享研究

分类号 G250.73

Abstract This paper introduces the scientific data sharing status at home and abroad, analyzes the basic elements of the scientific data sharing, including the resource elements, the protection of intellectual property rights elements, the shared schema elements, sharing and management mechanism elements. Further more, it presents the International Scientific Data Service Platform, analyzes its data resources, protection of the intellectual property rights, sharing mode, service contents, and browsing method.

Keywords Scientific data sharing. International scientific data service platform. Research of the Sharing.

科学数据是指在科技活动(实验、观测、检测、调查、研究等)中或通过其它的方式所获取的反映客观世界的本质、特征、变化规律等的原始基本数据,以及根据不同科技活动需要,进行系统加工整理的各类数据集[1]。科学数据集科学价值和使用价值于一体,并对于科技创新的发展产生了深远的意义。科学数据资源具有准确性、可靠性、非排它性、可无限复制等特点。这些特点和其重要性使科学数据的共享成为必然,只有让科学数据得到共享,才能实现其价值的最大化,同时,又通过科学数据的共享这一过程,发展出更高层次的科学数据,这是一个逐级递进的过程,最终为社会的发展贡献力量。

1 国内外科学数据共享现状

1.1 国外科学数据共享现状

20世纪40年代,国外的科学数据共享方面的研究开始起步,在20世纪80年代得到发展,在欧洲、英国、法国、德国、荷兰和瑞典等国家非常重视数据管理与共享,美国是科学数据共享的倡导者。1975年,美国开发了177个大型数据库,主要服务目标是政府决策和政府启动的重大科研项目[2]。欧盟数据库法律保护指令、英国布加勒斯特宣言和《信息自由法》等,在科学数据的产权归属、共享管理和开发利用等方面均有明确的规定,以保障科学数据共享活动的有序开展。

国际科学数据委员会(CODATA)于1966年成立,是全球最大的科技数据国际学术组织,其宗旨是推动科技数据应用、发展数据科学、促进科学研究、造福人类社会[3]。美国建立了美国航空航天局(NASA)分布式最活跃数据档案中心群(DAACs);日本产业技术综合研究所(AIST)科学数据公开数据库拥有70个主题数据库,全部数据库通过网络提供免费服务,服务于科研机构,也服务于一般工业企业[4]。2007 年3 月,英国了研究报告《发展英国科研与创新信息化基础设施》,提出数据资源数字化长期保存与共享建设规划,重点要建立大规模的国家科学数据中心[5]。

1.2 国内科学数据共享现状

我国的科学数据共享工作起步比较晚,2001年底我国科学数据共享工程启动气象科学数据共享试点,在资源环境、农业、人口与健康、基础与前沿等领域共24个部门开展了科学数据共享工作,已经启动了9个科学数据共享试点,开展了科学数据共享政策法规和技术标准体系的调研工作。先后完成了23项具体标准的编制以及一批管理办法;整合共享了跨部门跨领域超过250亿元国家投入产生的数据资源,建立了若干数据库;积极开展数据共享服务,为科学研究、政府决策提供了坚实的支撑,成效显著[6]。但是与发达国家比起来存在很大的差距,主要有:科学数据共享意识不强,目前科学数据共享工程试点的共享数据多为国家经费资助下科技活动形成的数据,各科研单位主动积极共享意识不强;相关的科学数据共享标准及技术规范没有统一的规定;科学数据类型集中于海洋、地理等少数学科领域。

2 科学数据共享基本要素分析

美国国家卫生研究院(NIH)要求申请资金超过50万美元的项目必须提供数据共享计划或者说明不共享的理由。并且,NIH通过分级方式共享数据,包括可公开获取的数据、通过协议获取的数据和限制使用的“冷冻数据”[7]。据调查显示,科研人员共享电子数据和使用他人数据的意愿都不高,主要因素有:没时间、没资金、没权利、缺标准以及资助者无要求等[8]。科学数据的共享最基本的是要有相关的科学数据,也即资源的来源,而共享工作的开展必然要面对科学数据的知识产权保护问题,其次要根据不同的情况选择不同的共享模式来开展共享活动,共享活动的有序、稳定的开展需要相对应的共享管理机制的保障,所以资源来源、知识产权保护、共享模式以及共享管理机制这四大要素构成了科学数据共享活动的基本要素,它们之间相互联系,缺一不可。

2.1 资源来源

科学数据指在科技活动过程中产生的原始数据,所以资源的来源就是科研活动过程,资源的内容主要有两种:一种是本单位或机构内科研活动过程中产生的数据,二是收集其他单位或研究机构的科研数据。本机构的科学数据,主要是来自于本机构研究人员的自愿自主提交以及数据服务人员提供咨询帮助,如中国气象科学数据共享服务网的科学数据来自于国内卫星通讯系统、全球通信系统收集的全球和国内各类实时和非实时的气象观探测资料[9];第二种主要是与政府机构、科研机构、高校等部门合作,提供途径鼓励这些机构的研究人员同意将他们的相关数据整合到数据中心共享.如基础科学数据共享工程整合中国科学院在物理、化学、天文、空间与生物领域20多个研究所长期以来的基础数据,同时,重点整合国防科工委下属的中国工程物理研究院、中国原子能科学研究院在核物理与原子分子物理方面基础数据,整合国家林业局所属青海湖国家级自然保护区多年来在青海湖区域监测与观测数据[10]。

2.2 知识产权保护

数据的共享首先要考虑的就是其所涉及到的知识产权问题。科学数据共享中的知识产权主要体现为科学数据的版权,版权就是著作权, 是指文学、艺术、科学作品的作者对其作品享有的权利, 包括财产权、人身权[11]。科学数据凝聚了数据开发人的智力劳动,是创造性的劳动成果,同样受版权法保护,具有重大的价值。实施科学数据共享是我国面对全球信息化和知识经济的发展,开展自主创新、建设创新型国家的必然要求[12]。刘闯认为通过数据库共享服务平台进行有偿数据服务而获得的收益,在数据库制作者和相关数据创造者之间按照合同约定进行分配,如无合同约定的自行协商解决[13]。

《全球变化研究数据管理政策声明》提出“联邦政府资助的科学数据,即公共性、基础性的国有数据,必须在没有歧视的基础上以不超过复制和发行成本的费用无限制地使用”[14]。科学数据的开发与获得需要责任人付出巨大的努力,包括精力、时间、金钱上的,不仅仅是数据开发人,还有相关的单位等等,他们对于科学数据做出了巨大的贡献,这些科学数据自然地成为各个单位的财产,受知识产权保护,另一方面这也在一定程度上限制了科学数据的自由共享。所以笔者认为,科学数据的共享需要国家相关法律的许可和一定的限制,对于那些在国家或是地方政府经费等非营利性机构支持下开发的科学数据,采用一定的奖金或是其它奖励的方式来鼓励开发人,如果不危及国家安全和个人隐私,则完全向公众开放或是使用时加以标注,以尊重劳动者的成果,但不能用于商业用途;对于那些由单位自筹经费或是个人、企业自行开发研究的不危及国家安全和个人隐私的科学数据,则要协调好利益的平衡,一般是采用收取一定的费用的方式来保护他们的权利;对于那些对科学数据进行了一定程度的加工的更深一层次的数据及提供的相关服务活动,收取一定的成本。

2.3 共享模式

科学数据共享为科学数据的使用提供了一条更为畅通的道路。科学数据具有无法估量的潜在价值,前人为科学数据的探索与创造做出了巨大的努力和贡献,传承与共享这些科学数据是对于他们的努力的最大尊重与认可。目前国内外采用的科学数据共享的模式主要有四种,分别是国际组织协作共建共享模式、政策驱动型共建共享模式、主题合作共建共享模式和地域协作共建共享模式。

2.3.1 国际组织协作共建共享模式

顾名思义,国际组织协作共建共享模式是指在某种约定或是条约的约束下,国际组织就某一研究方向或是研究主题,共同制定相关的共享策略的一种共享模式,该共享策略包括共享的范围、方式及相关的政策,可以促进同一领域内数据的交流与共享。国际组织协作方式包括国际政府间的合作和国际非政府间的合作,不管是哪种方式,都必须遵循共享的宗旨,为共同的约定所约束,以促进数据在全球的共享,提高各成员国的科技水平。经济合作与发展组织(Organation for Economic Cooperation and Development,OECD)是由30个市场经济国际组成的政府间国际经济组织,旨在共同应对全球化带来的经济、社会和政府治理等方面的挑战,把握全球化带来的机遇[15]。

2.3.2 政策驱动共建共享模式

这种模式是指在国家法律法规政策的强制驱动下推进科学数据的共建共享。美国是这一模式的最早试验者。美国的《信息自由法》和《版权法》是这一模式的法律基础。并在1991年了以“完全与开放”科学数据共享政策为核心的“全球变化研究数据管理政策”,通过这一政策来促进科学数据共享,从而为美国的科学研究提供强有力的保障条件,确保其在21世纪国家发展和科技发展战略目标的实现。

2.3.3 主题合作共建共享模式

该模式是根据主题的不同来进行共建共享科学数据,建立专题科学数据库。如印度科学和产业研究中心(Center for Scientific and Industrial Research,CSIR)及肯尼亚的医学信息共享。肯尼亚医学研究机构(Kenya Medical Research Institute,KEMR I)通过编制肯尼亚医学机构研究和使用的数据和目录来实现彼此联系,共享资源[16]。我国的地球系统科学数据共享平台承担单位是中国科学院地理科学与资源研究所,中科院资源、环境领域的研究所,国内地学领域的知名高校共40多家单位,世界数据中心(WDC)和国际山地中心(ICIMOD),美国马里兰大学等国际组织和机构参与本平台建设与运行服务[17]。

2.3.4 地域协作共建共享模式

该模式把那些参与到共建共享科学数据的单位限定在某一个地理范围内,与国际间组织协调共建共享模式相似,前者范围相对小一些,一般限定在某个地区或是某国内,将共享资源集中存储在某一特定的地点,并在相关单位的共同管理和共同资助下运转共同建设。2004年,科学技术部和财政部整合“国家科技基础条件平台专项经费”“中央级科研院所科技基础性工作专项经费”“科技文献信息专项经费”三个专项经费,统一用于国家科技基础条件平台建设[18]。

2.4 共享管理机制

科学数据具有科学价值、经济价值和社会价值,并且易于复制传播和共享等特点,不同的科学数据由于其属性或是归属性的不同,需要采取不同的管理机制来开展共享工作。目前,国际上采用的共享管理机制有三种:保密性管理机制、公益性共享机制和商业化管理机制。

2.4.1 保密性管理机制

顾名思义,该机制对于科学数据的共享采取不公开的方式。一般这种机制设计到的科学数据是有关国家安全、个人隐私的数据信息,公开这些信息对于国家的安全、人民的生活都会产生很大的影响。同时,参与这些数据信息的开发和管理人员都必须与单位签订保密协议,以进一步确保信息的不泄露,国家情报部门与各个单位安全主管负责检查科学数据和信息的安全性执行情况,同时严格和明确地规定这些数据信息的保密管理。

2.4.2 公益性共享机制

此种机制是采用完全开放的方式来共享科学数据,其中的数据是指除了上述属于保密性管理机制数据之外的政府所拥有的信息和科学数据,包括标准数据库、科技成果数据库等。这些数据都应该依法“公之于众”,采用网站或是其它的方式来向社会完全开放,让公众获取,用户无需支付相关费用或是仅仅支付低廉的复制成本费用。像美国的海洋大气局、国立卫生研究院等联邦政府拥有和生产的数据,中国科学院地理科学与资源研究所产生的地球科学数据,整合、集成科研院所、高等院校和科学家个人通过科研活动所产生的分散科学数据。

2.4.3 商业化管理机制

对于那些完全是为了盈利而投资生产的科学数据,则采用商业化管理机制,对于此类科学数据的共享收取一定的费用。例如, 美国政府批准了空间影像和数字地球两家企业从事高分辨率遥感数据的获取和业务, 然后采取鼓励平等竞争的政策, 通过市场竞争的方式降低数据价格, 达到促进数据应用的目的, 并同时通过税收进行调节和控制[19]。

3 国际科学数据服务平台分析

“国际科学数据服务平台”(见图1)(以下简称“平台”)启建于2008年,由中国科学院计算机网络信息中心科学数据中心建设并运行维护,面向中国科学院及国家的科学研究需求,逐渐引进当今国际上不同领域内的国际数据资源,并对其进行加工、整理、集成,最终实现数据的集中式公开服务。在保护国家安全,尊重知识产权的前提下,秉承完全开放的共享理念,尽可能为用户提供全方位的数据服务,包括在线数据浏览、数据搜索、数据访问与下载、软件工具及文档资料共享等通用数据服务,以及数据预定、委托查询、数据传递通道、在线模型计算、数据使用咨询等特色数据服务。

3.1 数据资源

国际科学数据服务平台收集的数据资源主要集中于地学、遥感、大气海洋等领域,引进了LANDSAT数据、MODIS数据、MODIS_L1B 数据、EO_1数据、DEM数据、NCAR数据等国际原始数据资源,采用国内外权威的数据处理方法或科学数据中心自行研发的数据处理方法对于上述数据开展了深度加工和数据模型的开发,形成了它们独具特色的一系列全国甚至全球领域的特色数据产品,面向多领域科研需求,基于通用的数据模型,充分利用本站超级计算资源,为用户提供可定制的数据产品加工,用户通过在线定制便可以得到自己需要的数据产品。

该平台期望能满足多领域的科研需求,但是资源集中在少数学科领域,深度加工的数据模型目前只限于少数几个,对于平台的宗旨来说有待发展。

3.2 知识产权保护

知识产权保护问题在共享工作的开展中被首先考虑到,国际科学数据服务平台的数据资源在进行镜像之前都和数据所有者进行了充分的沟通,并通过协议、合作或其他方式取得了对应数据的镜像权限,用户可以放心使用。用户复制使用平台中的数据,平台都做了详细的规定,在“完全与开放”的服务宗旨下,一方面尊重知识产权、保障数据作者和数据服务提供者的权益,要求数据使用者在发表成果时注明数据生产者及数据来源(国际科学数据共享平台http:///),未经网站允许,用户不能有偿或无偿转让在该平台获取的数据;另一方面,为了更好地推动数据共享,凡使用“国际科学数据服务平台”数据的用户,需要在一定期限内将数据所支撑的项目或论文产生的相关成果材料提交到“中国科学院计算机网络信息中心科学数据中心”,并允许平台部分可公开成果。通过这样的“交换”方式来提供更深层次的科学数据给用户,一方面也减少了不必要的重复劳动,提高了用户的使用效率。

3.3 服务内容

科学数据的共享离不开数据的再利用,该平台充分考虑到不同用户在不同情况下的各种服务需求,除了提供通用的数据服务,像在线数据浏览、数据搜索等外,还提供数据预定、数据传递通道、数据申请等人性化的特色服务,切实地提高用户使用满意度。

3.3.1 数据预订

用户通过网站对应入口预定可以查询,但是不能在线下载数据,数据服务人员将会根据用户的数据预定清单提供服务。目前,该平台开放“数据预定”功能的只有Landsat数据,用户可以通过数据列表或者数据搜索功能,产生数据预定清单,并直接通过网站入口提交给系统。用户数据预定的所有历史记录以及当前预定的处理状态和下载链接都可以从“用户空间”内查询。

3.3.2 数据申请

这种服务是针对用户不能通过网站直接查询、下载数据,或因数据量巨大,用户不方便通过网站查询、下载的情况,该平台支持用户提出相应申请,数据服务人员进行处理并将结果反馈给用户,一般用户可以根据自己的情况以及数据的需求选择在线数据申请或离线数据申请。

3.3.3 数据传递通道

该服务属于高级数据服务方式,是该平台为大宗数据用户或特殊数据用户开通的,指对于因为各种原因不方便通过网站直接下载数据的用户(比如网络连接受限,数据量过大,或者用户有其他特殊要求等),可以直接通过网站提供的联系方式提出“数据传递通道”的需求,审核通过后将会为用户开通特殊数据传递通道(比如用户特殊授权,光盘邮寄、硬盘直接拷贝等),以便用户及时获取所需数据。

3.4 共享方式

科学数据资源范文4

关键词:农业科学;数据共享;中间件;管理模块

中图分类号:G250.74 文献标识码:A DOI编码:10.3969/j.issn.1006-6500.2016.01.011

农业科学数据是农业发展的一项重要资源,是农业科技创新的基础,科学地管理农业数据,能够更好地开发和利用各种农业资源。近年来,新疆农村互联网水平显著提高,新疆各类涉农网站也纷纷设立,农业化信息队伍不断壮大。但是每个网站都有自己独立的门户,信息之间数据共享不足,信息交融不够,因此,构建全面的农业科学数据资源管理和共享服务体系、整合各种农业数据资源、实现对农业科学数据资源的高效利用,便成为各部门和广大用户的迫切需求。

1新疆农业科学数据共享平台的现状

新疆已建立的涉农网站超过了100家,其中一些已经形成了一定的规模,在用户的使用中占据了一定的比例,如新疆农业信息网、新疆兴农网等。此外,部分农业下属部门或农业相关部门已经设立了自己的信息共享基础平台,如新疆干旱区林木种质资源共享基础平台、新疆畜牧综合管理信息平台、新疆环境气象监测信息共享平台等。为了避免各部门独立设置门户网站及建立信息平台,因重复建设而产生的资源浪费,更为了方便用户查询各类农业相关信息,我们应该建立一个统一的科学数据共享平台,将现有的科学数据整合集成。集成现有的数据资源平台,能够充分利用各部门的信息资源,有助于消除“信息孤岛”,使各单位可以集中人力、物力来建设自己的特色资源,节约成本。此外,集成数据共享平台在不影响原系统运行的前提下,对各种异构数据统一表示、管理,并为用户建立一个方便透明的数据访问入口,使用户不必再去面对各种不同的应用系统,进行繁杂的操作过程,只需表达其需求,从而显著提高查询效率。

2新疆农业科学数据共享平台构建思路与原则

2.1新疆农业科学数据共享平台构建的思路

新疆农业科学数据共享平台的构建思路是实现以下几个功能。2.1.1数据开发、积累和存储的功能包括农业科学数据的采集和标准化整理,建立标准化的数据库和数据集,使科学数据得到有效的保存,为实现科学数据共享提供资源基础。2.1.2集成及信息拓展功能采用中间件法把农业各个学科的科学数据集成到一个网络系统、集中在一个共享网站上和展示,以便于用户的查询和获取。同时,数据库中的信息还可以动态地增加、删除以及更新。2.1.3数据共享功能即在数据和用户分级分类基础上提供数据在线和离线服务,如数据的分发、数据在共享网站上的等。2.1.4智能的搜索查询功能用户可以使用自然语言查询、模糊查询等多种查询方法对科学数据进行快速查找。2.1.5其他服务功能平台还能提供一些其他的服务内容,如专家咨询、标准定制、决策支持、统计分析等,同时提供了API接口,能够方便地接入新的信息服务模块。

2.2新疆农业科学数据共享平台构建的原则

新疆农业科学数据共享平台的根本目的是通过网络化等手段提供信息的共享服务,便于用户的信息查询及使用,在提供信息数据共享服务的过程中,应体现以下几方面的原则。2.2.1针对性任何信息都是在特定时间、场合下对特定用户的需要产生效用,因此农业科学数据共享服务必须围绕用户的特定具体信息需要来展开,注意信息提供的针对性。信息服务就是要为特定的信息找到确定的用户,使信息发挥最大效用。无论何种信息都必须针对用户的信息需要才能得以存在和发展[1]。同时,随着社会信息总量的迅猛增长,相关信息也在不断增多,如新疆农业信息网每个工作日的信息更新超过50条,如果关注所有农业相关信息,每日信息量会远超过此,而信息提供量超过了用户的吸收能力,就会影响决策的效率。应在完整性基础上认真筛选加工,在可满足用户解决问题的前提下提供尽可能少的信息。2.2.2时效性时间对于信息价值具有决定性的影响。为了保证时效,应当加快信息传递的速度,尽早地把信息提供给用户。但最好是把握恰当的传递时机,在用户最需要的时候提供出去。2.2.3方便性科学数据共享服务要为用户的信息行为提供最大的便利条件,如简单易用的界面,数据的上传下载,要求系统使用方便、对终端用户来说不需要太多的精力用在对软件本身的使用上。还有采用信息技术跨越时空障碍,实现跨地域、跨系统的信息共享简化利用信息服务的手续,从而提高信息服务的效率等。2.2.4可拓展性科学数据共享平台要实现的不仅是数据收集、累计,更重要的是需要集成不同的系统,完成在不同操作系统平台的客户端也能方便地共享数据。而且对不同数据库,都可以提供符合共享数据平台标准的数据,同时软件本身有开发接口,提供给后续的开发和使用。2.2.5稳定及安全性由于数据平台是以互联网为基础建立的,作为数据共享的平台会被频繁访问,系统的稳定性尤为重要。同时为保证数据存储和共享平台,数据、网络的安全,对访问用户应进行严格的权限控制。

3新疆农业科学数据共享平台的构建

3.1基于中间件法的分布式数据共享平台的集成架构

鉴于新疆部分农业下属部门或农业相关部门已经设立了自己的信息查询系统或信息共享基础平台,新疆农业科学数据共享平台要做的首先是能够对已有的系统进行集成。笔者将采用中间件法来实现分布式异构的数据信息集成。中间件是提供系统软件和应用软件之间连接的软件,以便于软件各部件之间的沟通,特别是应用软件对于系统软件的集中的逻辑,在现代信息技术应用框架如Web服务、面向服务的体系结构等中应用比较广泛。中间件法具有成本低、容易实现、局部数据源加入方面灵活、自治性强等优点[2]。元数据是关于数据集的数据,它在地理空间信息中用于描述地理数据集的内容、质量、表示方式、空间参考、管理方式以及数据集的其他特征,是实现地理空间信息共享的核心标准之一。笔者运用元数据在中心节点建立统一的元数据映射表,根据元数据映射表,就可以在查询时自动定位所需查询的数据源位置,实现灵活高效的信息资源整合,从而实现分布式信息资源一体化的建设和共享。在用户与各个分布的信息资源之间建立一个中间层,将元数据管理封装在中间件中,通过元数据映射表为分散的各个数据源和网站或系统提供一个统一的访问接口,就可以实现将分散在各处的数据库等同于单一数据库来集中调用。图1显示了分布式数据集成的逻辑结构,在用户和分布式农业科学数据之间建立一个中间件层,为分布式的异构数据源提供一个统一的访问接口,通过元数据管理器将各个节点提交的对自身数据库描述的元数据进行统一管理,并为无分类的资源定义分类规范,按照一定的分类规则将分好类的资源呈现给用户,用户就可以根据分类信息方便地浏览或查询自己所需要的农业科学数据。

3.2新疆农业科学数据共享平台的总体框架

新疆农业科学数据共享平台建设考虑既有分散又有集中的体系结构,它是一个基于网络的实体,通过数据中心能够实现农业数据的整合集成、保存及社会共享服务。通过中间件法可以将分布异构的农业科学数据集成到共享平台下,使其具有统一标准的数据源接口及共享协议,能够有效地进行管理,还需要添加一个服务模块,使各个分散的信息源都能够方便快捷地成为共享平台的一部分。此外,服务模块的结构设计采用灵活的层次,可对其进行任意功能服务的拓展。因此,整个数据共享平台是一个由网络层、数据层、服务层、中间层、服务层及支持保障层(包括技术支持、管理支持、标准支持)组成的多层次的综合系统[3],如图2所示。第一层是用户层,提供统一的用户输入接口。用户可以通过不同的接入方式如手机、浏览器、电脑等,登录到数据共享平台,使用不同的设备都能够方便快捷地访问数据共享平台的所有信息及服务。其次,根据用户身份将其分为不同等级,不同等级的用户在登录平台后对数据信息享有不同的浏览及使用权限。第二层是服务层,可以为用户提供智能化的检索查询、专家咨询、统计分析、决策支持等服务,同时服务层还可以根据用户的使用情况以及数据共享平台的需求方便快捷地增加其他服务功能。服务层是用户发现和获取数据的关键点,是数据中心存在价值的具体体现。第三层是中间件层,能够通过元数据映射信息将分布在不同地方的异构数据源提供统一的访问接口,实现数据的集成。第四层是数据层,其中包含了分布在各个系统的分散数据库,也可以新建数据库。对于各数据库中的信息,不仅可以通过网络远程调用共享,还能够动态地添加、删除或更新数据库中的数据。第五层是网络层,是数据中心运行的网络环境,包括软硬件条件、操作系统、备份系统、安全系统,各个数据源之间的网络互联、网络出口带宽等,用户可以通过网络访问数据中心,查询和获取相关数据。网络层主要解决硬件管理问题和支持上层的数据管理问题,是数据中心运行的基础。第六层是支持保障层,由技术、标准和管理三个方面构成。支持技术包括数据采集技术、数据处理技术、元数据技术、数据库技术、网络技术、计算机技术等。支持标准由数据标准、服务标准和管理标准三大系列标准组成。管理支持包括组织保障、人才保障、资金保障、运行机制保障、安全保障等组成。

4新疆农业科学数据共享平台的体系结构及功能模块分析

4.1新疆农业科学数据共享平台的体系结构

为了完成平台的数据整合和数据共享服务,笔者从设计角度构建平台的层次结构模型,包括平台的功能设置、基础模块以及各功能模块之间的相互关系等,如图3所示。用户可通过多种登录途径进入数据共享平台,经过用户管理模块的验证后,不同用户将在平台中享有不同权限的查询及数据共享内容。平台能够为验证通过的用户提供检索查询、导航、专家咨询、统计分析、决策支持等多种服务,而支持这些服务所需的数据,则是由元数据管理模块将处于不同位置的异构数据库集成共享而来的。在元数据管理模块处添加领域本体,增添数据的语义信息,从而能够实现模糊查询。此外,在数据库层还有一个数据库接口管理模块,能够对数据库进行操作,对数据库进行添加、删除,对数据库中的数据进行更新等。不同权限的用户享有不同的操作权限[4]。

4.2平台各模块的功能分析

新疆农业科学数据共享平台的体系结构包括多个模块,下面就分别介绍各模块实现的功能。4.2.1用户管理模块用户层为用户提供统一的输入接口,其输入接口可以包含多种形式,如浏览器、手机、短信等多种登录查询渠道。由于农业科学数据种类多、数量大,各类数据的加工存储状态各不相同,部分资料还有保密性要求,因此,共享数据范围按数据内容进行了分级,如一级数据为国内外公开数据,可供用户无偿使用;二级数据为省内公开数据;三级数据包含专项数据,只为部分用户提供共享服务;四级数据为原始数据及保密数据,仅供少数专家或相关研究人员共享使用。用户管理模块用来实现用户分级分类共享数据。按照用户注册信息进行等级划分,可将用户分为个体用户和群体用户。个体用户分为普通用户、科研人员、管理人员;群体用户包括科研单位、相关企业等。不同的用户对共享的数据具有不同的操作权限,如个体用户对各项数据仅有查询权限,而管理人员则可以添加、删除或更改数据。用户通过统一输入接口将注册信息输入,用户管理模块将其信息存入用户信息库中,便于以后用户登录对其等级进行查询。注册用户登录后则进入科学数据共享平台开始查询信息或接受平台提供的各种服务。4.2.2数据平台服务模块数据平台通过各种模块能够提供多项服务。检索查询模块提供基本的信息检索接口,接收到用户的查询信息后进入元数据层寻找相关信息,由元数据目录引导找到相关数据库进行数据的查询,然后将查询信息返回检索查询模块,以浏览页面的形式呈现给用户。导航服务模块能够记录用户的查询历史,并对用户历史查询信息特点进行总结归类,根据用户的使用习惯对用户再次访问提供个性化服务。专家咨询模块能够支持用户向专家提问,专家咨询模块将问题经过处理后自动传给相关专家,然后将答案传回给用户。当问题得到满意答复时,问题及答复则存储在专家咨询模块的数据库中,以便下次有相同问题出现时,可自动提供答案。决策支持模块主要面向群体用户,如科研机构或企业等,根据用户决策需求,整合搜集到相关的政策报告、统计数据等经过分析处理,为用户决策提供支撑信息。服务管理模块实现的功能是对于服务模块的添加、删除或更改。当数据共享平台需要提供新的服务时,可通过服务管理模块创建新的服务模块,以保证农业科学数据平台的灵活性。4.2.3元数据管理模块当用户对平台各项服务进行操作时,需要元数据提供数据库信息,元数据管理模块接收到查询参数时,根据元数据映射数据库找出享有的数据源位置,元数据管理模块通过分布式异构数据源统一访问接口进行数据查询,然后将查询结果统一格式后返回给用户,本体数据库能够对用户输入的查询条件进行语义拓展,从而实现数据的语义化查询。4.2.4数据库接口管理模块数据库接口管理模块主要功能是为数据库的增加、减少提供一个接口,便于新的数据库的加入,保证了数据共享平台的可拓展性。

5结语

新疆农业科学数据共享服务平台的建立是一个长期的过程,需要在目前的各网站资源基础上不断地改进和完善,其结构体系的建立更不是一朝一夕能够完成的,需要不断地优化。笔者针对新疆部分农业下属部门或农业相关部门已经设立自己的信息查询系统或信息共享基础平台的情况,结合中间件法的优势,对新疆农业科学数据共享平台已有的系统进行集成,再根据用户需要增设各种服务及查询功能,既能很好地利用已有资源,又对不同渠道的资源进行了整合,使分布不同的各种资源能够相互贯通,用户使用起来更加方便快捷,满足了用户多样化及个性化的需求,极大地降低了成本,提高了服务效率[5-11]。

参考文献:

[1]张小红,李思经.农业科学数据共享服务研究[J].中国科技论坛,2006(9):127-130.

[2]杨晓蓉.分布式农业科技信息共享关键技术研究与应用[D].北京:中国农业科学院,2011.

[3]孟宪学.国家农业科学数据中心的设计与建设研究[J].农业图书情报学刊,2004(12):5-8.

[4]赵胜刚.国家农业科学数据共享服务平台体系结构研究[J].安徽农业科学,2009(19):9303-9305.

[5]杨兰伟,闵文江,吕军海.建立国家农业科学数据共享中心河北分中心的实践与思考[J].河北农业科学,2010,14(9):168-169.

[6]马海龙,陈佑启,邹金秋“.国家农业科学数据共享中心农业区划数据分中心”系统设计与建设[J].中国农业资源与区划,2010(2):75-80.

[7]赵华,王建.中国农业科学数据共享分析与展望[J].农业展望,2014(9):54-57.

[9]王华丽,张磊磊,王新哲,等.新疆农业科学数据共享用户需求调查分析[J].新疆农业科技,2014(5):1-3.

[10]尹川,王建春.天津市农业科技信息共享与服务平台的构建[J].天津农业科学,2010,16(2):94-96.

科学数据资源范文5

高校是科学数据大量产生的重要来源,而图书馆不仅是文献资源的聚集中心与服务机构,也是高校科研活动的重要服务支撑机构。在数字化时代,用户的信息需求更为多样,高校图书馆亦不再满足以往文献资源提供者的教学辅助角色,亟须改变思路、转型升级。科学数据的大量出现为图书馆带来了巨大挑战,同时也蕴藏着机遇。图书馆提取和存储海量科学数据,进行数据分析、整理和加工,提供科学数据服务,提高针对科研用户服务的能力,是图书馆嵌入式科研服务的重要路径。

在科学数据的管理与服务中,图书馆具备天然的优势,拥有提供数据服务的基础:①在信息组织与共享上,图书馆积累了大量的经验;②高校图书馆配备了相应的数字资源管理软硬件设施;③图书馆具有一批高素质的图书馆员,可为研究者提供数据存储、管理以及数据教育的支持。

二、高校图书馆科学数据服务的内容

1.平台建设与管理

构建专门的科学数据管理与服务平台是做好科学数据服务的基础。平台具备数据存储与数据服务两大功能模块。数据存储模块分为临时存储与长期存储,数据创建者可自行上传、修改数据并设置相应的共享权限。某项科学研究完成后,可采用同行评议的方式对数据进行评估筛选,将具有长期保存价值的科学数据由临时存储转为长期存储。数据服务模块则主要面向使用者的数据检索、下载需求,并提供数据分析服务。

图书馆员在科学数据管理与服务平台中主要承担数据的组织与监护职责。工作内容包括对不同结构的数据建立相应的组织规范;为科学数据添加标引,通过元数据等技术对不同领域的科学数据进行语义关联,以便后期进行更深层次的开发;对平台的数据进行监管,保证其完整性与真实性,以实现对科学数据的长期再发现和再利用;负责平台的日常管理工作,提供科学数据的提交、审核、专家评议、出版、和交流等服务。

2.科学数据开发服务

图书馆科学数据开发服务是指图书馆对其自身拥有的科学数据和其他合作科研机构的科学数据进行统一收集和整理,并在科学数据平台上共享。除了高校内部科研人员提交的科学数据,图书馆员还可以通过开放存取、合作机构和合作科研人员、共享联盟等途径获取科学数据。

3.科学数据检索服务

数据在科研活动中的地位与日俱增,科研人员由于自身获取的数据资源有限,对委托图书馆员进行科W数据检索服务具有较高的需求。要实现这一服务,必须利用数据关联技术(元数据描述、 数字对象唯一标识符等)增强数据的互操作性,实现跨领域间的科学数据语义检索。同时图书馆要加强与其他各类机构之间的合作,实现数据资源共享。

4.科学数据参考咨询服务

科学数据参考咨询服务是指图书馆嵌入科研项目数据的规划、采集、计算、存档、和长期保存的全过程中,为用户各类科学数据问题提供咨询。如为师生提供数据管理方案或元数据标准方面的咨询,为用户查找和引用数据提供相关方面的参考等 。

三、结语

在大数据时代的背景下,高校图书馆应对科学研究第四范式的转变必须做好科学数据的管理与服务。在制定相关制度和培养数据馆员的基础上,高校图书馆通过构建基于科学数据管理的图书馆数据服务平台,收集、整理、存储、管理、分析、加工科学数据,并提供各类嵌入式、个性化的服务,实现科学数据的共享、复用与增值。这是高校图书馆从文献服务迈向知识服务的重要转型,也是图书馆嵌入科研服务的重要路径。

参考文献:

科学数据资源范文6

Research on University Library Embedded Data Literacy Education

Abstract The article summarizes the content and features of the era of big data,and on the basis of a brief introduction on the pattern and practice of university libraries carrying out data literacy education abroad, the author proposed that university libraries in China which want to develop data quality education should seek cooperation with professional teachers, students, and researchers by embedding the education in the curriculum and teaching network platform, in learning environment, and in the whole process of research projects.

Key words university library; big data; data literacy; data literacy education

随着科学研究第四范式[1]――数据密集型科研的悄然兴起,科学研究以数据为中心、以数据为驱动的特征日益突出。研究者遇到了越来越多的数据监管、数据出版、数据引用等方面的问题[2]。对数据的获取、使用和评价等技能成为大数据时代高校师生应该具备的基本素养。笔者综合国内外文献研究发现,数据素养的内涵是指具备数据意识[3]并对数据具有批判性思维[4],而且能够及时有效地获取、分析、处理、利用和展现各种数据资源。

数据素养虽然是一个全新的概念,但它并不是凭空出现的,而是在我们过去长期研究的统计素养和信息素养概念的基础上,经过外延的扩展和内容的重新定位而形成的关于人的素养的新概念,强调的是大数据环境下对数据的理解、交流、获取、分析及运用的能力。在现代信息环境下它已成为影响人们科研能力、科研水平的重要因素,主要包括数据意识、数据知识、数据技能、数据能力四个方面,其中能力层面的数据素养培养是数据素养教育的重点,包括数据基本能力、数据获取能力、数据评估能力、数据管理能力、数据使用能力、数据表达能力。

本文在概述数据素养概念内涵及特征的基础上,通过对国外数据素养教育模式及实践的归纳与分析,提出国内高校图书馆开展嵌入式数据素养教育的路径,以期为我国高校图书馆开展数据素养教育提供对策与思考。

1 数据素养教育的内涵和特征

数据素养(Data Literacy)的定义在不同环境和不同领域中均存在差异。数据素养一词是一个组合词,由数据和素养两个词组合而成。一般而言,素养指人们通过学习、训练和培养能从后天获得的知识、技巧或能力;而数据字面的理解就是数值或数量,在此则指广义上的数据,包括各种数字、文字、视频等各种信息甚至符号。综合目前国内外的相关研究,笔者认为,数据素养应该主要包含以下几方面内容:一是正确地认识数据,并运用正确的方法获取数据;二是以数据分析为基础对数据做出正确的判断和解释;三是科学地管理数据,使之成为可获取、利用的资源;四是准确地评估数据,在此基础上做出正确的决策。

从科学研究生命周期的角度来看,数据素养与数据生命周期直接相关,数据素养的内容涵盖在科学研究生命周期的各个阶段。从科研项目的启动开始,到研究数据的收集、研究过程中数据的组织和管理、数据分析的工具与技术、数据的存贮与数据安全,直至最终的数据共享规则与如何使用等,都与数据素养息息相关。在最初的数据收集阶段,研究人员必须了解数据源的特征,包括数据的类型、格式等;在数据的组织、整合及管理阶段,研究人员要学会设计相应的管理平台和数据架构;在研究进行的过程中,科研人员应熟悉数据分析工具和数据分析软件,利用原始数据进行建模,在数据分析的基础上得出令人信服的结论。为了数据能长期保存和共享,科研人员还应了解数据保存、共享与数据安全等方面的知识,包括共享平台的数据使用政策、规则以及知识产权问题等。

从大数据的角度来看,随着数据密集型科研时代的来临,科学研究的数据呈几何级数增长,“数据驱动科学发展,科学就是数据,数据就是科学”[5]这样的理念在科学研究领域已经形成共识,对数据的获取、分析和利用能力成为大数据时代人们必备的科学素养之一。其实早在2010年在哥德堡召开的第76届国际图联大会上,科学素养就成为会议的重要议题之一[6],2012年美国博物馆与图书馆服务协会资助了数据素养项目,以探索培养科研人员数据搜集、整理及运用的能力[7]。这些都说明数据素养问题已引起国外图书馆界的广泛关注,而且美国许多高校图书馆近年来也纷纷开展数据素养教育实践活动以适应大数据时代科研环境变化的要求。

2 国外高校图书馆数据素养教育的模式与实践

基于对科学研究范式变化以及数据管理需求的迫切洞察,麻省理工学院、普渡大学、密歇根大学、牛津大学图书馆等都已认识到提高科研人员及学生数据素养的重要性和紧迫性,通过组建专门的团队,从课程开发、资源提供、科研支持、技术工具、专业设施等多个方面开展创新服务,并积极探索在资源、人员、服务等方面做出改变,开展形式多样、多方合作、适应现代需求的数据素养教育。

国外高校图书馆开展数据素养教育的模式有[2]:一是通过 Libguide 建立科学数据管理资源导航,提供基础的数据服务,包括数据管理的概念、方法、工具及可利用资源等; 二是面向研究生和研究人员提供科学数据素养通识教育,包括数据管理的基本理论与方法;三是深入到具体学科领域,提供针对性强、内容更为系统的学科专题数据素养教育。

数据素养的概念一经提出,其研究和相关实践活动也获得了各种研究基金和科研机构的支持。如早在2004年,国际社会科学信息服务与技术学会(International Association for Social Science Information Services and Technology, IASSI)就支持了相关研究。2007年美国雪城大学教授秦健获得美国国家科学基金会研究资助,开设“科学数据管理 ( Scientific Data Management) ”课程,在2 年的时间内重点关注如何提升本科生的科学数据素养[8]。

而长期从事文献检索教育、信息素养教育并积累了丰富经验的各高校图书馆也敏锐地发现了数据素养教育在大数据时代的重要价值和师生们的迫切需求,纷纷加入到数据素养的教育和研究中。许多美国研究性大学图书馆首先在其信息素养教育课程中加强了数据管理的技能培训,如康奈尔大学图书馆就开设了很多有关数据素养方面的讲座。美国博物馆和图书馆服务研究所(IMLS)通过资助相关大学的研究来参与数据素养教育过程,如2010年资助马萨诸塞大学医学院和伍斯特大学理工学院开展了针对研究生与本科生的科学领域数据管理课程计划研究, 2011年资助普渡大学、斯坦福大学、明尼苏达大学、俄勒冈大学联合开展“ 数据信息素养培训” 项目。

2007年,明尼苏达大学图书馆组建了e-Science和数据服务协同团队(EDSC) ,他们通过调查美国多个大型研究机构的用户需求报告、澳大利亚国家数据存储中心的实践经验以及英国在定义图书馆角色和责任方面的成果,建立了数据管理专题网站, 开办了“ 科学家和工程学家的数据管理入门”研讨会,并于2010年开设“为您的基金申请创建数据管理计划” 专题讲习班,不仅为教师提供数据管理知识, 而且促进了教师和图书馆员之间在科研中的合作关系。2010年,马萨诸塞大学阿默斯特分校图书馆成立了数据工作小组,负责数据资源的管理,提供数据管理的相关咨询并开发了实用的数据管理课程。他们有针对性地开设了各种与数据管理相关的讲习班,提供数据存贮、数据共享、数据再利用、数据伦理等核心技能,很受学生的欢迎。

由上可见,国外高校图书馆不仅对数据素养的理念发现敏锐并具备丰富的实践经验,而且已经将理论与实践快速地应用到图书馆教育与培训中去,形成了较为完备的数据素养教育服务体系,包括数据管理的资源导航、咨询服务,数据管理的课程开发和用户培训等内容。

3 国内高校图书馆开展嵌入式数据素养教育的路径

目前国内的高校图书馆在数据素养方面无论是理论研究还是实践探索都处于起步阶段, 相关研究要么是对国外理论、方法与实践项目的介绍,要么是从图书馆视角做一些研究与思考,没有研究现代信息环境下数据素养教育的内容、方式、特点、实施策略以及如何与当前我国的信息素养教育对接进而获得发展。主要表现在:一是对数据管理、数据素养教育的认识与理解不够深入;二是对数据素养教育缺乏相应的政策设计和服务支持;三是没有形成科学系统的数据素养教育模式。

高校图书馆作为信息素养教育的主要执行机构,理应全力以赴地投入到数据素养教育的理论研究与实践中去,积极探索数据密集型科研范式环境下,将数据素养教育与培训渗透到用户的工作、学习和生活空间,提供一种到身边、到桌面、随时随地、无处不在的主动服务,将这些教育与服务实时地、动态地融入到用户的学习、工作和生活中,并与用户实现良性的互动与沟通。

大数据环境下高校图书馆的数据素养教育并不是图书馆能独立完成的,合作是开展数据素养教育的必由之路,必须寻求与高校教师、学生及科研人员的合作,包括与专业老师合作,嵌入课程和网络教学平台;与学生合作,通过图书馆的学习共享空间和信息共享空间嵌入学习环境;与科研人员合作,嵌入科研课题的全过程,协助数据管理。

3.1 与专业教师合作,嵌入课程和网络数学平台

与专业教师合作就是在高校的专业课教学过程中,图书馆组建由学科馆员、技术人员、数据管理人员组成的团队提供相关支持,全程参与教师的课程设计和教学实践活动。图书馆团队要与教师预先做好课程设计,共同完成教学目标的制定、教学内容的选择,并将数据素养的相关理论、方法有机地嵌入到课程中,让学生在掌握专业知识的同时也学会与之相关联的数据处理技能及应用数据环境。

除了传统的课堂教学之外,网络在线课程也是图书馆提供数据素养教育的一种重要方式。可以通过已经建成的网络教学平台,将数据素养教育的概念、理论、方法、案例等以专题讲座或视频甚至是动漫的方式制作成专门的课件供学生学习。还可以通过现有的图书馆导航系统或专题网页建立相关的数据资源导航,提供图书馆现有的数据服务信息及数据服务工具等。如美国的一些高校图书馆就在自己的资源导航中提供了数据资源列表、常用数据集、研究数据仓储等栏目,还有图书馆的特色数据、新购数据资源、数据馆员的联系方式等。

3.2 与学生合作,嵌入学习环境

目前我国高校正在积极探索与实践创新性教育,尝试各种创新性学习方式。学生们在专业教师的带领下借助各种学习资源,采取多种多样的学习方式将新知识灵活应用以解决实际问题。在这个过程中,学生们通过对特定问题相关知识、信息、数据的收集、分析、整合来完成全新的知识建构,在解决问题的过程中掌握新知识。整个学习过程强调以学生为中心,教师只是学生知识建构与应用的帮助者。而在创新性学习过程中,图书馆的学科馆员、数据馆员可以借助图书馆的信息共享空间、学习共享空间充分参与到学生的学习、讨论中去,用自己的专业知识为他们提供信息和数据收集、分析和评价的途径和建议[9]。

图书馆员的服务还可以嵌入到学生的毕业论文(设计)写作中去。在选题和开题阶段,图书馆员可以利用自己熟悉和掌握各类数据库的特点和使用方法,帮助学生检索到高质量的文献信息;在数据收集与分析阶段,图书馆员可与专业教师合作,帮助学生用科学的方法分析和判断数据信息;在写作和完成阶段,图书馆员可以提供过去的最佳范例,提高学生的学习效率。在这个过程中,不仅是学生运用所学的专业知识解决问题提高自己的综合素质,也是学生对过去所学的有关数据获取、数据分析、数据评估等数据素养相关知识的积淀与提升过程,是学生专业知识掌握与数据素养共同提高的最佳路径。

3.3 与科研人员合作,嵌入科研课题的全过程

国际上科学研究中数据管理法律框架、科研资助机构的数据管理要求、学术的原始数据共享规定以及所在机构数据保存政策等数据管理方面的政策与规范,对科研人员的数据管理素质提出了更高的要求,而图书馆在资源及数据采集、管理、整合与服务方面具备的优势成为其与科研人员合作开展数据素养教育的优势。如高校图书馆可以为科研人员提供数据存储、管理、共享与服务。

图书馆还可以在现有的实体空间中将现代信息技术与图书馆服务相融合,开辟数据实验室,建立起由学科专家、学科馆员、数据馆员相互协作的机制,依托具体的科研课题开展数据素质培训、科研创新和学术交流,大家各展所长、各司其职,由图书馆员为科研人员提供多层次、个性化的数据服务。