大数据分析论文范例6篇

前言:中文期刊网精心挑选了大数据分析论文范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

大数据分析论文

大数据分析论文范文1

关于移动通信论文参考文献:

[1]谢显忠等,基于TDD的第四代移动通信技术[M].电子工业出版社,2005.

[2]解梅,移动通信技术及发展[J].电子科技大学学报,2003,02.

[3]宋文涛、罗汉文,移动通信[M].上海交通大学出版社,1996.

[4]何林娜,数字移动通信技术[M].机械工业出版社,2004.

[5]吕昌春,李林园.移动互联网产业链平台竞争与电信运营商增值业务发展策略研究[J].邮电设计技术,2012(11):16-20.

[6]张洁.影响中国移动通信产业发展竞争力的因素分析[J].经济视角(下),2011(01):52-53.

关于移动通信论文参考文献:

[1]张洁.影响中国移动通信产业发展竞争力的因素分析[J].经济视角(下),2011(01):52-53.

[2]吕昌春,李林园.移动互联网产业链平台竞争与电信运营商增值业务发展策略研究[J].邮电设计技术,2012(11):16-20.

[3]刘文婷.以运营商为主导的移动互联网业务商业模式研究[J].中国工业经济,2012(08):66-74.

[4]冯文高.我国移动通信产业的竞争均衡分析[J].现代经济信息.2009(16)

[5]张洁.影响中国移动通信产业发展竞争力的因素分析[J].经济视角(下).2011(01)

[6]马云泽.我国移动通信产业的市场结构与规制改革[J].经济问题.2009(01)

[7]张平王卫东陶小峰《WCDMA移动通信系统》人民邮电出版社

[8]詹炳根,《工程建设监理》,中国建设工业出版社,1997

[9]谢坚勋浅谈工程监理与项目管理接轨建设监理2004(2)

关于移动通信论文参考文献:

[1]赵刚.大数据:技术与应用实践指南[M].北京:电子工业出版社,2013.

[2]漆晨犧.电信企业大数据分析、应用及管理发展策略[J].电信科学,2013(3):12-16.

[3]刘洁,王哲.基于大数据的电信运营商业务精确运营平台的构建化[J].电信科学,2015,29(3):22-26.

[4]张俊.移动通信网络中大数据处理的关键技术研究[J].电信网技术,2014(4):10-12.

[5]康波,刘胜强.基于大数据分析的互联网业务用户体验管理[J].电信科学,2013,29(3):32-35.

[6]谢华.大数据在移动通信中的应用探讨[J].科技创业家,2014(1).

[7]夏磊.探巧大数据下的智能数据分析技术[J].科技创新导报,2014(10):21.

[8]侯优优,隋化严.网络优化中的大数据应用[J].互联网天地,2014(l):34-37.

[9]刘震,付俊辉,赵楠.基于移动通信数据的用户移动轨迹预测方法[J].计算机应用与软件,2015,30(2):10-13.

大数据分析论文范文2

关键词:技术创新;大数据;双螺旋模型

一、引言

自2013年被确定为“大数据元年”以来,大数据应用已广泛渗透到各行各业。伴随着数据规模和类型的剧变、数据存储成本的迅速下降、数据采集更加密集和广泛,学术界和企业界开始站在战略的高度重新审视大数据的价值。2008年9月,《自然》杂志推出了名为“大数据”的封面专刊,随后IDC(2011)描述了大数据的“3V”:规模性(Volume)、多样性(Variety)、实时性(Velocity),之后又加入价值性(Value)来描述大数据特征,称之为“4V”[1]。麦肯锡(2011)将大数据定义为无法用常规软件收集、储存、处理、分析的庞大数据集。Forrester突破了以往单一对数据本身描述的局限,通过数据价值实现的角度将大数据定义为数据存储、处理和访问的流程与业务目标的集成。国内学者涂子沛在其专著《大数据》(2012)、《数据之巅》(2014)中反复表达“尊重事实,用数据说话”[2]以及“推崇知识和理性,用数据创新”的观点,并描述了未来对于建设“SmartCity”的构想[3]。孟小峰(2013)指出大数据研究的火热,并不能代表研究的深入,相反大数据的研究还处于一个非常起步的阶段,还有诸如关键技术、利用方式等很多基础性的问题需要解决[4]。大数据的发展和进步是以数字信息技术的发展和应用为主线的。数据分析、数据挖掘、数据存储是拉动大数据发展的“三驾马车”,这三项数据技术需要不断进行创新才能进一步发掘大数据的价值潜力。由于大数据具备准确预测趋势的能力、从海量数据中萃取有应用价值信息与知识的能力以及对市场技术需求方向突出的把控等能力,使得技术创新的效率有较大幅度的提升。同时,数据分析、挖掘和存储本身作为技术手段也需要进行创新。因此,大数据与技术创新之间存在着密切的联系。朱东华等(2013)提出了大数据环境下面向技术创新管理的双向决策模型,以期提升我国技术创新管理研究在大数据环境下提取知识与观点的能力[5]。赵亮等(2015)通过大数据的收集和预处理、大数据存储、创新源数据可视化以及创新应用子项目的实施,实现对技术创新评估预测、风险把控能力的提升[6]。针对大数据与技术创新有关文献的梳理,不难看出,在大数据时代下,大数据对于各类技术创新具有较大的提升作用,而“大数据”概念下作为技术支撑的数据技术同样需要创新,同时也需要对数据技术的创新进行管理。对于大数据和技术创新这种“你中有我,我中有你”的相互作用关系,论文尝试以双螺旋结构模型为研究工具,提出大数据———技术创新双螺旋模型,从而厘清在大数据与技术创新作用关系中的动力因素,以达到大数据与技术创新共同发展进步的目的。

二、双螺旋结构理论

双螺旋结构模型起源于生物学中的DNA双螺旋结构,生物学家为了研究人类的遗产规律,从人类遗传密码———“基因”的角度出发,提出并绘制了DNA双螺旋结构模型。1953年,沃森和克里克首次提出了DNA双螺旋结构模型,该模型开启了分子生物学时代。利用该模型,人类直观地认识到遗传信息的构成和传递路径,并对人类遗传信息复制上升的互融联动关系有了初步的了解。在生物分子学领域,DNA双螺旋结构模型是由两条主链和碱基对组成,两条主链相互盘旋形成类似于“麻花”状的螺旋结构,而碱基对位于螺旋内部,两两对应。碱基对的排列顺序就决定了生物体的不同性状,而在DNA双螺旋进行发展进化之时,碱基对的不同组合以及排列顺序就确定了未来生物的发展走向。随着管理科学的发展,在管理科学领域中有许多互相影响、互相促进、互相融合的二元关系,为了清晰地描述这种关系,管理学中引入分子生物学的DNA双螺旋结构模型进行描述,从而形成了管理科学中的双螺旋结构模型。质量管理学家戴明通过对计划———执行———检查的研究,提出这三个步骤不是原地循环往复的,而是一种螺旋式上升。于渤(2008)将知识创新双螺旋作为企业知识创新过程,指出创新的过程需要经历一套复杂的过程,最终实现自我超越的知识螺旋转化[7]。管理科学与分子生物学的结合提炼出螺旋式系统方法论,又称作螺旋式方法论。该方法论指导双螺旋结构模型在管理领域的应用,而其基本的解决问题的精神是,按照事物发展的规律和演变的过程,通过螺旋内部重大影响因素的互相作用,循环使用不同的方法,推进事物有序的发展,最终达到事物发展的某种目标。

三、大数据与技术创新双螺旋模型及分析

1.大数据与技术创新双螺旋模型对于各类技术创新,大数据提供了庞大的样本数据分析预测、精细的市场技术需求定位、详尽的技术创新需求对象画像刻画等服务,使得技术创新的效率大幅度提升。而数据分析、挖掘和存储是推动大数据自身发展的核心技术,这些技术的创新也将直接影响到大数据对其他技术创新的拉动作用。利用双螺旋结构模型研究大数据与技术创新相互作用关系具有积极的现实意义,论文提出大数据———技术创新双螺旋结构模型(BigData--Tech-nologyInnovation双螺旋结构模型;BT双螺旋结构模型)。依据BT双螺旋结构模型,本文将大数据与技术创新视为两条主链,即“大数据链”和“技术创新链”。这两条主链的相互作用是依靠碱基对进行链接的,为了推动“大数据链”与“技术创新链”的发展增长,碱基对的不同搭配,相互作用,促进BT双螺旋模型的不断发展。数据挖掘、数据分析、数据存储是推动大数据发展的技术核心,技术创新的发展需要技术创新管理理论的指导,以技术创新管理理论指导数据技术的创新,从而实现BT双螺旋模型的发展。故将数据挖掘、数据分析、数据存储和技术创新管理理论作为碱基,进行两两配对。图1BT2.大数据———技术创新双螺旋模型分析BT双螺旋结构模型中将大数据与技术创新作为研究的主要对象,将其作为两条主链进行分析。各类技术的创新需要在大数据以及大数据相关技术的支持下进行。同样的,大数据自身数据技术的创新又归属于技术创新范畴,需要相关技术创新管理理论来给予指导和管理。BT双螺旋结构模型需要向纵深发展,就必须要经历双螺旋结构的破裂———复制———重组———再破裂这样的一个循环过程,从而循环往复,推动BT双螺旋模型不断发展。碱基一:数据挖掘技术,大数据需要通过从海量的数据中提取有效信息和知识,因此,数据挖掘技术是大数据未来发展的一项核心技术。凭借数据挖掘技术提炼出有价值的信息与知识,可以为技术现状进行评估、技术创新未来趋势进行预测、技术创新源进行汇总提供强大的信息支撑。碱基二:数据分析技术,数据分析技术是通过对现有数据进行分析,归纳、整理、总结并对所分析对象提供相应的预测。该技术是连接数据与结论的重要桥梁,通过分析技术可以顺利地将“冷冰冰”的数据转化成为有价值的结论成果,碱基三:数据存储技术,存储技术是数据挖掘技术与数据分析技术的基础。信息时代的数据不仅仅是结构化的数据,更多的则是非结构化或是半结构化的数据,大量的数据需要有存储空间,并且要做到随用随取,这样才能使得数据的挖掘和分析更具时效性和针对性。碱基四:技术创新管理理论,数据技术的不断革新需要从管理学的角度给出指导性的建议。大数据的三项核心数据技术本身作为一种技术手段,需要进行科学的发展,在数据技术的创新过程中,离不开技术创新管理理论的协助。大数据链与技术创新链作为BT双螺旋模型的两条主链担负着不断进步发展的使命,以数据挖掘技术、数据分析技术、数据存储技术和技术创新管理理论为碱基对负责对两条主链的发展进行指导。在DNA双螺旋结构模型中,碱基对必须是A-T,G-C进行定位搭配互补,而在BT双螺旋模型中,通过借鉴DNA双螺旋结构模型的碱基对互补理论,从而进行多元轮回式的互补结合。BT双螺旋模型中的碱基对不再像DNA双螺旋模型那样必须定位对象式的配对,当进入破裂阶段,大数据链与技术创新链进行分离,两主链破裂时连带自己链条上所携带的碱基一并分离。进入到复制阶段,各碱基进行复制,也即各项数据技术以及技术创新管理理论的推广应用。而后,进入重组阶段,碱基随机两两结合,重新配对,在不同的空间、时间进行不断的随机结合,就会产生奇妙的化学反映。从而在不同随机两两碱基结合的过程中,产生创新,发挥动力作用,就如同图2所示地推动BT双螺旋模型向纵深方向进行发展进步。

四、结论与展望

大数据分析论文范文3

【关键词】大数据;高等教育;大数据思维模式;教育改革

一、大数据与高校

伴随着人类存储信息量的增长,越来越多的领域开始加入大数据阵营,越来越多的行业开始利用大数据分析,大数据给我们带来的影响已经悄然成为社会各行业运行的基础。

高校作为社会培养人才的一个重要的组成部分,目前多数学校仍延续着传统的教育范式,教学策略依赖教师的经验,教师的学术严重落后于社会科技的发展,学校的评估机制存在很多漏洞等等。许多专家发现了高等教育存在的问题,却没有更好的解决办法,以前我们常说“让事实说话”,现在我们大声呼吁“让数据说话,用说话的数据”。

二、迎接大数据

迎接大数据的到来首先要做的就是思维模式的改变。大数据科学本身其实是许多学科例如统计学,数据挖掘技术,机器学习,计算机技术,方法论相结合的跨学科科技,以多种理论为基础而诞生的新兴科技,使用者必须要对自己原本的思维模式进行相应的变革。

大数据首先强调的是“大”,采集一切有关甚至表面上看似“无关”的数据,也就是以后用于分析的数据要是全体数据,我们称之为“全数据”;其次,采集的数据讲究的是模糊,而不是精确,数据的种类模糊,数据的分析模糊,而预测分析的准确度来源于数据量之大,正所谓“量变带来质变”;最后,就是对于大数据分析的结果,我们要明确“是什么”,而不必在乎“为什么”。于是,大数据体系形成了思维的改变去采集数据,从而获得“大数据”,利用数据分析技术和算法来得到更为有效更为精准的数据。

三、使用大数据

(一)大数据的来源。高校中其实蕴含着更加丰富的数据,从学生的角度来说,学生的消费,家庭情况,宿舍活动,选课信息,学习进度,作业完成进度,考试成绩的比对,参与的社团,参加的竞赛,参加的活动,已经毕业的学生就业情况,社会职业供求关系,就业的满意度调查等等太多数据,从教师的角度,教学过程的监控,教学内容的整理,课程设计,,学生的成绩变化,论文质量,参与活动,科研项目等等数据,还要从社会,从家长,从宿舍,从第三方机构采集数据。由此可以看到整个校园的数据其实是一个极度庞大的数据,这些数据的集合才是“大数据”。

(二)大数据不是单纯的“数字化”。例如,某个教师采用计算机多媒体课件,或者使用在线视频课程,或者加入MOOC的阵营,这仅仅是简单的将原本文字的东西变成“0和1“而已,这是数字化,不是大数据,充其量算是实现“大数据”而使用的计算机技术。我们真正要做的是在这些计算机平台中去采集我们需要的数据,甚至收集我们看似毫无关联的数据。

(三)广义量化的数据。建立大数据,需要将一切信息进行量化,把文字量化,把数字量化,把地理位置量化,把沟通语言量化,把一切可以量化的信息都变成数据,构建大数据平台。

(四)大数据的作用。高校的大数据,要还原真实的教学质量,真实的就业情况,真实的师资力量,真实的管理决策成效,不能简单的用问卷调查得出“好、不好”的结论。大数据发掘了时间价值,节约了时间,历史数据的总结,实时数据的分析,以及对未来的预测。这一切都是建立在时间这个维度上的大数据成果。

四、小心大数据

(一)数据的隐私和安全。在高校中,学生的成绩,学生的基本信息,学生在网站上发表的信息,对老师客观的评价,学生参与的活动,教师的论文,就业信息等等一些相对可以公开的数据,但是经过分析和预测得到的评估结果,却涉及到了个人隐私。这也就是非隐私数据经过大数据分析得到的隐私结论的现象。那么我们该如何保护这些隐私,是需要相应的规范去保护,对于数据的使用和加工者要有详细的法律责任,以保护非隐私数据提供者的合法权益。

(二)永久存在的数据。高校对于学生在校期间或者对于教师在校期间所有发生的数据,比如大到一次奖学金,一次公开获奖,小到每次活动记录,一次出勤,一次缺勤,这些曾经否定我们进步的数据在大数据的时代变成了永久存在的数据,我们如何对待和处理这部分数据,是一个值得深思的问题。

(三)知“难”而“退”。高校利用大数据的分析得出对于某个学生的学习建议,让该学生能够轻松避开自己的弱项,选择相对平坦的路线进行学习,那么这样的结果是不是教育者希望看到的。我们一直崇尚学生学者要迎难而上,不要轻言放弃,要主动迎接挑战,现在有了大数据分析,他们可以轻松避开困难,为学生创造一条平坦的道路。这样的结果是我们作为教育者希望得到的吗?

结 语

任何新的变革,都需要时代的磨练,大数据时代刚刚起步,他要走的路还很长很长,他需要完善的地方还很多很多。现在我们要做的就是接受大数据,然后忘记大数据,让大数据这个理念变成“计算机”一样的通俗,一样的深入人心。我们需要关注大数据,使用大数据,我们也需要和大数据一起成长,更好的发挥它的作用。高校未来离不开大数据,大数据的发展也离不开高校,让每个学生、每个教师都步入大数据时代,去体会其中的奥妙,去感受他给我们带来一场划时代的变革,每个高校建立大数据信息平台势在必行。

参考文献:

大数据分析论文范文4

关键词 人文社会科学 科学数据使用特征

1 引言

在大数据时代,以科学数据为主要学术资源的数据密集型科学正改变着当前的科学研究模式。人文社会科学领域的研究者已经开始关注科学数据的作用和价值,定量研究也越来越得到重视。在一些数据科学的国际会议上,人文社科的数据管理也成为研究者讨论的重点之一。

各种翔实、可靠的数据为以各种社会对象为研究主体的人文社会科学研究提供支撑,推动了社会调查方法、计量学方法、可视化方法等研究方法的应用和发展。中国管理科学与工程学会理事长李京文院士在2013年管理科学与工程学会年会暨第十一届中国管理科学与工程论坛上指出,必须不断研究大数据的形态变化规律,利用大数据来研究、认识和预测客观世界及人类自身的发展变化趋势。同时,科学数据也影响着传统人文社会科学研究方法的转型与创新。复杂的经济统计模型、大规模的社会调查、丰富的科研数据处理和分析工具等,都为人文社会科学研究的创新提供了条件。科学数据的使用使得人文社会科学的“科学性”显著增强。

虽然科学数据推动了人文社会科学的新发展,但是也有学者认为科学数据并未与人文科学结合起来,比如一些学者在从事人文研究时,常使用“绝大多数”等空泛概念的名词。在数据密集型研究模式的背景下,人文社科领域的研究者对科学数据的使用习惯是怎样的呢?哪些人文社科学科的研究者更擅长利用数据?他们获取数据的来源、处理数据的类型和方法以及数据表现形式如何?研究者是不是由于缺乏对科学数据的使用而增加了“绝大多数”等空泛概念名词的使用呢?

本文围绕以上问题,对《中国社会科学》期刊的全文论文进行内容分析,探讨我国部分人文社会科学学科在科学数据使用上的特征。重点分析研究者获取实证数据的主要来源,所要分析的数据类型,处理数据的常用方法,以及数据分析完成后的表现形式。另外,针对学者提出“绝大多数”等空泛概念的名词在人文社科学科中使用的问题,本文将分析研究者在这些名词使用等方面的习惯。最后,根据人文社科研究者在科学数据使用上的特点,为图书馆提供科学数据服务给出建议。

2研究方法

本文采用文献调查法采集论文资料,用内容分析方法统计论文中所用到的数据、中文数词,分析其中的问题。人文社科数据主要指调查数据、网络公开数据、政府统计数据和指标等,本文研究的数据对象除以上这些外,还包括实验数据、文献数据和图片数据。文中讨论的实证研究数据是指狭义实证研究所需要分析的数据。狭义实证研究是指仅依靠统计分析法的研究。另外,本文把“绝大多数”、“差不多”、“若干”、“大量”、“无数”、“少量”等词语定义为模糊数词。

本文的数据来源是《中国社会科学》的全文论文。《中国社会科学》是综合性社会科学期刊,所刊登的论文代表我国人文社会科学领域最新的学术研究成果,也是我国人文社会科学研究的风向标。选用该期刊的全文进行分析,不仅可以了解我国最高水平人文社科学术成果在科学数据使用上的特点,而且也可以了解人文社科不同学科的学者在科学数据处理上所采用的最新方法。笔者于2014年12月通过CNKI数据库收集该期刊2010年1月至2014年6月的全部期刊论文522篇,剔除其中“编者按”之类的7篇文章后,最终得到全文数据515篇。

3数据分析

3.1 总体概况

笔者对2010年1月到2014年6月的《中国社会科学》进行分析,共有全文数据515篇,把它们按研究内容分成、哲学、社会学、管理学、人口学、政治学、法学、经济学、传播学、语言学、文学、历史学这12个学科。但由于人口学和传播学的样本数都小于5,统计的数据会在一定程度上有所失真,因而本文不统计这两个学科的数据。

首先对论文的引用数据和实证数据进行分析。除去人口学和传播学的论文,在剩余的论文中,仅引用数据而未进一步统计分析的论文168篇,占总数的33%,进行实证研究统计分析的论文113篇,占总数的22%。统计发现(见图1):除了哲学学科的论文没有引用数据外,其余学科的论文都或多或少地引用了数据。而实证数据主要集中在经济学、社会学、管理学等几个学科上,其中社会学和经济学实证研究的比例分别达到67%和73%。这里政治学的数据值得注意,虽然该学科的论文没有实证研究的数据,但引用数据的比例却较高,达到53%,显示了该学科数据使用的特点。

3.2 实证数据情况分析

本节主要对社会学、管理学、法学、经济学、语言学和历史学这六个有实证数据的学科进行分析,分别调查其使用数据的类型、来源、处理方法及其表现形式。这里,语言学和历史学的实证数据由于是小样本(样本数小于5),因而需辩证看待这两个学科的数据。

(1)数据类型

从使用数据的类型上看,这六个学科使用的数据基本上是数值型数据,经济学还使用了部分图片数据(表1)。

(2)数据来源

本文根据数据来源把实证数据分为一手数据和二手数据,其中一手数据是指研究者通过访谈、直接观察、间接观察等方式首次亲自收集并经过加工处理的数据,二手数据是指来源于他人调查和科学实验的数据。本文中,把一手数据分为调查数据、实验数据和文献资料数据;二手数据分为政府公开数据(如全国普查数据、各类统计年鉴)和数据管理机构(如中国社会科学调查中心ISSS等)的数据。

从数据的来源分析,社会学中44%的论文采用的是一手数据,而在经济学中这一比例只有15%,经济学更多的是使用政府公开数据等二手数据(图2)。

在对一、二手数据的进一步分析后,可以看出社会学和法学的一手数据主要来自调查数据,经济学的一手数据主要来自实验数据;对于二手数据的来源,管理学、法学和经济学主要以政府公开数据为主,而社会学稍微偏向于管理机构的数据(表2)。

(3)处理方法

本文把数据处理方法分为初级方法、中级方法和高级方法。初级方法是指平均数、频数、方差、标准差等描述性统计方法;中级方法是指回归分析、参数估计、假设检验、相关分析等统计方法;高级方法则是指模型计算等高等数学方法。

从数据处理方法上看,这六个学科的大部分论文都使用了描述性统计方法之类的初级方法,社会学比较注重对回归分析、相关分析、假设检验等中级方法的运用,而经济学则更擅长运用高等数学方法(图3)。

(4)表现形式

本文把数据的表现形式分为统计表、统计图和特定软件绘制的图形这三类。

从数据的表现形式来看,比较常用的是统计表形式,折线图、柱状图和散点图之类的统计图在管理学、社会学和法学中的应用也比较广泛。除此之外,经济学和语言学还有一些利用特定软件绘制的图形(图4)。

3.3模糊数词使用情况分析

本节分析部分人文社科的论文使用“绝大多数”、“差不多”、“若干”、“大量”、“无数”、“少量”、“很多”和“很少”这八个模糊数词的习惯,以及这些模糊数词在部分人文社科学科论文中的使用情况。

首先统计以上这八个模糊数词在一些人文社科学科论文中使用的比例(图5)。笔者发现社会学、经济学和文学这三个学科使用到以上八个模糊数词的论文比例最高。相对来说,哲学的论文中出现这八个模糊数词的比例稍微小些。

在统计2010年到2014年模糊数词的篇均使用次数后发现,人文社科的学者在模糊数词的使用上趋于稳定,各年篇均使用次数基本在2.0到2.5的区间内,除2012年和2013年的数值波动相对较大外,其余各年篇均使用次数的数值趋于2.3(图6)。

随后统计这八个模糊数词的总使用次数及其篇均使用次数(图7)。笔者发现,“大量”这个词在论文中的总使用次数最多,而且篇均使用次数也最高(达3.14),这说明人文社科的研究者普遍喜欢使用这个词,使用范围也比较广。其次是“很多”这个词,研究者也比较喜欢使用。而“若干”这个词,虽然总使用次数不算很大,但其篇均使用次数却很高,这说明该词的使用范围比较集中。同样的现象也发生在“绝大多数”这个词上。最后讨论一下“差不多”这个词。虽然,先生提出中国人是“差不多先生”,凡事马马虎虎,不求精确,但是这个词在人文社科领域的学术论文中却很少使用,其总使用次数和篇均使用次数都是这八个词中最低的。

这八个模糊数词在部分人社科论文中使用分布情况见表3。表3中“一”表示该词未在该学科中使用,“√”表示该词在该学科中有使用,“”表示该词不但在该学科中使用,而且其使用的频率更高,即每一列的三个“”分别代表使用该词的论文比例最高的前三个学科。从表3可以看出,管理学的论文对模糊数词的使用频率较高,有“差不多”、“若干”、“大量”等六个数词在其学科论文中高频率使用,其次是社会学。相比之下,哲学和语言学的论文对模糊数词的使用频率相对低一点。

4结果讨论

本节依据以上数据分析我国部分人文社会科学学科的学者在科学数据使用上的特点,为图书馆今后开展科学数据服务给出针对性的建议。

4.1人文社科学科对数据的使用主要由研究对象决定

我们知道,社会学和经济学是以社会现象或经济现象为研究对象的学科,是偏向量化的科学。从上一节图1的数据也可以看出,大多数论文(67%的社会学论文和73%的经济学论文)都使用了基于数据的实证研究方法。在这些学科里,研究者尊重数据,把数据当作研究的主要素材,通过调查统计和模型计算使数据和学科发展有效结合在一起,推动了新知识和新规律的发现。而且,这些学科研究者的数据意识也比较强,对数据需求也更为迫切,获取数据和处理数据的能力更强。比如经济学,这个学科的论文有较高的实证数据使用比例,也非常注重政府公开数据等二手数据的获取,二手数据的使用率比其他学科的使用率更高(图2)。这就是由于研究者数据意识强烈,数据需求迫切,从而使他们获取数据的渠道要比其他学科的研究者更广。

相比之下,、哲学和文学这些学科是依靠思维逻辑的研究学科,主要是对传统文献资料的探讨,很少讨论实证或经验现象,因而对实证数据的使用就不是很多,偶尔会引用一些数据,数据来源也只是依靠文献。这些学科的研究方法仍较为传统,主要以文献为主,对数据使用的需求不是很迫切。

科学数据服务作为图书馆的一项创新服务,首先应该明确服务的对象。诸如以上这些人文社科学科,如果图书馆对其全面铺开科学数据服务,那可能效果就并不是很理想,但如果图书馆首先对社会学和经济学的研究者提供科学数据服务,为他们提供数据获取、处理、共享方面的服务,则可能会取得事半功倍的效果。因而,笔者建议,针对人文社科的科学数据管理服务,首先可以把社会学和经济学的研究者作为主要服务对象,把政治学的研究者作为潜在服务对象,在服务得到一定认可后,逐步向其他学科展开。对于主要服务对象,图书馆可以提供常规的检索、收集、存储、分析等数据情报服务和数据技术服务;而对于潜在服务对象,则可先向研究者提供科学数据在该学科中创新应用的情报信息,待研究者对科学数据服务需求提高后,再提供常规数据服务。

4.2人文社科学科对实证数据的处理以初级方法为主

在人文社科类论文的实证研究中,为了让读者了解数据和研究对象的特征,进而更好地了解统计分析结果,研究者根据不同的研究目的和研究对象会选取不同的数据处理方法。人文社科的研究者对数据处理采用的方法以描述性统计等初级方法为主,初级方法在法学、社会学、管理学等学科的实证数据研究中占了较大比例(图3)。

相对而言,一些实证研究比较多的学科在数据处理方法上则更为多样。比如社会学和经济学,这两个学科的研究者除了掌握描述性统计等初级方法外,对回归分析、参数估计、假设检验、相关分析等一些中级方法也运用自如,而经济学的研究者使用高等数学方法进行模型计算的能力更为突出,数据的表现形式也多种多样,除了常用的统计图表外,还有由各种特定软件绘制的图形,这些都显示出他们优异的数据素养。

人文社科研究者在数据处理方法上的使用,一方面由论文的研究目的和对象决定,另一方面也由研究者的数据素养决定。对于前者,可能超出了图书馆的服务范围,但要改善研究者的数据素养,图书馆还是可以有所作为的。笔者建议图书馆为研究者提供有针对性的数据处理方面的开放课程等信息,帮助研究者掌握更多关于数据处理的知识。除此之外,也可为研究者提供本学科在数据应用上创新研究的情报信息,让他们了解本学科最新的数据处理技术,并提供相应的数据分析工具,促进定量研究的深入。同时,图书馆也可以与数学、统计学等院系合作,为研究者提供数据处理方面的专业讲座,一方面增强对研究者数据素养的教育,另一方面也可为研究者跨学科合作提供平台。

4.3模糊数词的使用与研究对象和传统文化有关

模糊数词的使用在人文社科领域比较常见,并且各学科在使用上并没有体现出明显的差异。诸如在社会学和经济学这些数据使用比较广泛的学科里,研究者并没有因为使用了数据而减少对模糊数词的使用,反而模糊数词在这两个学科中的使用要比其他学科更多(图5),而且各年模糊数词的篇均使用次数也较稳定,没有很大波动(图6)。因而,模糊数词的使用并不能说明科学数据没有与人文科学的发展结合起来,这主要还是与研究者的研究对象和受传统文化影响下的用语习惯有关。

比如“大量”这个词,该词使用总量和篇均使用量在这八个模糊数词中都是最高的,说明人文社科的研究者普遍习惯使用该词。然而进一步分析显示,该词在经济学中的使用频率最高。一方面,经济学论文中存在的各种数量关系需要用“大量”这个词来表述,另一方面,由于这个词所代表的数量本身较难考证,再加上力求精确的数据精神缺乏和大概而言的用词习惯,使得研究者摒弃了数据化表达而使用了这些模糊概念的词语。

模糊数词在人文社科领域的使用还是比较广泛的,这与其研究对象有一定联系,有些数量关系难以考证,无法精确量化。除此之外,研究者在传统文化影响下的用词习惯也是模糊数词使用广泛的重要因素之一。笔者建议图书馆在为人文社科学者提供科学数据服务时,要考虑到不同学科研究对象的影响,既要提倡数据文化,又要遵循人文精神。平时要注重收集有学术价值的科学数据,并为研究者提供方便查询的数据平台。与此同时,也可以根据研究者的需求,帮助他们收集和统计相关研究所需要的特定数据,以尽量减少模糊数词的使用。但作为科学数据服务的提供方,图书馆也应尊重原有的人文社科研究方法,使科学数据作为一种补充材料,与现有的人文社科研究结合,相得益彰。

5 结语

大数据分析论文范文5

高校是我国科研创新的重要基地和主力军。我国62%的国际重点实验室、35%国家工程研究中心均设在高校。而科研统计是高校科研的一面镜子,是其科研创新力的有效测度。它通过对高校科研规模、学术水平、增长速度和效益产出等方面的定量测量,反应高校科研工作现状和发展趋势,为高校科研部门制定检验、调整科研方针、政策规划和计划提供依据,[1]是高校科研管理制度化、规范化的基础。

1 高校科研统计工作存在的问题

在当前国家创新的大背景下,国家科技投入不断增加,高校科技活动迅猛发展,对科研统计也提出了更高的要求。因此,在科研统计中也暴露出不少的问题,主要表现在以下几个方面。

1.1 统计人员流动性大

科研统计工作是一项基础性工作,不像项目管理、成果管理那样具有产出性,其成果、绩效额度不宜测量和隐性化容易被忽视[2],导致统计工作人员热情不高;另外,一些科研管理者也对该项工作重视不够,认为只要完成上级单位布置的统计任务即可,对于统计人员没有实施积极的鼓励措施,导致科研统计人员很容易流失。北京2009年调查显示,北京高校共有科研人员137人,其中首次承担科研工作人员达52位,占总人数38%。这反映出科研人员流动性大,队伍不稳定。新接触科研统计人员对学校整体科研工作的了解、统计指标的理解都不如有经验者全面、准确,反映在统计表中的数据逻辑性和合理性差、数据库不全、数据库不能定期维护等,影响数据质量,不能真实反映学校科研工作现状。

1.2 数据收集精准度不高

科研统计工作相当复杂,涉及到科技投入、产出、项目分类、科研支出等上百个具有相关性的指标,如何正确理解这些指标范围和相关性每个统计工作者都是挑战。且在数据采集时涉及个人信息、机构信息、项目信息、经费信息、论文等多方面信息,这些信息在指标设置、分类标准、计算方法等方面有较大差异[3],这给数据统计的准确性和真实性都带来困难。因此,科研统计人员在填表中很多指标仅能凭感觉申报,造成上报统计数据失真,使得报表对决策工作不但无帮助反而带来不利影响。

1.3 科技统计数据分析不足、利用率低

科研统计工作最终目的是为管理者提供可靠依据。因此,仅做好基础数据的收集是不够的,科技统计报表只有通过专业数据分析才能发挥作用,只有专业数据分析结果才能对科研政策的制定和决策起到支撑作用。目前,我国许多高校还没有组织力量进行数据分析建模工作,未对统计结果进行科学统计分析、未建立合理的指标评级体系,没有让数据“说话”。而且,我国科研统计工作自20世纪70年代以来经历了近30年的发展[3],积累了丰富的历史数据,这可以为当前科研管理提供宝贵参考信息。但目前尚未对这些信息进行有效的利用,且在数据保存、使用过程中还存在众多问题。

2 提升科研统计工作效果的对策和建议

2.1 加强科研统计人员培训,搭建交流平台

从补充科研统计人员科研统计知识和加强对科研状况掌握入手,对统计人员加强培训,并为各高校科研统计人员间建立交流平台,促进他们的互相学习和交流。可以采用主题报告会、专项工作答疑会、基础统计知识培训、科研数据库建立和维护培训等,并引导、鼓励统计工作这撰写科研统计相关论文、参加相关项目科研团队[4],通过多种方式提高统计人员专业水准,提高科研统计人员的工作积极性,才能保证数据的采集、处理、分析、审核的精准性。

2.2 提高数据的分析和利用能力

数据的简单存在并不具备价值,只有得出分析结果才能体现其价值。数据分析可以从科研人员论文、专利、专注等信息与其年龄、学历、职称等基本信息相匹配,进行相关性分析,找出成果的产出与年龄、学历、职称等的关系,由此指导教师、科研人员的绩效考核或人才引进;项目相关成果分析可以为项目评估提供借鉴,科技成果的相关分析是科研活动最好的体现,为科研工作者或教师科研绩效评价和评估提供依据;通过对科研经费数据的分析,可以得出经费分布的主要方向、项目类型、年龄及职称分布等特征性信息,为经费配比提供依据;另通过对历年课题分析可以知道新项目的申报等。有条件的高校,可采用大数据技术驱动的数据流程,即通过基础数据的采集后,从主管部门提取拨款等宏观数据,从Web数据库提取成果信息,而后建立数据库,再利用相关性等技术对数据库进行分析,得出结果,提高对数据的分析和利用能力。

大数据分析论文范文6

【关键词】 统计学 教学实践 财经专业

随着大数据时代对于数据分析人才的需求越来越多,如何从海量数据中有效挖掘有用信息并进行数据分析已逐渐引起国内外政府机构及学者的极大关注,国际上关于大数据科学研究的呼声也越来越高。统计学作为一门数据分析学科,主要通过收集整理研究对象的数据,进行建立统计模型、量化分析、总结和预测,探讨研究对象的数量规律及其特征。随着大数据时代的来临,统计学的重要性越来越得到社会的认可和重视,具有统计学基础的人才需求量也越来越大。

由于统计学涉及的理论内容、公式和抽象概念比较多,通常需要一定的数学基础和较强的逻辑推理能力,因此学生普遍认为《统计学》是一门比较难以掌握和学习的课程。结合自己对财经类专业学生讲授《统计学》课程的实际教学实践,在分析目前教学中存在问题的基础上,就如何提高统计学课程的教学效果,探索适合金融工程、工商管理、会计学等财经类专业的教学内容、教学手段和教学方法以及考核办法,如何解决统计学教学存在的问题为社会培养高质量的专业数据分析人才谈一下自己的想法和思考。

一、《统计学》教学中存在的问题

1、教学方法单一

目前,统计学教学仍然是以教师课堂讲授为中心的教学思想、学生被动地接受知识传输的传统填鸭式教学方式。以多媒体教学为主的背景下,虽然多数教师坚持黑板板书与多媒体课件相结合,但是有些教师将多媒体教学完全取代黑板板书,使得课堂教学内容容量过大,讲授速度过快,缺乏师生之间的互动和交流。统计学内容在重点部分常常涉及较多公式和概率统计定理,使用多媒体课件授课使得讲课速度过快,造成学生无法跟上教师思路不能理解具体内容,仅仅会记忆理解,熟练地套用计算公式,无法引起学生的学习兴趣。

2、教学内容只注重应用表面,缺乏理论深度

财经院校《统计学》课程的教学内容仍然是以数据的收集、整理、描述和分析入手,简单介绍统计调查、统计整理、统计指标、时间数列、指数、相关回归、统计推断等内容。对于教学中涉及到的基本数学定理、数学公式推理以及前后知识在数学上的联系缺乏讲解,使学生不能理解到所学知识的本质,仅仅会依葫芦画瓢地应用,导致学生在处理实际问题时方法单一、创新不足。有些财经专业的学生培养方案更是将统计学与概率统计同一学期开设,使得统计学课程的内容缺乏概率统计中的大数定律、中心极限定理等假设检验的基本知识,造成学生无法理解所学内容。

3、教师队伍知识结构不合理

讲授统计学的教师队伍近几年虽然有了很大的变化,但还有一部分统计教师的知识结构不够理想,数学和计算机知识水平与客观要求还存在一定的差距,仍需要继续改进和提高。财经类院校讲授统计学课程的教师主要以经济统计、数量经济学等财经类出身教师为主,缺乏数学专业科班教师,使得课程内容的设计仅注重应用,缺乏相应的数学理论作为支撑,使得学生对所学知识一知半解。

4、统计软件与统计案例缺乏有效结合

随着大数据时代的到来,学会用统计软件处理实际问题的方法和分析能力已成为每个学生必经的阶段,计算机软件在统计学教学中的重要性越来越显著。现实中,虽然统计学的课堂教学中也注重统计方法的应用,但是由于统计学知识繁杂、课时安排普遍过少、开课班级过多等原因,导致统计学教学过程中对于学生的动手能力的训练过少。尤其是财经类非统计专业学生的培养方案中《统计学》课程设计基本以54学时为主,使得课程教学内容仅可完成理论教学,缺乏用SPSS、SAS、R软件等统计软件进行实际问题处理的实践教学。

5、统计分析方法与学生专业知识缺乏有机结合

统计分析方法与学生的专业脱节,教师从概念、公式、定理等方面讲授完统计理论与统计方法后,往往无法从学生的专业角度出发与实际的经济、金融、管理等内容相结合设计统计案例,或者完全缺乏与实际问题相关的统计案例,很难取得较好的教学效果。例如给金融工程专业的学生讲测定离中趋势的指标标准差时,可以结合股票投资的例子说明标准差度量风险的应用,以引起学生的学习兴趣。

二、《统计学》教学改进措施

1、提高教师素质

大数据对统计学的挑战要求统计学教师必须加强专业学习,及时学习和接受新的知识,提高自身专业素质。作为一名统计学教师,课堂教学不仅要给学生传输知识,还要与网络资源相结合,充分发挥多媒体在统计教学中的作用,形象生动地展示统计过程和分析应用,通过实际的统计数据案例分析与学生互动,及时设置统计理论与实际数据分析相关启发性问题,调动学生的学习兴趣和主动学习积极性。同时,各财经院校要针对各自的具体情况采取有效措施,不定期或定期举办统计学授课经验交流会或送青年教师参加国内一流大学举办的课程培训或进修,为教师提高授课技巧创造有利条件,并注意吸收高学历、高学位的统计专业人才充实到统计教师队伍以提高统计学教师的整体素质。

2、改革教学方法和手段,增强学生学习的主动性和积极性

改变传统教学方式,充分利用网络资源充实多媒体教学课堂内容,调动学生主动学习的积极性和主观能动性,提高学生综合运用统计学方法解决实际问题的能力。在教学过程中采取“讲授式教学”、“启发式教学”、“互动式课堂讨论”、“理论与案例结合”等形式多变的授课方法,以达到学生主动融入课堂、主动思考的更好教学效果。虽然各种教学方法都有不同的特点,但是授课过程中要根据学生的专业特点适当调整教学内容,并根据教学内容的性质和特点选择合适的教学方法或多种教学方法进行优化组合,使学生能够较容易地融入课堂,以快速掌握课堂知识取得较好的教学效果。

虽然多媒体教学具有内容丰富、所含内容信息量大的特点,可以图文并举形象生动地展示课堂内容,已经成为主流教学手段,但是仅用多媒体教学,忽视黑板板书教学,会使得课堂内容含量过大而导致学生的思维跟不上教学进度,特别是统计学课程内容涉及较多数学公式推导和定理证明,不用板书进行严密的推导,不利于学生理解和掌握。因此,在教学过程中应将传统板书教学和多媒体教学相结合,充分利用这两种不同教学方法的优势,达到更好教学效果的目的。

3、积极引进数学专业教师,优化教师知识结构

财经类院校要积极引进数学专业出身教师担任统计学教师,讲授内容上对所涉及的数学理论进行适当的推理证明、补充最新统计方法并适当深入讲解理论在实际应用时的重要性,将理论与实际应用相结合,培养财经院校非统计专业学生的逻辑思维和理论与实践结合的能力,让学生在未来工作中遇到处理实际问题时能够具有较强的理论基础应用于实践,并为实现数据处理方法创新、理论创新和知识创新打下较好的基础。

4、将理论教学与实践相结合,加强软件应用实践教学

财经类院校开设统计学课程的目的是为学生更好地学习专业理论知识提供数量分析的理论与方法,为学生运用统计学的理论与方法分析、研究其专业实际问题提供方法论基础。而统计学正是以经济、金融、社会等实际现象的数量方面为研究对象,通过统计软件直观处理和分析实际问题的方法,因而教学过程中要与学生所学专业相结合,选择SPSS、SAS或R软件进行案例教学,培养学生熟练应用统计软件进行数据分析的能力,为学生将来独立处理大数据问题打下坚实的实践基础。

5、改革传统考核方式

《统计学》是一门侧重实际应用的方法论课程,传统的考核方法主要以闭卷笔试为主,考核内容主要是统计基本理论和方法,通过期末闭卷考试并不能客观准确地评价学生对这门课的掌握程度和实际应用能力,当学生遇到具体的实践问题时往往不知如何处理。因此,有必要对统计学课程考核方式进行改革。可以将学生的期末总成绩从传统的闭卷考试方式改成由平时成绩20%、软件实践30%和笔试成绩50%三部分构成。笔试考核内容突出实用性和工具性,可设置开放试题,重在考核理解而不是死记硬背定理或公式,考查学生综合利用统计知识和方法分析和解决实际问题的能力,使学生不仅学到统计学知识,又能灵活地运用于实际问题。

三、结语

随着大数据时代的到来,社会对具有扎实统计基础的数据分析人才需求越来越多,《统计学》作为数据分析方面重要的基础工具课程,对于财经类学生的专业课学习和毕业论文设计及将来从事金融、管理、经济等行业数据分析相关专业工作十分重要。因此,要提高统计学课程的教学效果和教学质量,任课教师不仅要努力钻研统计基础知识,探索新的统计授课方法,提高自己的综合素质,同时也要勇于探索适合不同专业特色的教学内容,编写符合新时代特征的新的教学案例和多元化的教学手段,在教学活动中不断实践探索,切实加强理论教学与实践教学相结合,改革已有考核方式,提高教学效果和质量。

(基金项目:吉林省教育厅“十二五”社会科学研究基金项目(2015348)。)

【参考文献】

[1] 游传新:高校统计学教学存在的问题与改革思路[J].长江大学学报(社会科学版),2008(5).

[2] 冯蕊、王国辉:高职财经类非统计专业统计学教学中的问题与思考[J].科技和产业,2010(6).