统计学大数据分析范例6篇

前言:中文期刊网精心挑选了统计学大数据分析范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

统计学大数据分析

统计学大数据分析范文1

关键词:听障大学生; 教学评价; 统计分析

【中图分类号】G762

学生教学评价,即学生作为评价主体对教师的教学质量进行评价。其主要目的是为教师的教学提供有用的反馈,以促进教师提高教学质量,从而为提高学生的学习效果服务 [1、2]。听障大学生,作为特殊的学生群体,日常教学应赋予更多的关心和爱心。对听障大学生教学评价数据的研究,可以促进从事特殊教育的老师改善教学方法,调整教学态度,进一步提高特殊高等教育的课堂教学质量显得格外重要。

数据数理统计分析是数学的一个分支,是指研究如何有效地收集和使用带有随机性影响的数据。通过数据的数理统计分析,可以进行数据的整理和问题的推断[3]。现代数理统计分析的一个显著特点就是运用计算机实现有关的统计计算与分析,目前也有许多应用计算机软件对于教学质量进行分析讨论的报道。本文利用SPSS软件(Statistical Product and Service Solutions)对听障大学生教学评价数据进行统计分析,以更好的发挥评价的诊断、激励和导向的作用。

一、数据分析来源

本文数据来源于某大学某学期听障大学生教学评价数据,共涉及25门课程。教学评价分为十项指标,分别为“tm1”:仪表端庄,教态自然,精神饱满;“tm2”:上课准时、足时,认真负责,严格要求学生;“tm3”:关怀和尊重学生,有固定的辅导和答疑时间师生关系融洽;“tm4”:教学目标、要求、考核形式明确,推荐有助我们学习的参考文献;“tm5”:授课内容充实,信息量大,重难点突出,进度安排适当;“tm6”:作业有利于我们掌握知识和自主学习,批改和分析认真;“tm7”:思路清晰,阐述准确,语言规范生动;“tm8”:因材施教,注重学生创新意识和能力培养;“tm9”:教学方法灵活,教学手段恰当,注重互动,课堂气氛活跃;“tm10”:掌握了本课程的核心内容,激发了学生学习兴趣,提高了分析问题、解决问题的能力。

二、分析方法

本文主要使用了SPSS软件中的描述性统计分析(Descriptive Statistics,得到原始数据转化成标准化的取值,可以直观了解数据的情况,同时便于进一步分析);K-S单样本检验分析(Kolomogorov- Simirnov One-sample Test,主要考察数据是否符合正态分布);主成分分析(Principal Component Analysis,将多个变量通过线性变换以选出较少个数重要变量);K中心聚类分析(K-means cluster analysis,将数据进行分类,辨别样本之间的亲疏关系);单因素方差分析(one-way ANOVA,调查按某个研究因素的不同水平分组后该因素的效应)。

三、结果与分析

(一)学生教学评价整体情况及正态分布分析

分析教学评价整体情况可以了解听障大学生课堂教学质量的总体情况。从表1可以看出,该学期听障大学生教学评价总分范围在81.48-99.82之间,平均成绩为89.69±3.62。利用SPSS软件进行正态分布分析,得到表2及图1。从表2得到单样本K-S检验Z统计值为0.500,渐近显著性水平为0.964,远大于0.05,因此教学评价结果符合正态分布。

(二)学生教学评价指标主成份分析

利用SPSS进行学生教学评价指标主成份分析后,得到表3。主成份分析法只提取到1个成分,且变量系数均接近1,因此可以认定本体系10项指标相互独立,影响较小。

(三)不同课程学生教学评价聚类分析

通过SPSS软件K中心聚类分析方法,将25门课程进行聚类分析,得到表4、表5。从表4可以看出,通过聚类分析,通过学生教学评价成绩将25门课程分为了2类,1类优秀成绩为15门课程,2类良好成绩为10门课程。表5则表示每门课程所属聚类。

(四)学生教学评价指标的聚类分析

通过SPSS软件K中心聚类分析方法,将学生教学评价十项指表每门课程的得分进行聚类分析,得到表6、表7。通过聚类分析,将评价指标分为了2类,指标1、2、3被归为类别1,可以看出主要是指教师的教学态度;指标4-10被归为类别2,主要考查教师的教学业务水平。

(五)不同学科类别科目学生教学评价差异性分析

根据课程不同性质,将参与评价的25门课程分为了学生思政(两课)类、文科(外语、语言等)类、理科(数学、物理等)类。

利用SPSS进行单因素方差分析。文科类课程与理科类课程学生教学评价成绩有显著性差异,且文科类课程得分要高于理科类课程。原因可能由于理科类课程需要大量逻辑思维能力,听障大学生可能在这方面有所欠缺,因此课堂教学效果不如文科类课程。此外,学生思政类课程与文科、理科类课程均没有显著性差异,其得分介于两者之间。

(六) 不同职称教师授课学生教学评价差异性分析

根据授课教师职称不同,将参与评价的25门课程分为了教授授课、副教授授课及讲师授课三类。

利用SPSS进行单因素方差分析。教授授课类学生教学评价得分与副教授、讲师授课类直接均存在着显著性差异,且总分均值要高于其他两类。可见,教授因为在知识、授课经验上的累积,其教学效果要好于副教授及讲师。副教授及讲师教学评价得分则无显著性差异。

四、结语

本文通过计算机软件等辅助手段,将原本多而无规律的教学评价数据进行了分析处理,获得了许多有价值的信息,这些都有利于教育管理进行优化管理,更好的做出决策,为强化教学管理、提高教学质量打下基础。本文只是在听障大学生教学评价过程中,利用计算机辅助手段进行分析的初步探索。教学评价是一项非常复杂的质量监控的过程,如何进一步利用计算机软件等为教学质量提供支持,有待我们继续研究。

参考文献

[1] 鲁进勇,夏建刚. 本科教学质量评价的文献综述[J].学问・科教探索,2008,18:24-25.

统计学大数据分析范文2

关键词:大数据 统计专业 核心

中图分类号:G632 文献标识码:A 文章编号:1674-2117(2014)10-0008-02

1 大数据的统计涵义

通常来说,凡是数据量超过一定大小,导致常规软件无法在一个可接受的时间范围内完成对其进行抓取、管理和处理工作的数据即可称为大数据。业界通常用4个V(即Volume、Variety、Value、Velocity)来概括大数据的特征:数据体量巨大、数据类型繁多、价值密度低、处理速度快。

大数据潮流让我们获得了海量的数据,数据已经成为相关行业创造价值的重要资源。因此,许多IT企业和互联网企业都已将业务范围延伸至大数据产业,探索大数据驱动的业务模式。2012年,美国政府投资2亿美元启动的“大数据研究和发展计划”,更是将大数据的研究上升到国家战略层面。然而,大数据的真正意义不在于数据量的巨大,而在于对数据信息进行专业化的处理,核心是对数据进行分析。面对大数据,越来越多的领域都开始运用数学特别是统计学的工具,挖掘大数据中真正蕴藏的价值。正如西内启在《看穿一切数字的统计学》书中所指出的,“从数据中得出有意义的结果,关键在于控制和减少误差,得出因果关系,单纯收集数据并加以全部量化分析在很多情况下会得出谬误结果,”而科学的统计学方法是得出因果关系的最佳方法。

从统计学角度看,一方面,大数据具有类型繁多、结构复杂、体量巨大等特点,海量数据以分布式方式进行存储,特别是图片、音频、视频等非结构化数据的广泛存在,传统的统计方法和统计分析工具已无法满足大数据分析的需要,亟需统计方法的革新。另一方面,数据分析结果需要用生动、直观、容易被接受的方式展示给读者,可视化分析能够直观地呈现大数据的特点,阐释数据与数据之间的联系。因此,统计学要挺立大数据潮头,创新统计分析工具、可视化分析方法,以大数据的挖掘和应用为核心,将传统文本、图像的统计、分析向数据分析转变,以适应大数据时代的发展及其对统计学带来的挑战。

2 大数据时代统计学教育面临的挑战与应对

据互联网数据中心(Internet Data Center)预测,中国大数据技术与服务市场将会从2011年的7760万美元快速增长到2016年的6.16亿美元,而据业界专家估算,中国大数据市场的人才需求量至少为100万人,其中统计人才、技术更是捉襟见肘。传统数据收集和分析技术的知识结构已不能满足大数据时代对“数据科学家”的要求,多家企业在面对大数据发展时遭遇人才瓶颈。大数据相关人才供给不足将会成为影响大数据市场发展的一个重要因素。

当前,全世界范围内已有数百个高校开设了大数据分析专业。卡内基梅隆大学和新泽西州立大学在培养目标和课程设置上项目设置偏重于计算机方向。课程设置偏重统计学与运筹学(包括决策科学)的典型学校有田纳西大学和约克大学。2013年,北京航空航天大学与慧科教育合作开办了国内首个“大数据技术与应用”软件工程硕士项目研究生班,这是目前国内唯一一个培养大数据行业专业型人才的项目,但其培养目标、知识体系是面向计算机领域,而立足统计学基础的大数据分析人才培养项目,在国内可谓是凤毛麟角。

知者随事而制。高等院校统计学专业要通过有效利用和整合人才培养资源,承担大学人才培养的责任,驾驭大数据的浪潮,占领大数据发展人才培养的制高点,体现高等院校向社会、企业提供智力支撑,输送企业亟需的复合型、实用性大数据分析人才的载体作用,确保产业科学、持续、高速的发展。一是教育资源的整合,走在前列的首都经济贸易大学、北京大学、中国人民大学、中国科学院大学、中央财经大学五所应用统计专业硕士培养单位在北京成立了“中国大数据教育协同创新体”,在高校之间实现学科融合、优势互补、强强联合,通过共享优质资源平台、共同建立课程体系、共同建设案例资源库、联合搭建实践实训平台等多种形式,创新人才培养体制机制。二是高等院校教育资源与业界资源的整合,通过与国有超大型企业、互联网翘楚的协同培养,立足应用统计专业硕士教育,建立人才培养基地,进行协同创新,探索构建应用统计(大数据分析)专业硕士人才协同培养模式。以缓解当前大数据人才供需矛盾为目的,建立“校校协同、校企协同、院系协同”的大数据分析方向人才协同培养模式,最终实现协同培养“数据科学家”的目标。[5]

3 面向大数据分析方向的应用统计专业硕士培养模式的构建

本研究认为,可以将大数据分析及相关的案例教学模式融入应用统计专业硕士学位研究生的培养过程,进而打破统计学传统的以阐述统计理论、公式推导、数学计算为主的教学模式。以情境浸润为基础,为学生呈现统计学在大数据领域应用为核心的教学模式,可以培养学生对大数据的挖掘、整合、分析价值的能力,以期更好、更快地适应企业对数据分析师、数据科学家的需求。

3.1 科学构建课程体系,突出大数据分析特点

大数据具有强烈的行业特点,在充分借鉴国外大学成功经验的基础上,大数据分析专业硕士的课程设置,强化数据分析能力和数据挖掘能力,注重上述技术在金融等领域的应用。必修课在讲授统计基础理论(描述、多元、时序、空间、可视化等)课程的基础上,为增强学生的大规模分布式计算技能,引入主流的大数据计算平台,如Hadoop分布式平台、MapReduce并行编程算法。与此同时,为提高学生动手能力,构建数据模型思维,开设《大数据分析案例》等多门课程。选修课方面,考虑到学生二次开发的需要,设置大数据开发基础课程,如C++、Java等。为突出应用统计专业硕士侧重应用的特点,开设面向数据的编程语言,如R、SAS、Python等课程。这些课程模块的设置并非体现某一学科知识的纵深发展,而是将相关学科的知识融合,有利于突出大数据分析的特点。

3.2 创新教学培养模式,注重培用结合

以“编组”方式开展教学活动。授课教师和学生均采用团队编组模式,多名教师协同工作,共同完成一门课程的授课任务。打破原有学科思维、教材的束缚。采用导师指导与集体培养相结合的方式。教师不可照搬旧有的教学大纲、课程内容,要学习和熟悉大数据相关知识体系与技术新进展,充分结合大数据分析需求和实际案例,使课程内容紧贴实际需求,注重培养学生对模型的理解,对数据的想象力,真正实现学以致用、培用结合。

采取“订制化”培养模式,突出培养与应用相结合的特点,力争做到人、岗的高度匹配。“订制化”培养模式打破了目前应用统计专业硕士统一培养、与市场需求脱节的模式壁垒,教学实践以市场需求为导向,依照企业的岗位标准、用人要求,强调以岗位需求制定培养方案,更好地满足用人单位对大数据分析人才的需求。

3.3 开展校企协同培养,构建问题导向、项目牵引的实践教学模式

根据国务院学位委员会的规定,应用统计学专业硕士学位研究生教育的目的是培养具有良好的统计学背景,系统掌握数据采集、处理、分析和开发的知识与技能,具备熟练应用计算机处理和分析数据的能力,能够并适应行业或职业实际工作需要的应用型高层次人才。因此,要摒弃普遍存在的重理论轻实践、重知识轻技能的教学方式。

协同创新培养在实践教学中建立了以问题为导向,以项目为牵引的运作机制,强调实践教学内容的呈现方式要面向企业需求,让学生参与到企业的项目运行过程中,引导学生建立业务建模能力,培养学生的数据资源整合能力,激发学生参与项目的积极性和自觉性。学生不拘泥于学校的实验实训基地和各类实验室,在第二学年中安排一定时间走出校门,进入到企业的实际环境中,参与企业的项目组织、实施过程,在实践过程中提升自我认知能力,在实践过程应用知识和理论研究实际问题的能力,培养和锻炼数据资源整合能力、沟通协调能力、IT支撑能力、业务建模能力,真正实现面向能力培养的目的。指导教师方面,在案例教学和实习阶段引进业务素质高、项目经验丰富、对大数据发展有敏锐洞察力的企业高级数据分析人员,指导学生在实习实践中提出问题、建立模型、解决问题的能力。

4 结语

应用统计(大数据分析)专业硕士人才协同培养模式,是一项可持续发展的应用统计专业硕士人才培养的新模式,是专业硕士教学实践的创新举措,也是在全国率先建立起来的立足统计学,在大数据分析人才层面建立的校校协同、校企系统办学体。体现了面向能力培养、面向社会需求培养、面向人才价值培养的“三个面向”的培养目标,着重培养学生分析数据、处理数据、展示数据的能力,对于培养“高层次、实用性、复合型、国际化”大数据分析人才意义重大,同时也是顺应大数据技术革命的浪潮,必将对大数据等新兴技术产业的发展注入活力。

(首都经济贸易大学,北京 100070)

参考文献:

[1]刘军.Hodoop大数据处理[M].人民邮电出版社,2013.

[2]大数据的四个典型特征[N].中国电子报、电子信息产业网,2012(12).

[3]CCF大数据专家委员会.2014年大数据发展趋势预测[J].中国计算机学会通讯,2014(1):32-36.

统计学大数据分析范文3

关键词:大数据;统计学;发展

由于科学技术的不断发展,大数据席卷了全球,各行各业在经营管理中都离不开大数据的统计与分析,对于政府单位来说,大数据更如经常便饭,大数据主要利用多样式和多层次的采集方式进行数据采集,在分析数据时利用现代科学技术手段和高速处理数据的信息系统,分析的数据结果为公司或者政府单位的决策做参照。大数据的发展给统计学不仅带来了机遇,更重要的还有挑战。一方面信息技术和网络科技的发展为数据收集和整理带来了便利,另一方面由于近几年电子商务的迅速崛起,数据量更加的繁杂,所以又给数据统计时带来了麻烦,种类不断增多的大数据资源,正在成为政府统计部门分析研究的重要领域。

一、大数据与统计学的区别

我们就大数据自身而言,要想在信息化迅猛发展、数字爆炸式增长的现代信息平台中寻找到自己想要的有效数据,就必须依靠数据统计来完成。这就充分证明了关于大数据的相关研究是要和统计学紧密的联系在一起的。但是其与统计学也存在巨大的差别,它的使用模式和运用方式是不一样的。统计学需要依靠样本抽样的方法来进行数据整体和提炼的,这就意味着会有人力、物力以及财力的投入,其成本相对于大数据来说是比较高的而且过程是相对比较繁琐的。而大数据主要依靠网络信息平台,在海量的电子数据信息中查找自己所需要的数据,具有来源广、数据量大、整体性的特点,其是以整体的数据作为一个大样本进行工作的,数据相对于统计学来说更加的精确化及标准化。因此,统计学和大数据的结合过程中,要充分发挥大数据全面性和统计学高效性的特点,在利用统计学进行大数据样本的统计过程中要对整体的数据资源进行选择和筛选,这样能避免样本统计的弊端,还可以把样本统计的优势发挥到极致。

二、大数据时代下统计学教育的发展

(一)培养全方面素质人才

统计学专业的学生与文管专业的还不一样,文学专业的以及管理专业的学生都比较善于交际,善于沟通,而统计学是理科专业,很多学生只善于埋头做题计算,这样的话在以后的工作岗位就会感觉吃力,因为做数据统计,必须要与其他部门学会沟通,协同工作这样才能把数据统计和分析的准确。要锻炼自己的交际能力和沟通能力,针对不同数据信息做出不同的沟通与交流,从数据中挖出有价值的信息,需要本身具有数据敏感性,但是对数据的敏感程度也不是先天所带来的,更不是一朝一夕就能锻炼出来的,而是要经过时间的积累和数据分析工作的磨练,同时也可以根据案例型的数据分析材料,积累阅历,提升对数据资源的敏感程度。

(二)培养统计学专业的应用型人才

大数据时代下培养的统计学应用型人才应该具有两方面的基本素质,第一是概念性的,也就是说统计学的相关人才应该掌握统计学基本理论知识和基本素养,这是基本要求,也是培养统计学人才的前提。第二就是实践性,也就是本文中我们提及的统计学专业的应用型人才,就是在实际操作中处理数据分析数据的能力,应用型人才需要利用理论知识解决实际问题,也需要有较多的经验与阅历,不能只会纸上谈兵。在高校开展大数据分析学科中,最大的问题就是没有真是可用的案例和数据,这就需要学校与公司企业走合作道路,这样一来不仅可以得到真实有效的数据,还能将学生送到企业去实习,进行校企联合,注重学生的实际操作能力,这是培养统计学专业应用型人才的关键点,也是统计学专业人才培养模式中的重点。

(三)促进统计学与信息计算科学的融合

在大数据的分析与研究时,仅仅凭借统计学科的支撑是不够的,大数据的数据结构性特征已经抛弃了传统意义上的数据分析模式的非智能化框架,而且数据分析需要利用新型的数据运算方式以及计算机技能分析,这也是进行数据分析的问题所在,因此要想做好数据统计和数据分析工作,只单单依靠单一的统计学科知识的人学习是远远不够的,其需要的是数学,信息技术,统计学三门学科的融合发展,紧密结合三门学科之间的交叉发展,融会贯通,利用各科优势资源相互弥补不足,这样才能为大数据的收集,统计,分析做出科学准确的结果。

三、结语

学习统计学的优势在于:我们可以利用统计学进行大数据的有效整合和利用,使得我们在使用数据时可以更加的便利和高效。随着信息科学技术的进一步发展,来自各方面的数据出现井喷的状态,这就增添了我们在数据统计和信息处理时的困难。在现在这个信息化数据爆炸式增长的形势下,我们要充分全面的利用各方面的数据资源才能充分发挥统计学的优势,做好预测和分析,同时充分将统计学的优点与完备的大数据资源实现有效的整合,让统计变得通俗易懂。

参考文献:

统计学大数据分析范文4

(池州学院数学系安徽池州247100)

摘要:随着我国社会的不断进步和科学技术的迅猛发展,数理统计也处于一种不断完善和发展的过程中,在当前众多领域得到了普遍的应用。因此,如何加大数理统计在大数据分析中的应用,保障统计工作高效的进行,是当前迫切需要解决的问题。本文研究探讨信息时代背景下数理统计在大数据分析中的应用,首先从数理统计的研究内容分析出发,然后对数理统计的特点进行了简要的阐述。最后对信息时代背景下数理统计在大数据分析中的具体应用进行了深入的分析。希望为今后数理统计在大数据分析中发挥出更大的应用作用,奠定一个具有参考价值的文献基础。

关键词:信息时代;数理统计;大数据分析;应用研究

在进行科学研究的过程中,经常会遇到描述两个及以上的随机变量、描述随机变量的分布特征、离散性质或变量大小等等相似的问题,如果不借助于数理统计,就不可能有效的解决这些问题。数理统计这一数学工具的出现,在我国社会的不断进步和科学技术的迅猛发展的过程中处于一种不断完善和发展的状态之中,在当前众多领域得到了普遍的应用。众多学者开始考虑如何更加有效的应用数理统计方法去解决具体的数据分析问题,这成为了数据分析过程中非常关键的部分,也是当前针对数理统计研究最多的一类问题。

一、数理统计的研究内容分析

数理统计的研究内容,主要包括数理统计在数据分析及数据处理中的基本定义、概念,以数据分析中数理统计的广泛应用为重点。此外,对数理统计的相关理论进行深化,总结数理统计及实践操作的特点等等也是当前关于数理统计研究的重要方面。同时,如何有效的将数理统计应用于企事业单位当中以及数理统计对企事业范围统计工作的价值也是一个重要的方面。

二、数理统计的特点

数理统计的特点主要是基于数据分析而言的,具体表现为通过参考数据资料,将对应的数学模型应用到随机现象中,借助于有价值的数据,实现数据应用于数学模型的检验,从而对数据背后主体的规律、性质以及特点等等内容进行反馈。另外,数据分析以及数理统计二者之间有着非常大的关联,不仅仅是一个简单的、固定形态的统计来的一一对应关系。因此,由于数据分析的需要而逐渐演化出来的数理统计方法,实现了数据主体到数据分析、数据分析到数据主体的循环路径,为最大程度的发挥出数据价值奠定了一个非常重要的基础条件[4]。

三、信息时代背景下数理统计在大数据分析中的具体应用

数理统计对于大数据的处理主要可以通过数理统计方法实现。在当前,每一个学科对于数据的处理都有自己对应的数据分析方法,而数理统计方法就是众多学科中交叉的方法,对研究社会活动的各个领域和不同学科之间的研究有着非常大的帮助[5]。因此,数理统计在数据分析中占据的重要的地位。随着其不断的发展,也慢慢形成了数理统计理论,并有效的应用于数据分析。通过大数定律,数理统计与数据分析之间产生了相互依赖的关系,总体的相对数及平均数等等相关性指标在数据分析中都可以发挥作用,同时也是建立在大量观察的基础之上实现的。

数理统计在数据分析的过程中发挥重要作用的同时,也会对数据分析产生一定的影响,主要体现在以下几个方面。一是数理统计会对数据的总体分布形态、方差分析以及正交设计、相关分析等等产生显著的影响,可能是正向的回归效应,也可能是负面的偏离效应[6]。二是数理统计还可以通过其模型的构建去修正,对数据分析的均值以及方差等等统计学变量产生不同程度的影响。

四、结语

作为一项重要的工作,统计工作必须要依靠数理统计的方法和模式,才能够充分发挥出应用价值。数理统计这一工具的出现,成为了解决数据分析中常见问题的有效手段。在我国社会的不断进步和科学技术的迅猛发展,数理统计也处于一种不断完善和发展的过程中,在当前众多领域得到了普遍的应用。因此,如何加大数理统计在大数据分析中的应用,保障统计工作高效的进行,是当前迫切需要解决的问题。本文研究探讨信息时代背景下数理统计在大数据分析中的应用,首先从数理统计的研究内容分析出发,然后对数理统计的特点进行了简要的阐述。最后对信息时代背景下数理统计在大数据分析中的具体应用进行了深入的分析。希望为今后数理统计在大数据分析中发挥出更大的应用作用,奠定一个具有参考价值的文献基础。

参考文献:

[1]胥洪燕,陈梦雨.数理统计在数据分析中的应用研究[J].现代商业,2014,05:126.

[2]陈建桦.用数理统计的方法对检测中出现可疑数据的处理[J].家电科技,2008,01:62-64.

[3]颜钟得.磨损试验数据的数理统计处理方法[J].理化检验(物理分册),1995,01:45-46.

[4]颜钟得,谢致薇.静态磨损试验数据的数理统计分析[J].广东工业大学学报,2007,01:50-52.

统计学大数据分析范文5

关键词:大数据时代;大数据;统计学;数据分析

引言:

目前阶段,在计算机处理技术不断发展的背景下,在对规模较大并且较为复杂的数据进行处理过程中,人们已经逐渐掌握了方法与技能,并且能够在大规模的数据中找出具有一定价值的信息,所以,大数据时代已经来临。在数据时代中,在人文社科与人类自然科学技术等方面都会有较大的发展,同时也会一定程度上改变人们的生活与工作方式。除此之外,大数据时代也同样为统计学提供了良好的发展机会,但也存在一定的挑战。

一、大数据时代的概念

大数据时代的提出者是麦肯锡,他认为数据已经逐渐进入到各个行业与各业务职能的领域中,并且逐渐成为了主要的生产因素[1]。因此,人们在对大规模数据进行挖掘与应用的过程,也就意味着新的生产率增长的来临。虽然“大数据”在众多行业被广泛应用,但是,特别是在信息与互联网的领域中应用突出。

二、怎样理解大数据

(一)大数据概念界定与构成

大数据,即由于日常产生的数据量快速增长,使得数据库无法利用相应的管理工具对其进行管理与收集,最终导致在进行搜索、分析、存取、共享数据时具有较大的困难。

大数据的构成包括四部分,并将其总结为4V,即Volume,Variety,Value,Velocity[2]。第一部分是价值密度低,将视频作为具体实例来说,实现连续并且不间断的监控,其中有价值的数据信息只有一两秒。第二部分是数据体量极大,已经从TB实现了PB的跃升。第三部分是数据类型众多,主要包括视频、图片、网络日志以及地理信息等。第四部分是处理的速度超快,可以用一秒定律来解释。

(二)海量数据带来哪些挑战

第一,数据存储。由于大数据的数据规模是PB级别,所以,存储的系统也需要进行等级的拓展,并且可以通过磁盘柜或者是增加模块实现容量的增加。然而,目前阶段,数据的增长速度惊人,所以系统资源的消耗也不断增加,导致系统的运行效率有所下降[3]。因为对海量数据始终停留在分布式的存储阶段,所以,对于爆炸式的数据增长,原有的存储方案已经无法满足现有的数据变化需求。

第二,处理技术。由于海量数据的分布性与数据量与以往存在较大的差异,所以,原有的数据管理技术已经处于落后状态。

第三,数据安全。在互联网规模逐渐扩大的情况下,数据的应用已经出现指数级别的增长,所以,对于数据安全的保护与监控来说具有一定的难度。

(三)大数据相关应用与实践

第一,体育赛事应用。以2014年的世界杯为例,在充分发挥记者与编辑敏锐度的基础上,腾讯也利用对大数据的分析以及云计算等方式来为为其提供移动与社交的数据。与此同时,腾讯与IBM进行合作,并通过文化、赛事与球迷三方面来对世界杯球迷的关注重点进行信息的挖掘,进而实现新栏目的创作,并且在短时间内赢得了广大球迷的认可与关注。

第二,产品推荐应用。产品推荐的应用比较广泛,可以对客户信息、交易历史、购买过程等数据进行全面的分析,并进行有价值信息的挖掘。同时,针对同一产品的不同客户访问信息也可以进行挖掘。最终,通过对客户行为的分析,来确定消费者的共,这样就可以更好的为客户推荐产品。

除此之外,在产品推荐中,可以在对客户社交行为进行信息挖掘与分析的基础上来进行社区的营销。对客户微信微博以及社区活动中的偏好数据进行分析,并为其提供符合客户兴趣爱好的产品。

图一

三、如何分析大数据

(一)如何挖掘数据中价值

以匹配广告为具体事例进行分析,主要有两种数据。第一种是广告库,其中包括广告库以及广告的客户信息[4]。但是这种数据信息比较适合在传统数据库中应用。第二种是用户在观看广告后的行为。可以把以上两种数据进行有效的结合,并通过相应的算法来体现价值。在实践应用过程中,可以充分体会到第二种信息的重要作用。可以为用户提供其所需的信息,并通过群体智能以及群体行为对之前用户使用的效果进行分析,最终通过具体的反馈机制,将最优质的信息提供给用户,还可以进行搜索或者是查询信息。

(二)如何做处理与分析

第一,更新抽样调查的工作理念。由于大数据时代的数据样本是以往资料综合,所以,可以对相关事务的数据信息进行分析,进一步对总体进行了解,还可以更好的了解局部。同时需要解决以下问题:抽样框架不稳定,调查目的设定不合理、样本量受限[5]。第二,积极改变对于数据精确度的标准。在大数据时代的背景下,数据的来源比较广泛,并且对数据进行处理的技术也有所提高,所以,可以允许数据存在不准确的情况。大数据时代需要吸收多种数据,但并需要一味的要求数据精准。第三,合理转变数据关系的分析重点。由于大数据时代的数据规模比较大,而且结构也十分复杂,变量的关系也比较繁杂。所以,在对数据进行分析的过程中,不应该对因果关系进行仔细的分析,而重要的是对事物相关的关系进行分析。需要转换思路,对事物关系的形式与目的进行详细的分析。

四、 大数据对统计学科和统计研究工作的影响

(一) 拓展统计学研究领域

因为大数据时代的到来,所以会对各个领域产生一定的影响,同样给统计学带来影响。在统计学中,其主要的研究对象就是其所要认识的客体,是客观存在事物自身的数量特征与关系。其中,统计学研究对象最主要的特点就是数量性。然而,在传统的统计学当中,数据主要是试验与调查的数值。在大数据时代中,统计研究的对象不仅包括以结构数据度量的数量,此外,还可以包括一些无法用数量关系进行衡量的半结构与非结构数据,其中可以包括动画、图片、声音、文本等等[6]。所以,可以说,在大数据时代背景下,统计学的研究对象领域有所扩大。

(二) 对统计计算规范产生影响

在传统的统计学当中,一般是使用方差、平均数以及相对数等数据计算规范来真实反映事物量特征的,同时还可以反映事物量的关系与界限,能够通过数据计算规范来计算出具体的数值。但是,半结构与非结构的数据是无法通过传统数据计算规范进行计算的[7]。所以,在大数据时代的背景下,传统的数据计算规范也同样遇到了难题。

(三) 对统计研究工作的过程产生影响

1. 数据整理和分析

第一,数据审核。原有的数据审核主要的目的就是对数据准确性和完整性进行严格的检查。但是,在大数据的时代中,对数据的审核就必须要确保数据处理的速度以及预测的准确程度,同时还需要对数处理的规模进行准确的确定,也就是数据量级别的确定。除此之外,因为大数据自身具有不稳定性,并且十分混乱。但是,即使是这样,大数据也能够挖掘出信息内部存在的隐蔽关系以及有价值的知识。所以,大数据所反映的研究对象存在准确与不准确两种,但是,任何一种的数据都具有一定的价值,通常情况下是不需要进行替换或者是删除的[8]。

第二,数据存储。在以往的数据存储中,审核、汇总以及编制的图表等资料是重点资料,并且需要进行保存起来的。然而,大数据保存最主要的目的就是对存储的成本进行有效的控制,同时需要根据相应的法规计划来确定数据存储的规模。

2. 数据积累、开发与应用

第一,数据积累。传统统计工作主要是根据所制定的研究目的来对数据进行汇总与分类,并进行保存,这样可以更好的为后期数据的分析与查询提供有利的条件。但是,在大数据的积累中,具有价值的信息需要对大数据进行处理后才可以发现。不容置疑,大数据具有一定的复杂性,所以,在积累的过程中,不可以进行简单的处理。因为大数据的规模大,结构也比较复杂,无法实现简单的分类,而且,在对大数据进行简单整理时非常容易使其混乱,对其真实性产生影响,可能会丢失具有价值的信息。

第二,数据开发。大数据时代下的数据流动性极强,所以,其自身的价值有再生性。因此,大数据时代的数据不会贬值,反而会增值。为了能够对所研究的对象进行更深入的了解,就需要对其整合。

第三,数据应用。对数据的传统应用主要是为了对现象进行解释与预测。但是,在大数据时代,数据应用的核心就是在相关关系前提下的预测。

结语

综上所述,现阶段我国社会正处于大数据时代,并且对于社会未来的发展具有重要的意义。文章对大数据时代的概念与定义以及构成进行了阐述与分析,同时,对大数据的实际应用与实践进行了探讨。针对大数据价值的挖掘与分析处理进行了研究,最后列举了大数据对统计学科以及统计研究工作的影响,进而对今后大数据的数据分析工作提供了有价值的理论依据,并积极的推动了大数据时代的发展,进一步促进了社会的进步。(作者单位:中国人民大学)

参考文献:

[1]朱建平,章贵军,刘晓葳等.大数据时代下数据分析理念的辨析[J].统计研究,2014,31(2):10-19.

[2]张学敏.大数据时代的数据分析[J].电子世界,2014(16):5-5,6.

[3]李祥歌,王奇奇,郭轶博等.基于大数据时代的数据挖掘及分析[J].电子制作,2015(3):81-81.

[4]刘江娜.大数据时代:为什么数据分析能让你的企业脱颖而出[J].环球市场信息导报,2014(36):92-93.

[5]郭华庚,向礼花.大数据时代网络信息归档的元数据分析[J].贵州师范学院学报,2015,31(3):24-28.

[6]高书国.大数据时代的数据困惑――教育研究的数据困境[J].教育科学研究,2015(1):24-30.

统计学大数据分析范文6

关键词:财务分析;大数据;教学改革

作者简介:王晖(1973-),女,黑龙江鸡西人,北京信息科技大学经济管理学院,讲师;段文军(1969-),女,山东蓬莱人,北京信息科技大学经济管理学院,副教授。(北京 100192)

基金项目:本文系北京信息科技大学教学提高-专业建设项目(项目编号:5028023501)的研究成果。

中图分类号:G642.0 文献标识码:A 文章编号:1007-0079(2013)25-0111-02

当今时代不断涌现各种新型信息方式,例如博客、社交网络等;不断兴起各种新技术,例如云计算、物联网等。数据的产生不受任何的限制,数据以前所未有的速度不断增长和累积,大数据时代已经来到。[1]《华尔街日报》认为大数据时代是引领未来繁荣的三大技术变革之一。麦肯锡公司在一份报告中提出数据是一种生产资料。企业每天面对海量的财务数据,如超市的销售记录、银行的交易记录、淘宝网站数千万笔交易记录(产生量超过50TB,存储量40PB①)。企业如能利用这些巨大的数据集挖掘出有价值的信息,那么企业就能掌控下一个创新、竞争和生产力提高的关键。大数据时代,尤其是财务大数据时代,呼唤创新型人才。[2]呼唤具备综合财务分析能力的人才,利用财务大数据为企业创造财富。

如何培养财务分析人才?在财经类高校本科,一般都开设“财务分析”课程,该课程教学目的是培养学生对真实企业进行综合财务分析,并能独立撰写财务分析报告的能力。[3]本文以北京信息科技大学(以下简称“我校”)为例,探讨大数据时代下财务分析人才的需求特点,对高校“财务分析”课程设置的影响,并提出改进“财务分析”课程教学的建议。

一、大数据时代下财务分析人才需求特点

相较于其他类型数据,财务数据更大、更复杂,蕴藏着更多宝贵信息。麦肯锡公司2011年报告推测,利用大数据分析,零售商可增加运营利润60%,制造业设备装配成本会减少50%。[2]在财务大数据环境下,如何整理与统计这些杂乱无章的数据?如何让财务数据开口说话为企业管理者经营决策提供科学依据?朱东华(2013)认为,大数据时代下,传统的数据分析方法已经不再适应当前的数据环境,同时,各种企业对数据的依赖与日俱增,甚至定量分析方法将逐步取代定性分析方法。[4]财务大数据和大量的财务数据分析需求助长了企业对统计和数学背景的人才需求。

可见,大数据时代下财务分析人才应该具备扎实的统计学和数学功底,能够熟练运用定量分析方法分析数据以获取信息,撰写分析报告为企业相关利益人决策提供依据。

二、“财务分析”课程教学现状

张先治(2007)认为,财务分析是财务分析主体为实现财务分析目标,以财务信息及其他相关信息为基础,运用财务分析技术,对分析对象的财务活动的可靠性和有效性进行分析,为经营决策、管理控制及监督管理提供依据的一门具有独立性、边缘性、综合性的经济应用学科。[5]财务分析课程是为我校经济管理学院财务管理专业本科三年级开设的一门专业必修课。学生前期已经学过数学、经济学、会计学、财务管理、统计学等课程。财务分析课程正是在学生掌握前期所学各门课程的基础上,培养学生综合运用所学专业知识,分析判断企业的财务状况,并根据数据分析结果找出企业存在的问题,提出解决方案。[6]为了更好地实现“财务分析”课程教学目的,课程组的老师们经过讨论,决定修改2008级财务管理专业教学计划,将原来课堂教学的方式改为1/2的学时用于课堂教授基本理论,1/2学时用于实践教学。笔者自2011年开始,按照新的教学计划给三届学生讲授了“财务分析”课程。

1.理论教学部分

教材选用东北财经大学出版社出版,张先治和陈友邦主编的《财务分析》(第五版)。该教材体系完整,内容丰富,全书以一家虚拟的ZTE公司为例,演示财务报告分析、财务效率分析和财务综合分析。每章设有案例和复习思考题,该书还有配套的习题集。在课堂教学中,以教材为主线,突出介绍各种财务分析方法的使用,以及根据分析结果得出结论,提出解决方案。

2.实践教学部分

一人一企,边学边分析。每位学生选择一家上市公司作为分析对象,利用学校购买的金融数据库以及相应网络资源,结合所学财务分析理论知识进行上机实验,在Excel内完成数据分析,并将分析结果形成财务分析报告。学生分析判断和决策能力在实战中得以锻炼,教学效果得到改善。

但是,随着大数据时代的来临,外部环境对数据分析能力要求的提升,仅仅学会利用Excel进行水平分析、垂直分析、趋势分析、比率分析和因素分析,已经远远不能满足市场对财务分析人才的需求,学生就业的竞争力无从谈起。结合前面大数据时代下财务分析人才需求特点,我校学生财务分析能力的培养存在着以下问题:

1.学生数据收集、整理和分析能力弱

定量分析方法应用的基础是数据,财务分析人员必须学会从海量的网络资源中搜集并筛选与自己的分析对象和分析目的相关性较强的资料信息,[7]这些资料信息可能是结构化数据,例如金融数据库等;也可能是非结构化数据,例如网页等。从实践教学环节反映出学生数据收集和整理能力弱,分析其原因主要是:

(1)学生不熟悉对财务分析有帮助的网络资源。搜集有价值的数据需要一定的技巧,其中最为重要的是熟悉一些重要的网站,知道相应的数据应该在哪里找到的概率比较大,做到有的放矢。

(2)学生无法将非结构数据快速地转换成所需的数据形式。类似金融数据库这样的结构数据,学生基本能够筛选出所需信息。但是,对于类似网页这样的非结构数据,他们就只能运用最原始的复制粘贴的方法提炼数据信息,耗时且耗力。2013年2月1日,人保财险执行副总裁王和在中国第七届“保险业管理信息化高峰论坛”上指出,在过去的两三年里,结构和非结构数据发生了本质性的逆转。过去就整个社会来讲,绝大多数的数据是结构数据,而现在非结构数据正呈快速增长的趋势,现在以及未来,非结构数据将占到95%,甚至更多。

“财务分析”课程讲授的基本方法主要是比率分析和因素分析法等。目前,无论是学术界还是业界,研究人员大量使用统计模型进行财务数据分析,例如聚类分析、多元回归、因子分析、时间序列预测法等。因而,我校学生数据分析能力急需加强,尤其是统计学和数学的基础要扎实。

2.学生财务分析报告撰写水平有待提高

财务分析的结果是以财务分析报告的形式展示给企业利益相关人,为其进行财务预测、财务决策、财务控制和财务评价等提供可靠信息。财务分析报告是对企业经营状况、资金运作的综合概括和高度反映。李宝智(2012)认为,报告应具备八要素:准确、完整、可比、用户导向、相关、问题的解决方案、及时和易用。[8]从我校学生提交的财务分析报告看,与上述要求还有很大差距。

三、“财务分析”课程教学改革建议

1.培训网络资源使用

重点介绍几个数据库的使用:

(1)金融数据库。我校购买了两款金融数据库,北京聚源锐思数据科技有限公司金融数据库(http://)和深圳市国泰安信息技术有限公司CSMAR财经系列研究数据库(http://)。登陆金融数据库后,输入查询条件即可下载上市公司财务数据,速度快且数据量大,数据格式可以任意选择。

(2)中国资讯行(国际)有限公司高校财经数据库(http://),INFOBANK于1995年在香港成立,是一家专门收集、处理及传播中国商业、经济信息的香港高科技企业,信息范围涵盖19个领域、197个行业。

(3)国务院发展研究中心信息网(国研网)(http://.cn)。国研网已建成了内容丰富、检索便捷、功能齐全的大型经济信息数据库集群,包括:六十几个文献类数据库、四十多个统计类数据库等。

网站资源:中国证券监督管理委员会(http://)、上海证券交易所(http://.cn)、深圳证券交易所网站(http://)、巨潮资讯网(http://.cn)和相关协会网站等。

2.培养数据预处理和建模能力

收集到数据之后,需要对数据进行预处理,利用统计学的理论和方法将数据转换成一个分析模型。[9]学生在统计学、计量经济学课程中,已经完成基本模型理论、SPSS或者Eviews三分析软件的学习。但是,若想实现对大数据的整理和分析,应该掌握R或者Matlab统计分析软件,同时,还要掌握一种编程语言,例如C++、JAVA、C#等。利用编程语言调用统计分析软件,从而实现大数据的分析。另外,建议学生了解Perl语言编程,该语言擅长处理非结构数据。

3.培养文献阅读及财务分析报告撰写能力

数据分析之后,需要撰写财务分析报告,为各方利益相关者的决策提供依据。不同财务分析的目的,形成的财务分析报告具体要求会有所差异,但是撰写财务分析报告的基本步骤相同。首先查阅文献,阅读相关学术文章、财务分析师分析报告、评级机构报告等;其次,模仿写作,组织财务分析结果,形成报告。此中没有捷径,需多看、多写。

注释:

①1TB 等于1000GB,1PB 等于1000TB。

参考文献:

[1]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,(1).

[2]邬贺铨.大数据时代的机遇与挑战[J].求是,2013,(4).

[3]张肖飞.财经类高校《财务分析》课程案例教学改革研究[J].商业会计,2013,(1).

[4]朱东华,张嶷,汪雪锋,等.大数据环境下技术创新管理方法研究[J].科学学与科学技术管理,2013,(4).

[5]张先治.财务分析理论发展与定位研究[J].财经问题研究,

2007,(4).

[6]陈卫军,徐文学,陈平.基于上市公司网上资源的《财务分析》实训教学探讨[J].财会通讯,2012,(2).

[7]王桢.网络环境下财务分析案例教学方法的改进[J].中国教育信息化,2012,(1).