前言:中文期刊网精心挑选了大数据技术论文范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
大数据技术论文范文1
一般认为,大数据是由数量巨大、结构复杂、类型众多的数据构成的数据集合,是基于云计算、通过数据整合共享、交叉复用形成的智力资源和知识服务能力。通常认为它具有下述“四V”特征:
1.1数量大(Volume)。大数据的数据量级已发展至PB(1000T)、EB(100万个T)乃至ZB(10亿个T),可称为海量、巨量乃至超量。
1.2速度快(Velocity)。大数据往往表现为高速实时数据流,时效性非常高。因此对处理工具的要求很苛刻,软件工程、人工智能、机器学习等都应引入。这是区别于传统数据最显著的特征。
1.3多样化(Variety)。数据种类繁多,形式多样。包括各种信息及其网页、图片、音频、视频、图像与位置等存在方式。
1.4价值高(Value)。大数据数量越庞大,价值越高,真实性、可靠性越强。但同时无效信息也越多,需要通过强大的机器算法对数据迅速地“去粗取精”,否则也只能望洋兴叹。
2大数据对科技咨询业发展的影响
2.1拓展业务空间大数据信息对应的是高速实时数据流。这些数据流往往能产生难以想象的作用,其能量也将被层层放大,还有可能在另一个看起来毫不相关的领域得到应用。大数据环境下的科技咨询就将具有全球性、战略性意义,业务范围和服务空间都将得到迅速拓展。科技咨询各相关要素,如科技资源、科技人才、创新需求、创新环境、创新成果等的疆界,将受到大数据浪潮的冲击。同时,落后地区和难以涉猎领域的业务也将在其带动下快速提升。
2.2规范咨询决策大数据将改变科技咨询决策方式,使其进入“数据驱动型”决策模式。因为面对大数据的潜在价值,决策者不仅要使用新的技术,还要改变目前的决策过程,政府也将更有效率、更加开放、更加负责。因为引导政府决策的是基于实证的事实,而不是意识形态,也不是利益集团在政府决策过程中施加的影响。
3大数据环境下科技咨询业发展道路
从上面的分析不难看出,大数据将给科技咨询业带来无限的生机和活力。科技咨询业应抢抓机遇,跨越发展,走规模化、信息化、科学化、现代化的可持续发展道路。
3.1挖掘大数据,促进规模化发展我国科技咨询业规模较小,究其原因,一是咨询市场还没有完全放开,市场主导地位没有显现,资本缺乏信心。二是科技咨询价值没有得到广泛认同,潜在需求得不到释放。三是现有机构没有形成专业分工和自主品牌,无法带来规模效应。然而,在大数据时代,最重要的生产资料———数据将自由地流动起来,推动知识经济和网络经济的发展,传统经济体制机制对科技咨询业的束缚将大大减轻,“得数据者得天下”将成为共识,市场将发挥主导作用,吸引大量资本进入,促使机构快速升级。同时,随着竞争的加剧,咨询质量、咨询价值必将得到提高和认同,潜在的需求必将迸发。
3.2利用大数据,加快信息化进程目前我国科技咨询信息化建设大致经历了计算机初步应用、管理信息系统应用和互联网技术应用三个阶段。随着时代的发展,大数据将掀起新一轮信息化革命。科技咨询业必须充分利用大数据技术,在政府引导下,进一步完善信息化工程,建立基于大数据的科技咨询信息平台,实现在虚拟空间中不同信息资源的快速整合与对接,提高咨询要素使用效率和运行主体工作效率。
3.3凭借大数据,提高科学化水平大数据的客观实在性和真实可靠性并存。对大数据进行深度挖掘,可以提高科技咨询科学化水平。首先,基于大数据,科技咨询信息的真实性有了更大的保障。其次,依据大数据特征,可帮助制定更为科学的咨询战略、方案和计划,同时降低过时咨询、无效咨询的风险。再次,基于大数据,科技咨询具有更强的针对性。咨询师可以深度分析、挖掘最高管理者的知识结构、创业经历、行为习惯等信息,准确把握其管理理念。最后,通过对大数据的分析、挖掘与利用,可最大程度地减少因数据不全而带来的负面作用。
3.4依托大数据,实现现代化转型随着时代的发展,传统的咨询工具、内容、形式、速度、效率等越来越不能满足现代社会发展的需求。依托大数据,可以实现科技咨询向现代化转型。首先,大数据环境促使科技咨询必须运用现代化咨询工具。如,大数据的超大量级迫切要求科技咨询设备现代化、信息数字化。其次,大数据促使科技咨询内容、形式现代化。现代社会工作、生活节奏很快,简洁实用、形式新颖是对科技咨询工作的新要求。形式多样的大数据正好为科技咨询提供了便利。再次,快速、高效是现代化的重要特征,而高速实时的大数据则要求科技咨询处理工具快速演进、高效运行。最后,大数据的基本特征决定了科技咨询必须进行全方位的改革创新,紧跟现代化发展步伐。大、多、真、快、稍纵即逝的大数据要求科技咨询必须借助移动互联、云计算、软件工程、人工智能、机器学习等手段,优化资源配置,建立高智能科技咨询协作平台,向科技咨询现代化迈进。
4总结
大数据技术论文范文2
关键词:FAS466处理器合成孔径雷达高速数据记录SCSI接口标准
合成孔径雷达(SAR)经历了从光学记录成像到数字记录成像,从低分辨率到高分辨率,从单通道、单极化到多通道、多极化,从单频到多频的发展过程。SAR系统的迅速发展,使SAR的数据量也急剧增多,普通的存储器已经无法满足SAR系统对大容量、高速数据存储的要求。
常规的数据记录器的设计思路是通过高速PCI接口,采用SCSI总线处理器将高速数字信号存入SCSI硬盘。其缺点是数据传输的速率受PCI带宽的限制,而且PCI接口对微机系统的依赖性,使系统的模块化设计变得非常困难。另外,SAR对数据记录器的可靠性和工作环境的要求也非常高,使SAR数据记录器不能按照常规的方法设计。笔者通过对SAR系统的研究,基于模块化设计的思想,开发了一种基于FAS466的高速实时数据记录器。其特点是采用高速DMA接口、可脱离微机平台工作、体积小、可靠性高,实际持续存储速度达到72MB/s。
图1
1SCSI总线和硬盘
SCSI是美国ANSI9.2委员会定义的计算机和外设之间的接口标准。本系统采用SCSI硬盘,因为5CSI接口比常见的IDE接口具有更多优点:(1)SCSI提供了一个高速传输通道,传输速度更快;(2)SCSI接口采用总线主控数据传输(BusMasterDataTransfer),占用CPU资源少;(3)可同时串接多台不同类型的设备;(4)SCSI硬盘在标识硬盘扇区时使用了线性的概念,即硬盘只有顺序的第1扇区、第2扇区…第n扇区,不像IDE硬盘的"柱面/磁头/扇区"三维格式。这种线性编排方式访问延时最小,可加快硬盘存取速率,尤其在持续大容量控据存储时,所显现的优势更为明显。
2系统的硬件结构设计
整个系统的设计总体框图如图1所示,包括高速数据源、高速差分接收器、DMA控制器、数据缓存器、DSP微处理器、SCSI协议控制器和高速SCSI硬盘等子系统;下面分别给出各子系统的设计(PADBUS表示控制信号线,DATABUS表示数据信号线)。
2.1高速数据源和高速差分线性接收器
系统的高速数据源接口为16位的并行接口,数据传输接口的所有信号均采用低电压差分模式LVDS传输,信号进入记录器之后要将LVDS电平转换成TTL电平。
2.2数据缓存器
数据缓存的目的是为SCSI的高速DMA传输做好准备,使两边数据传输速度匹配。数据的流向一般是一个口进,一个口出,不对信号进行任何处理。双口随机存储器RAM虽然也可完成这个任务,但是由于它需要复杂的地址译码电路,所以不采用,而采用FIFO。由于SAR系统每帧数据小于8KB,本系统选用的FIFO深度为8KB。
2.3SCSI协议控制器--FAS466
FAS466(FastArchitectureSCSIProcessor)处理器是Qlogic公司1999年上市的一种高性能SCSI引擎,它源于Qlogic公司的TEC450/452三重嵌入式控制铝系列,可提供Ultra2SCSI的同步传输速率,支持先进的SCSl自动配置模式的1层和2层协议,内部嵌有微控制器,能够通过编程方式灵活地协调SCSI作业队列,可以工作在启动或目标模式并支持单端或低电压差分模式的SCSI连接。
FAS466区别于其它SCSI协议控制器的最大特点是它采用微处理器和DMA接口结构,而常见的SCSI协议控制器采用PCI接口总线结构。这是本设计采用FAS466的一个主要原因。采用微处理器和DMA接口结构,可以通过DSP对传输进行控制,脱离微机平台,减少传输带宽限制,使数据记录器具有非常好的灵活性和可移植性。FAS466由SCSI控制器、微控制器、DMA接口和微处理器接口四个模块组成。外部微处理器通过微处理器接口对FAS466进行控制,SCSI控制器提供灵活、有效的底层SCSI协议控制,微控制器负责控制数据从DMA接口到SCSI硬盘的传输以及各个模块之间的协调。图2为FAS466的内部结构。
2.4OMA控制器
本设计采用DMA接口代替高速数据存储中常见的PCI接口。这不但使传输数据的速率有了比较明显的提高,而且使数据记录器可以脱离微机系统,使模块化设计成为现实。
本设计采用CPLD器件实现DMA控制器,而不采用专用的DMA控制器,主要考虑以下一些因素:本设计的数据传输速率达到72Mg/s,一般的专用DMA控制器难以胜任;专用的DMA控制器与FAS466之间的连接需要大量的逻辑转换电路和连线,使设计难度加大;DMA控制器还需要在DSP的控制下与FAS466进行协调才能一起工作,这增加了软件编程的难度;使用CPLD器件,除了完成DMA控制器的功能之外,还可以把电路中的译码、逻辑转换、系统复位等模块设计进去,减小了设备的体积,方便了以后对系统的升级和改进。
图3
2.5DSP微处理器
该高速数据记录器选用TI公司的TMS320F206作为微处理器。主要考虑TMS320F206片内包含32K×l6字的FLASHEEPROM,使DSP周围电路简单、设备的体积减小,而且系统升级也比较方便;指令集非常丰富,与TMS320C5X系列指令兼容;TMS320F206的指令周期为50ns,符合系统对DSP速度的要求。
DSP负责对各个模块进行协调和控制,实现高速数据记录的功能。需要注意的是:FAS466的微处理器接口数据/地址总线是复用的,而TMS320F206的数据/地址总线是分开的,需要外部逻辑将数据和信号总线整合。高速数据通过信号源接口进入本系统,首先进行电平转换,然后进入数据缓存器;在DMA控制器的控制下进入SCSI协议控制器;最后通过SCSI协议控制器存入高速SCSI硬盘。整个数据流程中,DSP微处理器负责各个子系统之间的协调和控制。由于采用分离的微处理器总线和DMA总线结构,因此达到了较高的记录速度。
3系统的软件设计
软件模块的设计是本系统设计的重点和难点,它负责对相关硬件控制和协调,最终实现SCSI协议、硬盘的控制和DMA传输等。本系统中,软件设计分为DSP控制软件和DMA控制器的CPLD实现两部分。程序的优劣关系到整个系统数据存储的速度,下面分别讨论。
3.1DSP控制软件
一般来说.要完成一次数据交换必须完成SCSI总线的仲裁、选择、消息、命令、数据和状态等阶段。这些阶段,微处理器TMS320F206通过对FAS466寄存器的读写控制完成实现。FAS466的寄存器主要有:
(1)命令寄存器(CommandRegister):F206通过向命令寄存器写入相应指令,控制FAS466完成初始化、复位、总线分配与复位以及SCSI总线各个阶段的转变等功能;(2)FIFO寄存器(FIFORegister):这是一个16字深的FIFO寄存器,SCSI硬盘和FAS466之间的数据交换都通过这个FIFO完成;(3)传输计数寄存器(TransferCountRegister):是一个减法计数器,用于保存一次DMA数据传输的字节数;(4)中断寄存器(InterruptRegistet):F206通过FAS466中断寄存器了解SCSI命令的执行情况,从而决定程序的执行流向。
SCSI控制软件流程如图3所示。首先初始化SCSI控制器,然后SCSI控制器与SCSI硬盘建立同步传输协议,在硬盘准备好的情况下才可以发送各种SCSI命令,如读、写等,同时处理好各种意外情况的发生。
3.2DMA控制器的CPLD实现设计
大数据技术论文范文3
管理会计信息系统与会计核算系统有着很大不同。会计核算系统按照实际操作中对企业会计核算流程的要求安排设计,操作固定、内容全面。只需要按照经济业务内容和会计相关法律要求操作即可。而管理会计信息系统更为复杂。他没有一成不变的决策处理程序,相反在决策过程中需要运用大量的技术分析方法,对比多项数据信息才能得到所需的结果。系统庞大、操作复杂,一但结果失误有可能对企业的发展带来毁灭性打击。因而该系统的建立对数据处理能力有着极高的要求。大数据时代的到来,它所提供的数据量、数据结构和数据处理方式正好贴合了管理会计信息系统的需要。它将企业决策中需要的财务因素与非财务因素结合起来,为企业管理提供可靠的数据支撑。
二、管理会计信息系统在企业中的作用
管理会计信息系统是会计信息系统的一个组成部分。长久以来企业在会计信息化的道路上一味的重视会计核算的信息化,忽视了管理会计的信息化,使得管理会计的各项职能没有在企业发挥出来。随着企业规模发展壮大,经济环境纷繁复杂,管理会计越来越受到高层管理人员的重视。在企业中使用管理会计相关分析方法,建立管理会计的信息化系统可以为企业价值提升起到事半功倍的效果。1.为企业发展提供全面数据信息当前经济形势风云变幻,纷繁复杂,稍有不慎就可能对企业发展带来巨大打击。及时、准确的信息对企业决策至关重要,而建立管理会计信息系统可以对企业提供有效帮助。管理会计信息系统是以海量数据为基础,运用分析技术优势,结合管理需要,经营业务和会计要求,灵活运用管理会计的工具方法,为企业经营的各个方面提供服务。通过该系统的建立,搜集经营过程中的结构性数据和非结构性数据,利用专业分析技术,深度挖掘数据内含的信息,向决策者提供使用。2.对生产各环节进行精细化管理该系统的建立,可以通过存货系统、成本计算系统、质量管理系统、价值链分析系统连接企业供应、生产、销售的各环节。其核心流程涉及成本收入要素处理、成本中心分析与处理、作业类型计划与处理、内部订单处理、销售与利润计划、成本核算与结算、成本与作业分配、一般管理费用核算、获利性分析、全面预算与绩效考核等方面。主要的业务对象包括成本要素、作业类型、收入要素、内部定单、控制文档、成本对象、成本核算估计、获利性分析维度、业务计划与预算表以及绩效考核等。通过对各环节的严格把控,降低库存、减少成本,提高利润。3.促进企业完成战略实施目标管理会计信息系统中绩效评价的部分针对企业员工的完成水平进行评价,是该系统的重要组成部分。平衡积分卡绩效评价体系是最近几年流行在国内外的企业绩效评价体系。它分四个方面进行:企业财务业绩、客户关系、内部业务流程以及学习和成长,对企业进行评价。在系统中将企业的战略实施目标按照这四个部分细化成不同的财务或者非财务指标,对照不同的部门逐级细化,进行考核。该绩效评价系统将企业战略与员工考核挂钩,既可以推动战略目标的完成又可以激励员工成长。
三、在企业中建立管理信息系统的途径
大数据技术论文范文4
关于移动通信论文参考文献:
[1]谢显忠等,基于TDD的第四代移动通信技术[M].电子工业出版社,2005.
[2]解梅,移动通信技术及发展[J].电子科技大学学报,2003,02.
[3]宋文涛、罗汉文,移动通信[M].上海交通大学出版社,1996.
[4]何林娜,数字移动通信技术[M].机械工业出版社,2004.
[5]吕昌春,李林园.移动互联网产业链平台竞争与电信运营商增值业务发展策略研究[J].邮电设计技术,2012(11):16-20.
[6]张洁.影响中国移动通信产业发展竞争力的因素分析[J].经济视角(下),2011(01):52-53.
关于移动通信论文参考文献:
[1]张洁.影响中国移动通信产业发展竞争力的因素分析[J].经济视角(下),2011(01):52-53.
[2]吕昌春,李林园.移动互联网产业链平台竞争与电信运营商增值业务发展策略研究[J].邮电设计技术,2012(11):16-20.
[3]刘文婷.以运营商为主导的移动互联网业务商业模式研究[J].中国工业经济,2012(08):66-74.
[4]冯文高.我国移动通信产业的竞争均衡分析[J].现代经济信息.2009(16)
[5]张洁.影响中国移动通信产业发展竞争力的因素分析[J].经济视角(下).2011(01)
[6]马云泽.我国移动通信产业的市场结构与规制改革[J].经济问题.2009(01)
[7]张平王卫东陶小峰《WCDMA移动通信系统》人民邮电出版社
[8]詹炳根,《工程建设监理》,中国建设工业出版社,1997
[9]谢坚勋浅谈工程监理与项目管理接轨建设监理2004(2)
关于移动通信论文参考文献:
[1]赵刚.大数据:技术与应用实践指南[M].北京:电子工业出版社,2013.
[2]漆晨犧.电信企业大数据分析、应用及管理发展策略[J].电信科学,2013(3):12-16.
[3]刘洁,王哲.基于大数据的电信运营商业务精确运营平台的构建化[J].电信科学,2015,29(3):22-26.
[4]张俊.移动通信网络中大数据处理的关键技术研究[J].电信网技术,2014(4):10-12.
[5]康波,刘胜强.基于大数据分析的互联网业务用户体验管理[J].电信科学,2013,29(3):32-35.
[6]谢华.大数据在移动通信中的应用探讨[J].科技创业家,2014(1).
[7]夏磊.探巧大数据下的智能数据分析技术[J].科技创新导报,2014(10):21.
[8]侯优优,隋化严.网络优化中的大数据应用[J].互联网天地,2014(l):34-37.
[9]刘震,付俊辉,赵楠.基于移动通信数据的用户移动轨迹预测方法[J].计算机应用与软件,2015,30(2):10-13.
大数据技术论文范文5
经数据研究表明,海量数据主要是通过云计算技术进行处理,该技术当前在当代文学研究中得到广泛应用,比如中国知网,论文标题中包含有“大数据”字眼的数据明显增加,2013年以前,数据变化并不十分明显,在2013到2016年之间,论文数量高达10000篇,增长明显。国务院对社会发展中大数据的应用予以重视,并坚持认为,在现代化发展中,大数据技术已经成为必然的选择。大数据技术不仅给社会经济发展带来影响,同时也带动了人文社会科学的研究,国外许多发达国家早已利用大数据技术进行文学研究,例如通过统计数据来对文学图标进行绘制,从而揭示出文学秘密[2]。当前,中国许多学者也纷纷展开利用大数据技术来进行当代文学的研究,主要是通过两个方面展开:第一,探讨在大数据时代背景下当代文学的研究方法,在对文学作品进行阅读和阐述时,人脑和电脑之间的合作性和交融性。第二,在大数据时代下各学科之间的研究关系分析。在2005年,《文学遗产》中指出,“在文学研究领域中应该借鉴社会学中先进的数据统计方法,比如开设统计学、电子信息等课程,在路径研究、知识结构方法的设计中弥补学科欠缺之处[3]。计算机真正在社会普及之前,早已有相关文学研究者在对《红楼梦》研究中通过大数据进行分析,对于《红楼梦》小说前八十章与后四十章节的内容是否为同一人所写提出有价值的问题,并通过数据加以论证,说明数据分析方法早在古代文学领域中进行了研究。而与此同时,利用大数据技术对语言学、文艺学及网络文学等领域的学术研究已经成为术界的热门话题。经过对中国知网的检索发现,在大数据背景下关于中国当代文学研究和发展的论文数量仍然较少,从文章内容上来看,大部分仅对中国当代文学研究和大数据之间的一般问题进行讨论,缺乏深入的研究。在中国当代文学研究中,研究方法和研究思维一直都具有创新性和先进性,学者们将西方新思想和理论在文学史研究中加以应用,但在大数据时代下,给当代文学的研究带来了新的机遇和挑战。
2大数据背景下中国当代文学的发展
2.1中国当代文学的数字化
大数据时代背景下,首要的是建立数据库,目前我国在文学领域中的数据库建设方面仍然较为落后,目前常用的数据库包括中国知网、上海图书馆等,这些大型数据库中所包含的专业与学科较为广泛,对于古代文学专题研究数据较多,如《全唐诗》《四库全书》等,但对与当代文学学科专业研究很少,因此对于当代文学数据库的建设是必然的,也是必要的[4]。从当前已经建设的数据库来说,仅仅是完成了从纸质图书向图像转变的过程,可以根据关键词搜索,但无法对全文进行检索,仅仅完成了数字化的转变。在谷歌服务器中,将文本数字化扫描,并存储到高分辨率的图像文件中,使纸质图书内容转变成数字文本,但这些数字文本并不能通过关键词搜索查找,也就不能直接进行分析,只能通过人为阅读的方式才能对信息进行转化。随着大数据技术的进一步发展,谷歌浏览器通过采用光学字符识别软件,即可以对数字图像进行在线识别,从而完成对数字图像文件的数据化转变。但就目前而言,当前中国许多数据库仍然停留在数字化发展时期,并没有深入地完成向数据化转变的过程,进而对中国当代文学的研究带来了深远的影响[5]。
2.2大数据时代背景环境下中国当代文学新的发展路径
在传统数据下,主要是通过局部或是抽样数据的方式来研究人文、社会及自然科学,凭借以往的经验或是理论方法进行假想和推测,难以获得实证数据,同时存在一定的滞后性[6]。大数据时代下,在文学研究领域中主要是通过对字频或词频进行统计,通过搜索关键词进行检索和研究。例如在当代文学研究中,通过检索“反封建”“新思想”“启蒙运动”等关键词,利用数据统计这些关键词的使用频率,从而分析出我国文学观念演变的过程。例如在2013年,在研究文学和历史之间的发展问题中,通过检索“资产阶级”“影响”等字词的出现和使用频率,利用大数据进行统计分析,从而体现出资产阶级文学的更替和变迁。这种研究方式是一种复杂的文学史研究问题,即不仅是通过统计思想关键词,另外还可以统计诗歌意象,或是文学意象等,分析出文学史实变化情况。“大数据+文学”是一种以别样姿态发展的过程,人们在对当代文学中更应该看到文学本质属性,以及在文学作品中所蕴含的文学精神,并以更丰富的思想面貌呈现出来,从精英化向大众化意识形象进行转变,给当代文学的生存和发展模式带来多样化的影响。例如在互联网时代下,互联网技术给人们的政治、文化与生活等都带来了巨大的变化,知识分子从社会中心地位逐渐走向社会发展边缘,给当代文学的创作方式也带来了冲击,逐渐向商业化、娱乐化等方向发展,如何能够被消费者和市场所接受成为作家首要考虑的问题,呈现出严重商业化倾向[7]。其次,大数据技术和互联网技术打破了空间和时间限制,网络文学点击量明显增长,网络文学作品的数量也随之增加,和传统文学作品相比较而言,虽然网络文学带来了新的突破,实现了创作自由化,文学创作空间得到拓展,文学承载方式不再是通过文字来进行描写,也不仅是通过单一的流通渠道,网络数据已经成为文学领域在运营中的重要环节,说明大数据作为一种新兴力量,逐渐从文学外延向中心扩展,产生新的文学形态。而大数据背景的发展加快了网络信息的传播速度,目前网络信息已经构成文学领域的重要维度,不再只是文学的一种传播渠道,而成为当代文学活动中的重要组成。有学者认为,我国的当代文化已经逐渐从印刷文化改为视觉文化,海量的网络数据在文化领域中以一种新的文学形态出现,大数据已经渗透当代文学的内部。
大数据技术论文范文6
统计学论文2000字(一):影响民族院校统计学专业回归分析成绩因素的研究论文
摘要:学习成绩是评价学生素质的重要方面,也是教师检验教学能力、反思教学成果的重要标准。利用大连民族大学统计学专业本科生有关数据(专业基础课成绩、平时成绩和回归分析期末成绩),建立多元線性回归模型,对影响回归分析期末成绩的因素进行深入研究,其结果对今后的教学方法改进和教学质量提高具有十分重要的指导意义。
关键词:多元线性回归;专业基础课成绩;平时成绩;期末成绩
为了实现教学目标,提高教学质量,有效提高学生学习成绩是很有必要的。我们知道专业基础课成绩必定影响专业课成绩,而且平时成绩也会影响专业课成绩,这两类成绩与专业课成绩基本上是呈正相关的,但它们之间的关系密切程度有多大?它们之间又存在怎样的内在联系呢?就这些问题,本文主要选取了2016级统计专业50名学生的四门专业基础课成绩以及回归分析的平时成绩和期末成绩,运用SPSS统计软件进行分析研究,寻求回归分析期末成绩影响因素的变化规律,拟合出关系式,从而为强化学生的后续学习和提高老师的教学质量提供了有利依据。
一、数据选取
回归分析是统计专业必修课,也是统计学中的一个非常重要的分支,它在自然科学、管理科学和社会、经济等领域应用十分广泛。因此研究影响统计学专业回归分析成绩的相关性是十分重要的。
选取了统计专业50名学生的专业基础课成绩(包括数学分析、高等代数、解析几何和概率论)、回归分析的平时成绩和期末成绩,结合多元线性回归的基础理论知识[1-2],建立多元回归方程,进行深入研究,可以直观、高效、科学地分析各种因素对回归分析期末成绩造成的影响。
二、建立多元线性回归模型1及数据分析
运用SPSS统计软件对回归分析期末成绩的影响因素进行研究,可以得到准确、科学合理的数据结果,全面分析评价学生考试成绩,对教师以后的教学工作和学生的学习会有较大帮助。自变量x1表示数学分析成绩,x2表示高等代数成绩,x3表示解析几何成绩,x4表示概率论成绩,x5表示平时成绩;因变量y1表示回归分析期末成绩,根据经验可知因变量y1和自变量xi,i=1,2,3,4,5之间大致成线性关系,可建立线性回归模型:
(1)
线性回归模型通常满足以下几个基本假设,
1.随机误差项具有零均值和等方差,即
(2)
这个假定通常称为高斯-马尔柯夫条件。
2.正态分布假定条件
由多元正态分布的性质和上述假定可知,随机变量y1服从n维正态分布。
从表1描述性统计表中可看到各变量的平均值1=79.68,2=74.66,3=77.22,4=78.10,5=81.04,1=75.48;xi的标准差分别为10.847,11.531,8.929,9.018,9.221,y1的标准差为8.141;有效样本量n=50。
回归分析期末成绩y1的多元回归模型1为:
y1=-5.254+0.221x1-0.4x2+0.154x3
+0.334x4+0.347x5
从表2中可以看到各变量的|t|值,在给定显著水平?琢=0.05的情况下,通过t分布表可以查出,自由度为44的临界值t?琢/2(44)=2.015,由于高等代数x2的|t|值为0.651小于t?琢/2(44),因此x2对y1的影响不显著,其他自变量对y1都是线性显著的。下面利用后退法[3]剔除自变量x2。
三、后退法建立多元线性回归模型2及数据分析
从模型1中剔除了x2变量,多元回归模型2为:
y1=-5.459+0.204x1+0.149x3+0.377x4+0.293x5(5)
在表4中,F统计量为90.326,在给定显著水平?琢=0.05的情况下,查F分布表可得,自由度為p=4和n-p-1=45的临界值F0.05(4,45)=2.579,所以F>F0.05(4,45),在表5中,所有自变量的|t|值都大于t?琢/2(45)=2.014,因此,多元回归模型2的线性关系是显著的。
四、结束语
通过对上述模型进行分析,即各个自变量对因变量的边际影响,可以得到以下结论:在保持其他条件不变的情况下,当数学分析成绩提高一分,则回归分析成绩可提高0.242分[4-5];同理,当解析几何成绩、概率论成绩和平时成绩每提高一分,则回归分析成绩分别提高0.149分、0.377分和0.293分。
通过对学生专业基础课成绩、平时成绩与回归分析期末成绩之间相关关系的研究,一方面有利于教师把控回归分析教学课堂,提高教师意识,注重专业基础课教学的重要性,同时,当学生平时成绩不好时,随时调整教学进度提高学生平时学习能力;另一方面使学生认识到,为了更好地掌握回归分析知识,应加强专业基础课的学习,提高平时学习的积极性。因此,通过对回归分析期末成绩影响因素的研究能有效的解决教师教学和学生学习中的许多问题。
统计学毕业论文范文模板(二):大数据背景下统计学专业“数据挖掘”课程的教学探讨论文
摘要:互联网技术、物联网技术、云计算技术的蓬勃发展,造就了一个崭新的大数据时代,这些变化对统计学专业人才培养模式的变革起到了助推器的作用,而数据挖掘作为拓展和提升大数据分析方法与思路的应用型课程,被广泛纳入统计学本科专业人才培养方案。本文基于数据挖掘课程的特点,结合实际教学经验,对统计学本科专业开设数据挖掘课程进行教学探讨,以期达到更好的教学效果。
关键词:统计学专业;数据挖掘;大数据;教学
一、引言
通常人们总结大数据有“4V”的特點:Volume(体量大),Variety(多样性),Velocity(速度快)和Value(价值密度低)。从这样大量、多样化的数据中挖掘和发现内在的价值,是这个时代带给我们的机遇与挑战,同时对数据分析技术的要求也相应提高。传统教学模式并不能适应和满足学生了解数据处理和分析最新技术与方法的迫切需要。对于常常和数据打交道的统计学专业的学生来说,更是如此。
二、课程教学探讨
针对统计学本科专业的学生而言,“数据挖掘”课程一般在他们三年级或者四年级所开设,他们在前期已经学习完统计学、应用回归分析、多元统计分析、时间序列分析等课程,所以在“数据挖掘”课程的教学内容选择上要有所取舍,同时把握好难度。不能把“数据挖掘”课程涵盖了的所有内容不加选择地要求学生全部掌握,对学生来说是不太现实的,需要为统计学专业本科生“个性化定制”教学内容。
(1)“数据挖掘”课程的教学应该偏重于应用,更注重培养学生解决问题的能力。因此,教学目标应该是:使学生树立数据挖掘的思维体系,掌握数据挖掘的基本方法,提高学生的实际动手能力,为在大数据时代,进一步学习各种数据处理和定量分析工具打下必要的基础。按照这个目标,教学内容应以数据挖掘技术的基本原理讲解为主,让学生了解和掌握各种技术和方法的来龙去脉、功能及优缺点;以算法讲解为辅,由于有R语言、python等软件,学生了解典型的算法,能用软件把算法实现,对软件的计算结果熟练解读,对各种算法的改进和深入研究则不作要求,有兴趣的同学可以自行课下探讨。
(2)对于已经学过的内容不再详细讲解,而是侧重介绍它们在数据挖掘中的功能及综合应用。在新知识的讲解过程中,注意和已学过知识的融汇贯通,既复习巩固了原来学过的知识,同时也无形中降低了新知识的难度。比如,在数据挖掘模型评估中,把混淆矩阵、ROC曲线、误差平方和等知识点就能和之前学过的内容有机联系起来。
(3)结合现实数据,让学生由“被动接收”式的学习变为“主动探究”型的学习。在讲解每种方法和技术之后,增加一个或几个案例,以加强学生对知识的理解。除了充分利用已有的国内外数据资源,还可以鼓励学生去搜集自己感兴趣的或者国家及社会大众关注的问题进行研究,提升学生学习的成就感。
(4)充分考虑前述提到的三点,课程内容计划安排见表1。
(5)课程的考核方式既要一定的理论性,又不能失掉实践应用性,所以需要结合平时课堂表现、平时实验项目完成情况和期末考试来综合评定成绩。采取期末闭卷理论考试占50%,平时实验项目完成占40%,课堂表现占10%,这样可以全方位的评价学生的表现。
三、教学效果评估
经过几轮的教学实践后,取得了如下的教学效果:
(1)学生对课程的兴趣度在提升,课下也会不停地去思考数据挖掘有关的方法和技巧,发现问题后会一起交流与讨论。
(2)在大学生创新创业项目或者数据分析的有关竞赛中,选用数据挖掘方法的人数也越来越多,部分同学的成果还能在期刊上正式发表,有的同学还能在竞赛中取得优秀的成绩。
(3)统计学专业本科生毕业论文的选题中利用数据挖掘有关方法来完成的论文越来越多,论文的完成质量也在不断提高。
(4)本科毕业生的就业岗位中从事数据挖掘工作的人数有所提高,说明满足企业需求技能的人数在增加。继续深造的毕业生选择数据挖掘研究方向的人数也在逐渐增多,表明学生的学习兴趣得以激发。
教学实践结果表明,通过数据挖掘课程的学习,可以让学生在掌握理论知识的基础上,进一步提升分析问题和解决实际问题的能力。