生物统计学数据分析范例6篇

前言:中文期刊网精心挑选了生物统计学数据分析范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

生物统计学数据分析

生物统计学数据分析范文1

【论文摘要】所谓统计思想,就是在统计实际工作、统计学理论的应用研究中,必须遵循的基本理念和指导思想。统计思想主要包括均值思想、变异思想、估计思想、相关思想、拟合思想、检验思想等思想。文章通过对统计思想的阐释,提出关于统计思想认识的三点思考。

【论文关键词】统计学;统计思想;认识

1关于统计学

统计学是一门实质性的社会科学,既研究社会生活的客观规律,也研究统计方法。统计学是继承和发展基础统计的理论成果,坚持统计学的社会科学性质,使统计理论研究更接近统计工作实际,在国家和社会得到广泛发展。

2统计学中的几种统计思想

2.1统计思想的形成

统计思想不是天然形成的,需要经历统计观念、统计意识、统计理念等阶段。统计思想是根据人类社会需求的变化而开展各种统计实践、统计理论研究与概括,才能逐步形成系统的统计思想。

2.2比较常用的几种统计思想

所谓统计思想,就是统计实际工作、统计学理论及应用研究中必须遵循的基本理念和指导思想。统计思想主要包括:均值思想、变异思想、估计思想、相关思想、拟合思想、检验思想。现分述如下:

2.2.1均值思想

均值是对所要研究对象的简明而重要的代表。均值概念几乎涉及所有统计学理论,是统计学的基本思想。均值思想也要求从总体上看问题,但要求观察其一般发展趋势,避免个别偶然现象的干扰,故也体现了总体观。

2.2.2变异思想

统计研究同类现象的总体特征,它的前提则是总体各单位的特征存在着差异。统计方法就是要认识事物数量方面的差异。统计学反映变异情况较基本的概念是方差,是表示“变异”的“一般水平”的概念。平均与变异都是对同类事物特征的抽象和宏观度量。

2.2.3估计思想

估计以样本推测总体,是对同类事物的由此及彼式的认识方法。使用估计方法有一个预设:样本与总体具有相同的性质。样本才能代表总体。但样本的代表性受偶然因素影响,在估计理论对置信程度的测量就是保持逻辑严谨的必要步骤。

2.2.4相关思想

事物是普遍联系的,在变化中,经常出现一些事物相随共变或相随共现的情况,总体又是由许多个别事务所组成,这些个别事物是相互关联的,而我们所研究的事物总体又是在同质性的基础上形成。因而,总体中的个体之间、这一总体与另一总体之间总是相互关联的。

2.2.5拟合思想

拟合是对不同类型事物之间关系之表象的抽象。任何一个单一的关系必须依赖其他关系而存在,所有实际事物的关系都表现得非常复杂,这种方法就是对规律或趋势的拟合。拟合的成果是模型,反映一般趋势。趋势表达的是“事物和关系的变化过程在数量上所体现的模式和基于此而预示的可能性”。

2.2.6检验思想

统计方法总是归纳性的,其结论永远带有一定的或然性,基于局部特征和规律所推广出来的判断不可能完全可信,检验过程就是利用样本的实际资料来检验事先对总体某些数量特征的假设是否可信。

2.3统计思想的特点

作为一门应用统计学,它从数理统计学派汲取新的营养,并且越来越广泛的应用数学方法,联系也越来越密切,但在统计思想的体现上与通用学派相比,还有着自己的特别之处。其基本特点能从以下四个方面体现出:(1)统计思想强调方法性与应用性的统一;(2)统计思想强调科学性与艺术性的统一;(3)统计思想强调客观性与主观性的统一;(4)统计思想强调定性分析与定量分析的统一。

3对统计思想的一些思考

3.1要更正当前存在的一些不正确的思想认识

英国著名生物学家、统计学家高尔顿曾经说过:“统计学具有处理复杂问题的非凡能力,当科学的探索者在前进的过程中荆棘载途时,唯有统计学可以帮助他们打开一条通道”。但事实并非这么简单,因为我们所面临的现实问题可能要比想象的复杂得多。此外,有些人认为方法越复杂越科学,在实际的分析研究中,喜欢简单问题复杂化,似乎这样才能显示其科学含量。其实,真正的科学是使复杂的问题简单化而不是追求复杂化。与此相关联的是,有些人认为只有推断统计才是科学,描述统计不是科学,并延伸扩大到只有数理统计是科学、社会经济统计不是科学这样的认识。这种认识是极其错误的,至少是对社会经济统计的无知。比利时数学家凯特勒不仅研究概率论,并且注重于把统计学应用于人类事物,试图把统计学创建成改良社会的一种工具。经济学和人口统计学中的某些近代概念,如GNP、人口增长率等等,均是凯特勒及其弟子们的遗产。

3.2要不断拓展统计思维方式

统计学是以归纳推理或归纳思维为主要的逻辑方式的。众所周知,逻辑推理方式主要有两种:归纳推理和演绎推理。归纳推理是基于观测到的数据信息(尤其是不完全甚至劣质的信息)去产生新的知识或去验证一个假设,即以所掌握的数据信息为依据,归纳得出具有一般特征的结论。归纳推理是要在数据信息的基础上透过偶然性去发现必然性。演绎推理是对统计认识能力的深化,尤其是在根据必然性去研究和认识偶然性方面,具有很大的作用。

3.3深化对数据分析的认识

任何统计研究都离不开数据分析。因为这是得到统计研究结论的必要环节。虽然统计分析的形式随时代的推移而变化着,但是“从数据中提取一切信息”或者“归纳和揭示”作为统计分析的目的却一直没有改变。对统计数据分析的原因有以下三个方面:一是基于同样的数据会得出不同、甚至相反的分析结论;二是我们所面对的分析数据有时是缺损的或存在不真实性;三是我们所面对的分析数据有时则又是海量的,让人无从下手。虽然统计数据分析已经经历了描述性数据分析(DDA)、推断性数据分析(IDA)和探索性数据分析(EDA)等阶段,分析的方法技术已经有了质的飞跃,但与人类不断提高的要求相比,存在的问题似乎也越来越多。所以,我们必须深化对数据分析的认识,围绕“准确解答特定问题并且从数据中获取一切有效信息”这一目的,不断拓展研究思路,继续开展数据分析方法技术的研究。

参考文献:

[1]陈福贵.统计思想雏议[J]北京统计,2004,(05).

[2]庞有贵.统计工作及统计思想[J]科技情报开发与经济,2004,(03).

生物统计学数据分析范文2

1关于统计学

统计学是一门实质性的社会科学,既研究社会生活的客观规律,也研究统计方法。统计学是继承和发展基础统计的理论成果,坚持统计学的社会科学性质,使统计理论研究更接近统计工作实际,在国家和社会得到广泛发展。

2统计学中的几种统计思想

2.1统计思想的形成

统计思想不是天然形成的,需要经历统计观念、统计意识、统计理念等阶段。统计思想是根据人类社会需求的变化而开展各种统计实践、统计理论研究与概括,才能逐步形成系统的统计思想。

2.2比较常用的几种统计思想

所谓统计思想,就是统计实际工作、统计学理论及应用研究中必须遵循的基本理念和指导思想。统计思想主要包括:均值思想、变异思想、估计思想、相关思想、拟合思想、检验思想。现分述如下:

2.2.1均值思想

均值是对所要研究对象的简明而重要的代表。均值概念几乎涉及所有统计学理论,是统计学的基本思想。均值思想也要求从总体上看问题,但要求观察其一般发展趋势,避免个别偶然现象的干扰,故也体现了总体观。

2.2.2变异思想

统计研究同类现象的总体特征,它的前提则是总体各单位的特征存在着差异。统计方法就是要认识事物数量方面的差异。统计学反映变异情况较基本的概念是方差,是表示“变异”的“一般水平”的概念。平均与变异都是对同类事物特征的抽象和宏观度量。

2.2.3估计思想

估计以样本推测总体,是对同类事物的由此及彼式的认识方法。使用估计方法有一个预设:样本与总体具有相同的性质。样本才能代表总体。但样本的代表性受偶然因素影响,在估计理论对置信程度的测量就是保持逻辑严谨的必要步骤。

2.2.4相关思想

事物是普遍联系的,在变化中,经常出现一些事物相随共变或相随共现的情况,总体又是由许多个别事务所组成,这些个别事物是相互关联的,而我们所研究的事物总体又是在同质性的基础上形成。因而,总体中的个体之间、这一总体与另一总体之间总是相互关联的。

2.2.5拟合思想

拟合是对不同类型事物之间关系之表象的抽象。任何一个单一的关系必须依赖其他关系而存在,所有实际事物的关系都表现得非常复杂,这种方法就是对规律或趋势的拟合。拟合的成果是模型,反映一般趋势。趋势表达的是“事物和关系的变化过程在数量上所体现的模式和基于此而预示的可能性”。

2.2.6检验思想

统计方法总是归纳性的,其结论永远带有一定的或然性,基于局部特征和规律所推广出来的判断不可能完全可信,检验过程就是利用样本的实际资料来检验事先对总体某些数量特征的假设是否可信。

2.3统计思想的特点

作为一门应用统计学,它从数理统计学派汲取新的营养,并且越来越广泛的应用数学方法,联系也越来越密切,但在统计思想的体现上与通用学派相比,还有着自己的特别之处。其基本特点能从以下四个方面体现出:(1)统计思想强调方法性与应用性的统一;(2)统计思想强调科学性与艺术性的统一;(3)统计思想强调客观性与主观性的统一;(4)统计思想强调定性分析与定量分析的统一。

3对统计思想的一些思考

3.1要更正当前存在的一些不正确的思想认识

英国著名生物学家、统计学家高尔顿曾经说过:“统计学具有处理复杂问题的非凡能力,当科学的探索者在前进的过程中荆棘载途时,唯有统计学可以帮助他们打开一条通道”。但事实并非这么简单,因为我们所面临的现实问题可能要比想象的复杂得多。此外,有些人认为方法越复杂越科学,在实际的分析研究中,喜欢简单问题复杂化,似乎这样才能显示其科学含量。其实,真正的科学是使复杂的问题简单化而不是追求复杂化。与此相关联的是,有些人认为只有推断统计才是科学,描述统计不是科学,并延伸扩大到只有数理统计是科学、社会经济统计不是科学这样的认识。这种认识是极其错误的,至少是对社会经济统计的无知。比利时数学家凯特勒不仅研究概率论,并且注重于把统计学应用于人类事物,试图把统计学创建成改良社会的一种工具。经济学和人口统计学中的某些近代概念,如GNP、人口增长率等等,均是凯特勒及其弟子们的遗产。

3.2要不断拓展统计思维方式

统计学是以归纳推理或归纳思维为主要的逻辑方式的。众所周知,逻辑推理方式主要有两种:归纳推理和演绎推理。归纳推理是基于观测到的数据信息(尤其是不完全甚至劣质的信息)去产生新的知识或去验证一个假设,即以所掌握的数据信息为依据,归纳得出具有一般特征的结论。归纳推理是要在数据信息的基础上透过偶然性去发现必然性。演绎推理是对统计认识能力的深化,尤其是在根据必然性去研究和认识偶然性方面,具有很大的作用。

3.3深化对数据分析的认识

任何统计研究都离不开数据分析。因为这是得到统计研究结论的必要环节。虽然统计分析的形式随时代的推移而变化着,但是“从数据中提取一切信息”或者“归纳和揭示”作为统计分析的目的却一直没有改变。对统计数据分析的原因有以下三个方面:一是基于同样的数据会得出不同、甚至相反的分析结论;二是我们所面对的分析数据有时是缺损的或存在不真实性;三是我们所面对的分析数据有时则又是海量的,让人无从下手。虽然统计数据分析已经经历了描述性数据分析(DDA)、推断性数据分析(IDA)和探索性数据分析(EDA)等阶段,分析的方法技术已经有了质的飞跃,但与人类不断提高的要求相比,存在的问题似乎也越来越多。所以,我们必须深化对数据分析的认识,围绕“准确解答特定问题并且从数据中获取一切有效信息”这一目的,不断拓展研究思路,继续开展数据分析方法技术的研究。

论文摘要】所谓统计思想,就是在统计实际工作、统计学理论的应用研究中,必须遵循的基本理念和指导思想。统计思想主要包括均值思想、变异思想、估计思想、相关思想、拟合思想、检验思想等思想。文章通过对统计思想的阐释,提出关于统计思想认识的三点思考。

参考文献:

[1]陈福贵.统计思想雏议[J]北京统计,2004,(05).

[2]庞有贵.统计工作及统计思想[J]科技情报开发与经济,2004,(03).

生物统计学数据分析范文3

一、统计学中的几种常见统计思想

统计思想主要包括:均值思想、变异思想、估计思想、相关思想、拟合思想、检验思想等。统计思想不是天然形成的,需要经历统计观念、统计意识、统计理念等阶段。统计思想是根据人类社会需求的变化而开展各种统计实践、统计理论研究与概括,才能逐步形成系统的统计思想。作为一门应用统计学,它从数理统计学派汲取新的营养,并且越来越广泛的应用数学方法,联系也越来越密切,但在统计思想的体现上与通用学派相比,还有着自己的特别之处。其基本特点:(1)统计思想强调方法性与应用性的统一;(2)统计思想强调科学性与艺术性的统一;(3)统计思想强调客观性与主观性的统一;(4)统计思想强调定性分析与定量分析的统一。

1.均值思想。均值是对所要研究对象的简明而重要的代表。均值概念几乎涉及所有统计学理论,是统计学的基本思想。均值思想也要求从总体上看问题,但要求观察其一般发展趋势,避免个别偶然现象的干扰,故也体现了总体观。

2.变异思想。统计研究同类现象的总体特征,它的前提则是总体各单位的特征存在着差异。统计方法就是要认识事物数量方面的差异。统计学反映变异情况较基本的概念是方差,是表示“变异”的“一般水平”的概念。平均与变异都是对同类事物特征的抽象和宏观度量。

3.估计思想。估计以样本推测总体,是对同类事物的由此及彼式的认识方法。使用估计方法有一个预设:样本与总体具有相同的性质。样本才能代表总体。但样本的代表性受偶然因素影响,在估计理论对置信程度的测量就是保持逻辑严谨的必要步骤。

4.相关思想。事物是普遍联系的,在变化中,经常出现一些事物相随共变或相随共现的情况,总体又是由许多个别事务所组成,这些个别事物是相互关联的,而我们所研究的事物总体又是在同质性的基础上形成。因而,总体中的个体之间、这一总体与另一总体之间总是相互关联的。

5.拟合思想。拟合是对不同类型事物之间关系之表象的抽象。任何一个单一的关系必须依赖其他关系而存在,所有实际事物的关系都表现得非常复杂,这种方法就是对规律或趋势的拟合。拟合的成果是模型,反映一般趋势。趋势表达的是“事物和关系的变化过程在数量上所体现的模式和基于此而预示的可能性”。

6.检验思想。统计方法总是归纳性的,其结论永远带有一定的或然性,基于局部特征和规律所推广出来的判断不可能完全可信,检验过程就是利用样本的实际资料来检验事先对总体某些数量特征的假设是否可信。

二、对统计思想的若干思考

1.要改变当前存在的一些不正确的思想认识。英国著名生物学家、统计学家高尔顿曾经说过:“统计学具有处理复杂问题的非凡能力,当科学的探索者在前进的过程中荆棘载途时,唯有统计学可以帮助他们打开一条通道”。但事实并非这么简单,因为我们所面临的现实问题可能要比想象的复杂得多。此外,有些人认为方法越复杂,越科学。在实际的分析研究中,喜欢简单问题复杂化,似乎这样才能显示其科学含量。其实,真正的科学是使复杂的问题简单化而不是追求复杂化。与此相关联的是,有些人认为只有推断统计才是科学,描述统计不是科学,并延伸扩大到只有数理统计是科学、社会经济统计不是科学这样的认识。这种认识是极其错误的,至少是对社会经济统计的无知。比利时数学家凯特勒不仅研究概率论,并且注重于把统计学应用于人类事物,试图把统计学创建成改良社会的一种工具。经济学和人口统计学中的某些近代概念,如GNP、人口增长率等等,均是凯特勒及其弟子们的遗产。

生物统计学数据分析范文4

关键词 Excel;生物统计学;方差分析;单因素

中图分类号 O212.1 文献标识码 A 文章编号 1007-5739(2017)02-0271-02

生物统计学是对数据资料进行收集、整理、分析、解释的科学[1],在生物统计学教材中不仅提供了如何通过合理的试验设计获得理想的数据资料,还提供各种数据资料的分析方法,是所有高等学校本科生的必修课。生物统计学也是畜牧、兽医、农学、林学、微生物、医学等生命科学领域中不可缺少的统计工具,越来越多的数据分析离不开生物统计学的原理与方法。随着计算机技术的发展,已有更多的软件被应用于生物统计学,如SPSS[2-4]、Excel[5]、SAS[6]等,但是不同的统计软件具有着不同的统计特点,如Excel统计功能虽然简单,但是操作方便,分析出来的结果更为直观,更适合生物统计学的初学者。生物统计学公式比较多,理论相对深奥,高等学校本科生对这门课程学习兴趣相对不高。因此,本文主要介绍如何利用Excel对单因素方差进行分析,以案例的形式详细阐述其分析过程,希望能通过本文的应用与探讨来提高学生对生物统计学的学习兴趣,并增强学生分析数据的能力。

1 分析工具库的安装

Excel一般不直接装配“分析工具库”这一模块,需要在Excel的基础上自行安装。安装步骤:Excel的工具加载宏分析工具库确定。

2 单因素方差分析

单因素的方差分析一般适用于单因素试验设计的数据分析,而且是因素水平需要>2时才可以运用此分析模块,例如比较分析3种饲料对仔猪日增重的影响则可以采用单因素方差分析。如果同样是单因素试验设计,但是因素水平是2的话,则可以采用t检验模块进行分析。

2.1 数据资料的建立

例:在同样饲养管理下,3个品种猪(A1、A2、A3)的增重如表1所示,试对3个品种增重差异是否显著进行检验[1]。数据资料建立如表1,以行的形式建立稻荩每行就是1个因素水平。

2.2 单因素方差分析过程

在Excel中:工具数据分析单因素方差分析,点击“确定”进行分析。输入区域:选择原始数据;分组方式:逐行(如果数据是以列的形式构建的,则逐列);标志位于第1列,指的是在建立数据的时候在数据第1列有数据的变量名,而且在输入区域选择的时候将变量名也选上,这时可以勾选“标志位于第一列”,否则就不选择此项。?琢(显著水平):0.05(或者0.01);输出选项:输出区域处选一空白处,单击“确定”按钮(图1)。

2.3 结果分析

结果部分见表2、3,表2中对数据进行了描述统计量的分析,只是简单地列出了3个猪品种的样本大小(6)、平均数、方差、总和等信息。从此结果可以初步看出,第3组(A3)的猪增重均值最小,但是数据资料的变异程度比较大(方差大),而第1组(A1)的猪增重均值是最大,第2组(A2)的数据资料的变异程度最小(方差小)。

方差分析的最终结果见表3,图针对所有数据资料的变异来源分为组间(处理:在此例中为不同品种)和组内(随机误差),分别列出了平方和(SS)、自由度(df)、均方(MS)、F值(F)、相伴概率(显著性概率,P),F的临界值(分位数,Fcrit)。根据表3的结果可以有2种方法判断结果,其一是直接根据显著性概率来判断,在本例中利用小概率不可能性原理,P=0.062 348>0.05(小概率),因此不同品种猪的增重差异不显著;也可以根据F值来判断,F=3.358 039

从表2、3可以看出,虽然不同品种猪的增重从均值上来看略微有些区别,但是经过方差分析,结果为3个品种猪的增重差异不显著,或者说没有显著差异,这也是生物统计学的精髓。

3 讨论

在单因素方差分析中Excel数据资料的建立是十分方便的,基本按照因素水平以行或列建立数据资料即可,而SPSS统计软件的数据建立[7]需要将同一因素的所有水平建立在同一列里,相对复杂一些。Excel在结果输出时候则给出了相伴概率P和F值这2种结果,可以以2种方式对结果进行分析,而SPSS只是以相伴概率P为依据来判定结果相对单一[7]。可以看出,利用Excel进行单因素的方差分析虽然从数据的建立、分析过程、结果分析等方面来看,操作相对比较方便,适合初学者;但是也有不足之处,当方差分析结果是差异显著(或极显著)时,不能够对数据资料进行进一步的多重比较。

4 参考文献

[1] 张勤.生物统计学[M].北京:中国农业大学出版社,2009.

[2] 白俊艳,贾小平,张小辉,等.生物统计学课程改革与实践[J].畜牧与饲料科学,2013,34(10):57-58.

[3] 白俊艳,武晓红,张小辉,等.生物统计附试验设计课程考核方式的改革与实践[J].安徽农业科学,2015,43(5):369-370.

[4] 秦立金.SPSS统计软件在生物统计课程中的探索研究[J].赤峰学院学报(自然科学版),2014,30(3):198-199.

[5] 韦若勋.生物统计学上机实验课中Excel互动教学方式的应用[J].高等教育,2013(8):185-186.

生物统计学数据分析范文5

关键词:生物统计学;教学方式;实践教学

中图分类号:G642.41 文献标志码:A 文章编号:1674-9324(2014)48-0145-03

生物统计学是数理统计在生物学中的应用,它是用数理统计的原理、方法来分析解释生物学中各种现象和实验调查资料的一门科学。生物统计学是本科生专业必修课,对提高学生的科研能力和综合素质有重要意义。生物统计学,不仅提供设计科学试验和收集数据的方法,而且也提供整理和分析数据、得出科学结论的方法。同时,生物统计学也是一门理论性和实践性较强的课程,课程内容广、概念多、公式多;加上学生缺乏背景知识,对该课程认识不够,使这门课程有教师难教,学生难学、难记、难用的“四难”课程之称[1,2]。从2012年开始,我校生物统计学教研组针对课程特点,重新确立了教学目标和教学计划,改进教学方式,增加学生上机操作训练,使学生由传统的学习统计基础知识向掌握具体数据处理和分析方法的目标上转变,将过去以笔试为主的考试方式转变为基础知识测试和统计分析方法应用相结合的考核制度,从源头上使教学模式向注重人才培养和提高学生科研素质上转变。经过教研组全体教师的努力,生物统计学的教学质量和教学水平得到了大幅提升。笔者根据两年来的生物统计学教学工作的实践,结合课程特点,对生物统计学课程教学方法的探索和实践作如下总结。

一、确立教学目标、调整教学计划

2012年前,我校生物统计学,主要由数学专业的老师进行讲授,教学内容以数理统计为主。学生学习本课程后,仍然无法将统计学这一工具应用于生物学的相关领域。针对这一情况,学院领导研究决定生物统计学这门课程由学院相关专业的教师授课,教研组接到通知后进行了研究部署。笔者在确立人才培养目标时,首先将生物统计学课程定义为工具课。在确保这一基础后,笔者根据我校本科生培养目标,将生物统计学的目标明确为:以一线教师和科研工作中最常用的统计分析方法为内容,要求学生了解现代科学研究的基本方法、统计学基本概念和主要参数的意义;理解生物学实验设计方法和常用统计模型的应用条件;掌握实验设计和统计分析方法,掌握EXCEL和STATISTICA软件操作方法,能够独立进行生物学试验结果的统计分析,并具有综合运用所学知识分析问题和解决问题的能力。

根据上述教学目标,笔者选择合适的课程教材,制定教学计划,将生物统计学的课程重心放在让学生了解统计学的一般原理和方法、掌握实验设计和数据分析的原理、掌握统计软件处理和分析数据的方法上。

二、优化教学内容,突出课程重点

教学内容贯穿整个教学过程,是人才培养的主要落脚点。生物统计学的教学内容非常庞杂,笔者根据教学目标和教学计划,将生物统计学课程进行了梳理,主要以一线教师和科研工作者最常用到的统计学知识为基础。教学内容,主要包括数据和数据类型、总体和样本、数据的描述性统计、概率和分布、统计推断、t检验、方差分析、数据转换、多重比较、相关和回归、因子分析、非参数检验、实验设计等。教学的重点,是让学生理解各种统计方法的使用条件和基本原理,通过在计算机上运行EXCEL和STATISTICA软件,结合生物学实例掌握各类统计模型和检验方法的具体操作步骤,得出统计检验结果,并根据实验数据运用已掌握的生物学原理解释实验数据所产生的科学意义。此外,我们在教学过程中,会将近年来生物学方面有重要意义的一些统计学方法和原理做简单的普及,如将系统发生关系纳入形态数据中,检验形态特征进化的谱系依赖性;利用不同地理种群的生活史特征和形态特征计算物种的表型分化,结合遗传分化数据分析物种分化的原因等。我们通过这样的方式,在学生心中埋下进一步学习统计学的种子,为他们以后的科研和学习提供帮助。从教学内容上,笔者将以往所注重的统计原理介绍和统计模型推导的部分转变为让学生理解统计模型的原理和应用条件,内容上侧重于让学生掌握统计分析方法的应用。因此,笔者在授课过程中,上机实习的学习时间约占整个课时的50%。根据人才培养目标,生物统计学课程重点要求学生掌握实验数据分析处理的一般方法,并利用EXCEL和STATISTICA软件综合分析数据并得出科学结论。教学过程中,笔者注重生物学实例教学,利用已发表文章的数据为训练内容,将课程所涉及的各类统计模型贯穿于实例教学中,使学生在学习理论知识的同时,将所学方法应用于实际科研项目中,激发学生学习的积极性和主动性。

三、“以学生为本”,优化教学方式

现代教学观念认为,课程是学生的发展,课程是教师与学生之间的契约[3]。这里体现了一种“以学生为本”的教学理念,传统教学较多地体现在对教师和教材的关注上,而“以学生为本”的教学思想,则更多地关注在课程教学活动过程中学生的参与和知识的获得,关注在课程教学过程中为学生创造出充满生机的学习、研究氛围,为学生提供张扬个性、充分发展的环境[4]。在“以学生为本”的教学思想指导下,针对生物统计学理论性较强,内容枯燥、乏味等特点,笔者在教学过程中,以多媒体教学为主,辅以传统的板书教学。教学过程,笔者为学生提供大量的实验数据,启发和引导学生主动挖掘数据,通过小组讨论等形式探究数据处理方式,应用已学习的统计模型分析实验数据并得出科学结论。

在教学过程中,将传统的教师讲授模式转变为教师讲授和实例教学相结合的模式,笔者将上课的地点安排在计算机机房进行,每次上课根据教学内容的不同设置1~2课时的实例教学。从应用统计方法解决实际科研问题的角度组织课堂教学,以小组的形式就某个实际问题展开讨论,教师的角色定位成课程组织者,充分调动学生学习的积极性和主动性。例如,我们在讲解t检验时,前1个课时,我们通过多媒体教学结合板书的形式讲解t检验的应用条件和计算原理;其余2个课时,我们提供一定的生物学实验和中学生考试成绩相关的数据,以小组讨论的方式要求学生对数据进行统计检验并得出科学结论。在学习相关与回归时,我们要求学生将生物化学实验和生态学实验的数据拿到生物统计学上进行统计检验,如分子量和电泳迁移距离的实验数据,可以用来检验蛋白质分子量和电泳迁移距离的相关性,并预测已知迁移距离的蛋白质分子的分子量;通过卡方检验验证果蝇杂交结果是否符合实验预期等。我们通过对自己实验数据的统计检验,让学生深刻体会到学习生物统计学的重要性,从而激发学习的主动性,变被动接受为主动学习和探究。

四、“学以致用”,加强实践教学

实践教学是高校实现人才培养目标的重要环节,是高校生物专业教育教学体系的重要组成部分,是培养学生专业技能及实践技能的重要途径。它对提高学生的综合素质,培养学生的创新能力,造就学生成为具有社会竞争力和国际竞争力的高素质人才具有特殊作用[5,6]。因此,笔者根据大学生人才培养目标,将生物统计学的教学内容融入到学生实践教学中。在教学过程中,我们将整个班级按照每6个人一个小组进行分组,在教授不同的教学内容时,给每组同学收集一定的数据,采用研究型教学的方式让学生根据已有的知识对数据进行分析和整理,并得出相应的统计结果。我们通过研究型教学的方式,可以使学生积极参与到教学和科研实践中,对提高学生利用生物统计学的原理解决实际生物学问题有积极的推动作用。

此外,笔者利用动物、植物和微生物野外实习和大学生创新训练等实践教学活动引导学生将所学的统计学知识应用到实际科研训练中。教师根据已学过的统计学原理组织和指导学生在开展野外调查和创新训练前,针对性地查阅文献、设计实验方案,学生在实习过程中根据已确定的实验方案进行数据的收集和采样工作,完成野外实践活动并获得相应实验数据后,对数据进行统计分析得出科学结论。我们通过完整的实验设计、获得数据、分析数据和得出结论等过程,使学生更好地掌握生物统计学这门工具课,提高学生的科研创新能力和综合素质。

五、注重实效,改革考核形式

考试是教育教学工作的重要环节,正确理解和掌握考试的目的对促进学生学习和改进教学工作、提高教学质量有重要意义。在以往的教学过程中,考试以笔试为主,考试内容主要偏重于概率论和统计学的原理和基本概念等,期末考试的成绩决定了这门课的最终成绩。在这种考试指挥棒的作用下,学生往往是平时松、考前紧,考后不复习。这种考试方式不能全面考查学生对各种统计分析方法的掌握和应用情况,同时也不利于学生形成良好的学习习惯,学习课程后也不能将具体的统计学方法应用到今后的科研或教学实践中。为了扭转这种局面,对学生进行准确、客观、公正地评定学习成绩和能力的改革势在必行。笔者根据人才培养目标,将课程最终考核成绩分为以下三个部分:平时成绩(占总成绩的40%,主要由出勤和课后作业成绩组成)、期末笔试成绩(占总成绩的24%,主要是生物统计学一些重要的概念和统计原理)和实验数据分析(占总成绩的36%,根据给定的实验数据,利用EXCEL和STATISTICA软件选择正确的统计分析方法,得出可靠的实验结论)。

在教研组实施上述教学改革后,我院学生应用统计学处理和解决科学问题的能力有了明显提高。在大学生科研训练中,我们要求学生不断地把统计的方法应用到解决实际科学问题上,使他们形成了一个不断巩固统计学方法和学习新的统计学知识的良性循环中,对统计学的学习有了更进一步的提高。总之,我们通过对教学内容、教学模式、教学方法和考核形式的一系列改革,可以有效地将学生从机械地学习生物统计学的理论知识向利用统计学的原理解决实际生物教学和科研的实际问题上转变,让学生能够在理解统计学理论的基础上,正确选择和熟练运用统计方法解决实际问题。作为专业教师,我们也会在今后的教学中,仍需要不断学习统计理论,探索教学规律,完善教育体系,提高课程教学质量,为培养具有较强社会适应能力和竞争能力的高素质应用型人才而努力。

参考文献:

[1]邹永梅.《生物统计学》课程建设的探索[J].江苏教育学院学报,2012,28(5):51-52.

[2]王春强,马巍,王洪才.高校《生物统计附实验设计》课程现状分析[J].中国校外教育,2012,(11):102.

[3]葛岳静.关于精品课程建设的几点看法(精品课程建设专家谈)[J].中国大学教学,2003,(4):4-6.

[4]郭祥群,阮源萍,杨利民,黎朝.以学生主体的教学优化模式探析[J].厦门大学学报,2004,增刊:1-4.

[5]洪梅.深化实践教学改革,构建合理实践教学体系[J].科技信息,2008,(12):201.

生物统计学数据分析范文6

关键词:数据挖掘;神经元;方法;应用;发展

中图分类号:TP311.13 文献标识码:A 文章编号:1007-9599 (2012) 12-0000-02

一、引言

伴随信息技术的迅猛发展,数据库规模与应用的不断扩大,大量数据随之产生。新增的数据包含了重要的信息,人们希望更好地利用这些数据,并通过进行更高层次的数据分析,为决策者提供更宽广的视野。

现今,很多领域已建立了相应的数据仓库。但人们无法辨别隐藏在海量数据中有价信息,传统的查询方式无法满足信息挖掘的需求。因此,伴随着数据仓库技术不断发展并逐渐完善的一种从海量信息中提取有价潜在信息的崭新数据分析技术------数据挖掘(Data Mining)技术应运而生。

二、数据挖掘概念

数据挖掘技术从1990年左右开始,发展速度很快,数据挖掘技术的产生和不断发展可使得人们对当今世界的海量数据中隐藏着人们所需要的商业和科学信息等重要信息进行挖掘。数据挖掘运用到交叉学科,涉及到,包括Database、AI、Machine Learning、人工神经网络(Artificial Neural Networks)、统计学(statistics)、模式识别(Pattern Recognition)、信息检索(Information Retrieval)和数据库可视化等,因此数据库目前还没有明确的定义。通常普遍认可的数据挖掘定义是:从数据库中抽取隐含的、以前未知的、有潜在应用价值的模型或规则等有用知识的复杂过程,是一类深层次的数据分析方法。

三、数据挖掘方法

由于数据挖掘技术研究融合了不同学科技术,在研究方法上表现为多样性。从统计学角度上划分,数据挖掘技术模型有:线形/非线形分析、回归/逻辑回归分析、单/多变量分析、时间序列/最近序列分析和聚类分析等方法。通过运用这些技术可以检索出异常形式数据,最后,利用多种统计和数学模型对上述数据进行解释,发掘出隐藏在海量数据后的规律和知识。

(一)数据挖掘统计

统计学为数据挖掘技术提供了判别方法与分析方法,经常会用到的有贝叶斯推理(Bayesian reasoning; Bayesian inference)、回归分析(Regression analysis)、方差分析(Analysis of Variance,简称ANOVA)等分析技术、贝叶斯推理是在估计与假设统计归纳基础上发展的全新推理方法。贝叶斯推理在与传统统计归纳推理方法相比较,所得出的结论不仅根据当前观察得到的样本信息,还将根据推理者过去相关的经验和知识来处理数据挖掘中遇到的分类问题;回归分析是通过输入变量和输出变量来确定变量之间的因果关系,通过建立回归模型,根据实测数据求解模型的各参数,若能很好的拟合,则可根据自变量进一步预测。统计方法中的方差分析是通过分析研究中估计回归直线的性能和自变量对最终回归的贡献大小,从而确定可控因素对研究结果影响力的大小。

(二)聚类分析(Cluster analysis )

聚类分析(Cluster analysis)是将一组研究对象分为相对同质的群组(clusters)的统计分析技术。 同组内的样本具有较高相似度,常用技术有分裂/凝聚算法,划分/增量聚类。聚类方法适用于研究群组内的关系,并对群组结构做出相应评价。同时,聚类分析为了更容易地使某个对象从其他对象中分离出来的方法用于检测孤立点。聚类分析已被应用于经济分析(Economic analysis)、模式识别(Pattern Recognition)、图像处理(image processing)等多种领域。

(三)机器学习(Machine Learning)

机器学习方法经过多年的研究已相对完善,通过建立人类的认识模型、模仿人类的学习方法从海量数据中提取信息与知识,在很多领域已取得了一些较满意的成果。因此利用目前比较成熟的机器学习方法可以提供数据挖掘效率。

(四)数据汇总

数据库中的数据和对象经常包含原始概念层上的详细信息,将数据集通过数据立方体和面向对象的归纳方法由低概念层抽象到高概念层,并对数据归纳为更高概念层次信息的数据挖掘技术。

(五)人工神经网络(Artificial Neural Networks)

神经网络是一种模范动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。近年来在解决数据挖掘中遇到的问题越来越受到人们的关注,源于人工神经网络具有良好的自组织自适应性、并行处理、分布式存储和高容错等特性,并通过调整内部大量节点之间相互连接的关系,达到处理信息的目的。

(六)遗传算法(Genetic Algorithm)

遗传算法(Genetic Algorithm)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法,是一种受生物进化启发的学习方法,通过变异和重组当前己知的最好假设来生成后续的假设。遗传算法可直接对结构对象进行操作,不存在求导和函数连续性的限定,能自动获取和指导优化的搜索空间,自适应地调整搜索方向。遗传算法已被人们广泛地应用于多种学科领域。

(七)粗糙集

粗糙集是一种刻划不完整性和不确定性的数学工具,能有效地分析不精确,不一致(inconsistent)、不完整(incomplete) 等各种不完备的信息,还可以对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律。粗糙集理论应用于数据挖掘中的分类、发现不准确数据或噪声数据内在的结构联系。

四、数据挖掘技术发展趋势

当前,数据挖掘技术不断创新与发展,数据挖掘技术开发研究人员、系统应用人员所面对的主要问题:高效、有效的数据挖掘方法和相应系统的开发;交互和集成的数据挖掘环境的建立以及在实际应用中解决大型问题。

五、小结

数据挖掘技术涉及到多种学科技术,如:数据库技术、统计学、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索及空间数据分析等。因此,数据挖掘是非常有前景的研究领域,随着数据挖掘技术的不断发展,它将会广泛而深入地应用到人类社会的各个领域。

参考文献:

[1]罗可,蔡碧野.数据挖掘及其发展研究[J].计算机工程与应用,2002

[2]赵丹群.数据挖掘:原理、方法及其应用[J].现代图书情报技术,2000

[3]刘毅勇.情报分析智能辅助决策方法及其军事应用[M].北京:国防大学出版社,2001

[4]唐晓萍.数据挖掘技术及其在指挥控制系统中的应用[J].火力与指挥控制,2002

[5]Alex Berson,Stephen J.Smith,Data Warehousing,Data Mining,&OLAP[M], McCraw-Hill Book Co,1997

[6]吴修霆.SAS数据挖掘技术的实现[J].微电脑世界,2000, Vol.14:pp44-45

[7] INDERPAL BHANDARI, EDWARD COLET, JENNIFER PARKER, ZACHARYPINES, RAJIV PRATAP, KRISHNAKMAR RAMANUJAM. Advanced Scout: Data Mining and Knowledge Discovery in NBA Data. Data Mining and Knowledge Discovery,1997,1:121~125