前言:中文期刊网精心挑选了统计学参数概念范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
统计学参数概念范文1
统计学是一门基于试验数据的搜集、整理,对研究目标的统计性质进行分析和推断的学科,更是一门综合运用数学科学、计算机科学、信息学等工具学科、并与自然科学、社会科学相结合的多学科相交叉的边缘学科。在我国,早期的统计学设置比较狭隘,多作为数学学科的概率统计和经济学科的经济统计等子学科。直到 1998年,国家教育部设立了统计学专业[1],2011年颁布的《普通高等学校本科专业目录》更把统计学提升为一级学科!由此可见,统计学的专业地位及其重要性得到了广泛的认可。
与之相反,关于统计学专业教学的研究还处于起步阶段。相比于其他大类专业的教学研究,关于统计专业教学的教学语言设计的研究还未得到深入发展。
教学语言是一类广义的语言,是教学者与教学对象的多种感官的交流;同时,也是一种人文文化的载体,是一种民族文化的展示。教学语言的设计,就是通过调动教学对象的听觉、视觉、感觉等多方面来实现教学目标。
统计学专业的教学语言主要包括:口语语言、文字语言、符号语言、图表语言和肢体语言,本文将从上述五个方面对统计学专业的教学语言设计展开讨论与研究。
一、充分运用口语语言阐述教学内容
口语语言,是教学内容阐述的主要载体之一,是师生之间思想、情感交流的主要工具。由于统计学是与自然科学、社会科学相结合的多学科相交叉的边缘学科,统计学专业教学的口语语言与一般教学的口语语言既有联系,又有区别,主要具有以下特点:
1.对于基础理论的教学,口语语言要准确、规范
由于统计学的基础理论主要是基于各种模型,通过逻辑推导来进行分析和推断,并以高等数学形式来描述,因此相关教学的口语语言应以标准的数学口语语言来准确、规范地阐述相应的数学理论,特别要注意相应的模型理论的提出和逻辑关系的表述、推导等,依此来帮助学生准确地理解、把握统计学的基础理论; 同时,对复杂的逻辑关系及符号含义,要做出准确的表述,帮助学生在有限的课堂教学时间内了解、体会相应的含义,并能进行熟练、独立的运用。
2.对于后续课程的具体教学内容,口语语言要亲切、生动
在针对特定的知识点的教学过程中,教师要通过口语设计,把抽象的数学理论转换为具体的形象感觉,并结合适当的现实案例加以说明。特别是抽象的概念,比如随机过程中“下鞅”、“上鞅”、“鞅”以及“遍历性”等概念,要努力避免平铺直叙、照本宣科地进行授课,而是把该概念与日常实例相结合。
该定理是其后重要结论的基础,具有重要意义,但其证明太过数学化,因此在课堂教学中,并不进行证明,而采用简明的语言来进行说明。对第一个不等式,可以强调为“在每个样本点上,取所有随机变量的最小值,做成一个新的随机变量,它的均值不会大于所有随机变量先做平均再取最小的那个值”,即“最小值的期望,小于等于期望的最小值”;从而整个定理叙述为“最小值的期望,小于等于期望的最小值,小于等于期望的最大值,小于等于最大值的期望”。
由此可见,在课堂教学过程中,通过语言设计来调动学生的积极性,再结合语音、语调、语速等变化来突出重点、强调难点、控制教学节奏,可以让学生更好地理解具体教学内容。
二、准确运用文字语言刻画基本内容
文字语言,是教学内容可视化的主要载体之一,是学生明确认知教学内容的主要途径。统计学专业教学的文字语言的“准确性”,应具有如下特点:
1.对于基础理论的教学,注重文字语言的“数学性”
由于统计学是以数学理论为基础的,因此,文字语言要符合数学描述的一般要求;同时,也要注重结合教学目的,进行适当的调整来强调重点。
比如,统计量的定义:“设x1,x2,…,xn为取自某总体的样本,若样本函数T=Tx1,x2,…,xn中不含有任何未知参数,则称T为统计量”。在该定义中,应当注意三个非常重要的细节:“x1,x2,…,xn”、“任何”和“未知”。如果在教学过程中,不强调这几个细节,就可能忽略了小标“n”这个已知参数,从而产生对统计量概念的混淆,影响对统计量“样本均值”的认识。
2.对于后续课程的案例教学,强调文字语言的“概括性”
统计学处理的是实际的、非数学的对象,特别是一些来自社会经济活动的、真实物理环境的或现实遗传学科的具体实例。此时的文字语言,不仅要具有抽象性,抛弃不必要、不相关的、过多的背景描述,还要朴实易懂,最大限度地概括试验的理论背景、数据的研究意义。其意义在于,既利于学生理解研究的问题,明确研究的目标,同时也为学生的思考留出相应的空间。
三、简明地运用符号语言,压缩复杂意义
符号,是一些基本概念、基本性质、运算法则的缩写;符号语言,就是利用基本符号,以简单、明确和形式化的方式来简化复杂关系及大量文字性描述。在形式上,符号语言可以简化计算和推理过程,明确其中的逻辑过程,展现其抽象性;在意义上,通过结合具体试验背景,符号语言精练了相关信息的描述,体现其简洁性。由此可见,符号语言对相应学科的发展、传播和普及都有重要的推动作用。
对统计学专业而言,其基础理论部分的符号语言基本与高等数学的符号语言是相似的,因此,在教学过程中,教师要有意识地训练学生对符号的灵活运用,并提及相应符号的意义。
对统计专业低年级学生,教师要通过符号语言的设计,消除学生对符号的陌生感,使学生牢固地掌握各类符号的意义,熟练地运用各类符号描述相对复杂的含义,并将复杂的文字性描述利用符号来进行简化描述,进而培养学生利用符号语言来压缩复杂意义的能力。
例如,在概率统计中,随机变量的期望EX是一个重要概念,通过不同的角度可以得到不同形式的符号描述。在符号语言下,概率空间记为Ω,F,P,随机变量记为X,对应的密度函数和分布函数分别记为px和Fx,从而随机变量的数学期望EX有如下表述记为
其中,EX是数学期望(expectation)的符号,第一个等式为实空间R中的数学期望描述,这是一般概率论中的结论;第二个等式为实空间中的一般随机变量的数学期望表达式;第三个等式则为在概率空间Ω,F,P中的描述形式,是Riemann-Stieltjes积分,这是在随机分析范围下常用的描述方式。因此,在教学过程中,教师应强调上述关系式的意义及使用范围。
再如Lindeberg-Levy中心极限定理:设{Xi}∞i=1是相互独立、同分布的随机变量序列,且EXi=μ,VarXi=σ2& gt;0都存在;若记Y*n = X1 + X2 + 上述定理中的符号沿袭了高等数学的符号方式,同时,将σn改写为nσ2,其目的在于强调正态分布关于参数μ和σ2的依赖关系。强调这种依赖关系,有利于学生对正态分布的掌握,进一步明确随机变量与其特征参数的关系,也为后续其他重要分布和统计量的学习奠定基础。
对统计学专业高年级的学生,教师要注意引导学生基于基本符号,在特定的实际问题中,创造性地定义一些新符号,并赋予明确的含义,从而把特定问题进行符号化描述,简化统计分析、推断过程。这里需要注意的是,所定义的新符号首先要遵循一般的符号原理与意义,不只是符号的数学意义,还有在特定问题下的符号意义;其次,满足问题分析的需要,充分利用特有名词的缩写、符号的上、下标等。
比如,在回归分析中,基于多变量的多项式回归模型中,因变量y关于自变量x1,x2的二元二次回归模型为:y = β0 + β1 x1 + β2 x2 + β11 x21 + β22 x22 + β12 x1 x2 + ε。在该表达式中,β的小标1、2分别代表与变量x1,x2有关,而重复出现的次数则表征了相应变量的阶数。因此,建议在教学过程中,对该类下表可以进行改进,比如将β12改记为β1,2,即下标中的“12”改为“1,2”,通过添加“,”进一步明晰变量的交互关系。
四、合理运用图表语言,明晰基本关系
图表语言,是利用图像、表格等直观的形象来描述复杂的概念、关系以及抽象数据所具有的含义。与符号语言的简洁和抽象相比,图表语言更具形象、直观的特性,能记录数量变化趋势、表达变量之间的关系以及展现概念之间的相关关系,因此,在统计学专业教学中,图表语言具有非常重要的意义与作用。
1.数据图表,记录数量变化趋势
数据图表,主要是对试验结果所获得的数据的形象表达,比如某地区的生产总值、居民消费额、空气中污染物含量等具体数据的excel表格或柱状图,以及对抽象数据处理之后所形成的频数直方图、频率直方图、盒子图等。依据不同的目的,选用不同的数据图表来说明进行统计分析的依据,并掌握进行统计推断的方向。
2.分析图表,表达变量之间的关系
分析图表,主要是指基于概率论与统计分析所得到的分析结论的图表,目的在于展示分析结论,进而解释变量关系。主要包括:(1)教材所附的典型分布的分布表,如正态分布表、F分布表、t分布表等;(2)数据分析表,如回归分析中所得到的Model Summery、ANVOA、Coefficients等;(3)结论预测表,如变量拟合图、时间序列分析表等。
3.关系图表,展现概念之间的相关关系
关系图表,主要是指为了那些抽象描述多个概念之间的相关关系,是对各种概念、方法、思想等的总体描述。从大的角度上讲,借助于关系图表,学生对统计学的发展、不同统计思想与方法间的异同等方面,会形成整体认识,常见于导论一类课程。从小的角度上讲,通过建立关系图表,学生可以进一步区分具体的概念,深化知识点的理解和运用。
五、巧妙运用肢体语言,深化教学效果
肢体语言,主要是指教师在教学过程中通过动作、姿势、表情等肢体的动作和变化来传达教学内容、实现教学目的的行为。首先,肢体语言具有形象、生动、操作性强;其次,易于学生的模仿与体会,以形成对抽象概念的形象认识;再次,可以很好地控制教学进程,如加速新课程的引入、教学内容的转换等。同时,可以活跃课堂气氛,调动学生的积极性,传递教师对学生的关怀。
总之,教学设计是指为实现教学目标,教师依据学习原理和教学理论,对各个环节进行具体计划,进而形成完整、有效的教学方案的过程。为了充分、有效地利用课堂教学,教师应该运用多种方法和技巧来实现与学生的交流。因此,教学语言的设计就显得更为重要。通过不断地研究与实践,教师的教学语言设计能力将会得以丰富和提高,取得事半功倍的效果。
随着社会的发展,大数据时代的到来,统计思想与技术日益受到重视,统计人才更是供不应求。为更好地培养社会所需的专业技术人才,作为统计学专业的教师,在日常的教学过程中,应该深刻地考虑教学语言的设计,从而更好地实现教学目标,努力做到知识、技术、思想的传播,也做到人文关怀的传承,培养出一批具有社会责任感的专业人才。
统计学参数概念范文2
自从Paelinck提出“空间经济计量学”这个术语,Cliff和Ord(1973,1981)对空间自回归模型的开拓性工作,发展出广泛的模型、参数估计和检验技术,使得经济计量学建模中综合空间因素变得更加有效。
Anselin(1988)对空间经济计量学进行了系统的研究,它以及Cliff和Ord(1973,1981)这三本著作至今仍被广泛引用。Anselin对空间经济计量学的定义是:“在区域科学模型的统计分析中,研究由空间引起的各种特性的一系列方法。”Anselin所提到的区域科学模型,指明确将区域、位置及空间交互影响综合在模型中,并且它们的估计及确定也是基于参照地理的(即:截面的或时-空的)数据,数据可能来自于空间上的点,也可能是来自于某个区域,前者对应于经纬坐标,后者对应于区域之间的相对位置。
国外近几年空间经济计量学得以迅速发展,如Anselin和Florax(1995)指出的,主要得益于以下几点:
(1)人们对于空间及空间交互影响的作用的重新认识。对空间的重新关注并不局限于经济学,在其它社会科学中也得以反映。
(2)与地理对应的社会经济大型数据库的逐步实用性。在美国以及欧洲,官方统计部门提供的以区域和地区为统计单元的大型数据库很容易得到,并且价格低廉。这些数据可以进行空前数量的截面或时空观测分析,这时,空间(或时空)自相关可能成为标准而非一种特殊情况。
(3)地理信息系统(GIS)和空间数据分析软件,以高效和低成本的计算技术处理空间观测的发展。GIS的使用,允许地理数据的有效存储、快速恢复及交互可视化,为空间分析技术的艺术化提供了巨大的机会。至少目前线性模型中,缺少针对空间数据和空间经济计量学的软件的情况已经大为改观。目前已有一些专门的空间统计分析软件,并且SAS、S-PLUS等著名统计软件中,都已经包括用于空间统计分析的模块。
(二)空间经济计量学与相关学科的关系
空间统计学是研究空间问题的另一门学科,它是应用数学的一个快速发展的分支。它起源于20世纪50年代早期,用以帮助采矿业进行矿藏量的计算。最早的工作是采矿工程师D.G.Krige和统计学家H.S.Sichel在南非进行的。70年代随着计算机的普及以及运算速度的大幅提高,空间统计分析技术逐渐扩展到地球科学的其它领域。目前已经普遍存在于需要处理时间上或空间上相关的数据的科技领域中。
空间经济计量学与空间统计学的区分不太容易。Haining和Anselin的观点认为空间统计学的研究大多由数据驱动,而空间经济计量学由模型驱动,即从特定的理论或模型出发,重点放在问题的估计、解释和检验上。空间统计学的主流是研究生态学和地质学中的物质现象,空间经济计量学主要研究与区域及城市经济有关的模型。有一种观点认为二者的区分应基于作者将其工作对应于空间经济计量学还是空间统计学,这种区分办法可能较为简单。
地质统计学(Geostatistics)发展于20世纪60年代,主要用于研究地质学现象的空间结构和进行空间估值。例如,在探矿过程中,通常是在空间上布点进行钻探,然后对采样得到的样品进行分析,估计矿藏的分布和储量。由于矿藏不开采的话,在时间上结构几乎是不变的,因此地质统计学研究的问题主要是空间相关。空间经济计量学所研究的问题不仅存在空间相关,往往所研究的问题在时间上也存在相关。
在区域经济学的理论中,人们建立了各种理论以及关系式来描述人类在空间上的行为,如研究城镇问题的“引力模型”等。但在利用模型进行定量研究问题的时候,需要将理论或关系式用数学模型来进行刻划,利用统计方法对模型进行估计、检验,并进行评价,这些正好是属于经济计量学研究的范畴。应该说,空间经济计量学主要研究区域经济问题,依据的是区域经济学理论,但它还需要综合数学,以及空间统计学等学科,因此它不等同于区域经济学,而是一门交叉学科。
二、研究的问题
空间经济计量学主要研究存在空间效应的问题。空间效应主要包括空间相关和空间差异性。在研究中涉及空间相邻、空间相邻矩阵等概念。
(一)空间相关
空间相关指在样本观测中,位于位置i的观测与其它j≠i的观测有关,即
存在空间相关的原因有两方面:相邻空间单元存在测量误差,空间交互影响的存在。测量误差是由于调查过程中,数据的采集与空间中的单位有关,如数据是按省、市、县等统计的,但设定的空间单位与研究问题不一致,存在测量误差。
空间相关不仅意味着空间上的观测缺乏独立性,并且意味着潜在于这种空间相关中的空间结构,也就是说空间相关的强度及模式由绝对位置和相对位置(布局,距离)决定。
对于空间相关,空间自回归通常是其核心内容,空间自回归模型的一般形式为:
在这个模型中,β解释变量X(n×k矩阵)的参数向量(k×1),ρ是空间滞后相关变量的参数,λ是残差空间自回归(空间AR)结构中的参数。
W[,1]和W[,2]为n×n矩阵,是标准化或未标准化的空间加权矩阵,分别对应于因变量以及扰动项中的空间自回归过程,这两个矩阵可以不同,这意味着两个过程由不同的空间结构生成。
这个模型可以退化成为普通的线性回归模型、(纯)空间自回归模型、混合回归与空间自回归模型、残差空间自回归模型等形式。
对这个模型,普通最小二乘估计不仅是有偏的,而且是不一致的,参数的估计通常采用极大似然估计,近几年,有学者尝试采用贝叶斯估计对参数进行估计。
(二)空间差异性
空间差异性指空间上的区域缺乏均一性,如存在中心区和郊区、先进和后进地区等。例如,我国沿海地区和中西部地区经济存在较大差别。
对于空间差异性,只要将空间单元的特性考虑进去,大多可以用经典经济计量学方法解决。但当空间差异性与空间相关共同存在时,经典经济计量学方法不再适用,而且这时问题可能变得非常复杂,因为这时要区分空间差异性与空间相关可能非常困难。
研究空间差异性的模型主要有:
E.Casetti提出的空间扩展模型(1972)和回归参数漂移分析方法(简称DARP)模型(1982)。这时,空间差异性表现为模型参数随空间位置变化,并以空间单元的位置信息作为辅助变量(称为扩展参数)。
y=Xβ+ε
模型(3)为以经纬坐标(Z[,x],Z[,y])作为扩展参数的空间扩展模型。同样可以以到中心区域的距离作为扩展参数设计模型。
将模型(3)的第二个式子右边加入随机扰动项,则为DARP模型。E.Casetti(1992)进一步提出了贝叶斯空间扩展模型。
D.P.McMillen和J.F.McDonald(1997),C.Brunsdon
,A.S.Fotheringham;MartinCharlton(1996),提出地理加权回归模型(简称GWR模型)。
(三)时空数据空间模型
在模型中考虑时间维增加了描述的复杂性,但综合时间空间的模型在实际工作中非常有用。在经典的经济计量学模型中,这是综合截面和时间序列数据的情形。如果数据不存在空间相关,则可以采用PanelData模型。Anselin(1988)将似不相关(SUR)模型扩展到空间的情形,提出空间SUR模型。
三、应用前景及需要进一步研究的问题
(一)在中国的应用前景
在我国,地质统计学是较早应用空间统计学的领域,在20世纪80年代中国科学院就有人研究并应用Krige模型。空间统计学除了在地质学的研究中发挥作用,近十年来,周国法、徐汝梅等学者研究生态学中的空间相互作用,并于1998年出版了《生物地理统计学》。20世纪80年代以来,我国利用卫星遥感技术,对土地、森林、农业、矿产、能源、作物估产、灾患检测等进行应用,开始了我国空间统计学在经济领域应用中统计调查的工作,为了将空间遥感调查技术逐步纳入到我国统计的常规性工作中,1998年10月,国家统计局成立了空间统计研究室,并与中国科学院地理所合作,组成了“空间信息多重采样设计的空间统计学应用研究”课题组,运用遥感技术和空间分析对我国农业耕地、森林、草地等资源以及城镇动态变化进行调查,该项目获得国家统计局2000年课题研究一等奖。
在我国地质统计学、生物地理统计学及利用遥感技术进行的各种调查,都属于空间统计学的范畴。地质统计学、生物地理统计学主要研究空间相关及空间估值,在生物地理统计学的研究中还包括物种的空间扩散过程。所用的方法主要是各种Krige模型、方差图模型,以及空间自回归模型。空间动态采样的研究,与地质矿产调查类似,主要涉及样本在空间上的布局、有效样本量的确定、采样误差的计算等问题的研究,根据其研究的问题和方法,也可以将其归入统计学的抽样调查分支之中。
随着我国按地区进行统计的统计基础资料不断积累,尤其是遥感技术应用到统计调查中来,都将使得按时间和空间排列的数据资料极为丰富,对数据进行空间甚至时空分析成为可能,人们将逐渐从时间的角度转向普遍从时空的角度来考虑问题。
从经济分析的角度看,空间经济计量学在我国以下几个方面将有很大的应用前景。
由于区域之间存在相关性,或者存在差异性,因此一项政策对每个区域的影响是不同的,通过运用空间经济计量学方法对各区域进行研究之后,找到政策在各区域上作用的关系,对于政府决策、正确制订政策具有很大的参考价值。
由于区域之间存在先进地区和后进地区,通过空间经济计量学方法可以对先进地区与后进地区之间的相互关系进行研究。
按区域编制投入产出表时,空间的概念将发挥作用。
对房地产的价值进行评估时,在考虑外界影响因素的基础上,充分考虑地区之间的相互关系,将对正确评估房地产的价值有很大帮助。
对环境污染进行研究时,运用空间经济计量学方法对污染的传播方式进行研究,有助于人们对环境污染进行控制。
在交通领域的研究,可以利用空间经济计量学方法对人员、货物在空间上的流动方式进行研究,同时对通道上的不同区段进行研究。
在对某种疾病(如流感)在空间上的传播过程进行研究之后,对于疾病的预防控制将有很大的帮助。
建立了空间的概念之后,人们对于在空间上的抽样将综合考虑空间单元之间的相关性。而空间抽样在空间上的布点方式也可以用作商业网点的布局研究。
总之,只要问题涉及到空间的概念,空间经济计量学就将发挥其作用。对空间经济计量学的深入研究及应用,将促使人们面对问题的时候,从空间或时空的角度思考问题。
(二)需要进一步研究的问题
目前的研究中,系统内的空间单元受到系统内其它位置单元的影响,但边界处的单元还受到系统外与之相邻的单元的影响,如何将这个影响考虑在模型中值得研究。
在具体问题中,距离的概念需要加以认真对待,单用地理上的距离有时并不合适,例如国与国之间的经济联系在今天并不是距离远近决定的,电子化交易使得资金的流动非常迅速方便,因此,在研究这类问题时,如何将贸易、人员、资金的流动充分考虑到空间加权矩阵中去,尚值得研究。
贝叶斯方法在统计学各个分支的应用越来越广,空间贝叶斯模型也是目前空间经济计量学研究的热点之一。
可变单元的问题。当数据汇总的级别变化,可能整个模型的描述都发生变化,对于不同的问题,可能影响模型变化的汇总的级别也不同,能否有一个统一的模式对系统进行描述尚待进一步研究。
时空数据的综合分析,参数估计的渐近性质,模型的各种检验方法等,还有待进一步的研究。
统计学参数概念范文3
关键词: 医学硕士;学位论文;数理统计;调查
摘 要:目的 分析医学硕士研究生学位论文中数理统计应用情况. 方法 随机抽取2000/2001年100位河南医科大学应届医学硕士学位论文初稿,对其中数理统计应用情况进行统计分析. 结果 论文中采用单因素设计者占94.0%,多因素设计占6.0%,应用正确率为96.6%;论文中使用经典基本数理统计方法为97.9%,统计学方法的正确应用率为75.7%;应用参数统计时出现的主要问题是未进行适用条件判断,而应用非参数统计时出现的主要问题则是推断结论有误. 结论 应加强硕士学位论文的数理统计设计和审查工作.
Keywords:medical master graduates;thesis;statistics;in-vestigation
Abstract:AIM Analysis case of using statistical theory in the thesis of2000~2001master graduates.METHODS 100thesis of this year’s medical master graduates in Henan Medi-cal University were taken out randomly.Their theoretical scores and practical application of health statistics in their thesis were analyzed.RESULTS Master graduate has grasped the theory of health statistics preferably.The abso-lute majority,namely97.9%of the total students,have used the basic statistic method in their thesis,75.7percent could use statistic method correctly.The main problem arising in using parametric test is that they hadn’t judged the applying condition,while in non-parametric test is that the conclusion is wrong.CONCLUSION Ought to strengthen checkup health statistical in the thesis of master graduates.
0 引言
数理统计的应用正确与否是论文科学性的重要标志.近年在医学学术期刊(包括国内著名的核心期刊)上发表的论著,数理统计方面还存在问题,甚至导出错误的结论[1-4] .数理统计作为一门应用学科已成为医学硕士研究生学位课程的主要内容之一,越来越受到硕士研究生的重视.为了解医学硕士生学位论文中数理统计的应用情况,为课题的统计设计和论文审查提供科学依据,为教学改革提供参考,作者随机抽取河南医科大学应届硕士学位论文100篇,对其数理统计应用情况进行分析.
1 材料和方法
2000/2001年河南医科大学共有医学硕士研究毕业生222人,应用随机数表随机抽取100名硕士研究生学位论文的初稿作为研究对象,对实验设计类型、使用的统计学分析方法及使用的统计学工具,存在的问题等进行调查.结果推断利用SAS(6.12)统计分析系统进行分析.
2 结果
2.1 实验设计类型 硕士学位论文中采用单因素设计的比重较大,占94.0%,统计学设计正确率较高(Tab1).
2.2 统计学方法 论文中使用经典的基本统计学方法的占绝对多数,为97.9%(856/874),统计学方法的正确应用率为75.7%,且不同的统计学方法之间的正确应用率存在着差别.应用参数统计方法者518次,应用正确者357次,正确应用率为68.9%;应用非参数统计方法者346次,应用正确者305次,正确应用率为88.1%.对参数统计方法的正确应用率低于非参数统计方法(χ2 =35.8,P
表1 硕士论文的实验设计类型及正确应用情况 略
表2 论文中应用的统计学方法分布及正确应用情况 略
表3 获取结果时使用的计算工具 略
2.3 数理统计问题 论文中存在的问题在参数统计与非参数统计中的构成不同,应用参数统计时出现的问题是未进行使用条件判断者159次,未正确应用统计方法者9次,推断结论有误者19次;而应用非参数统计时出现问题是未进行使用条件判断者8次,未正确应用统计方法者14次,推断结论有误者21次(两者相比χ2 =48.31,P
3 讨论
在硕士研究生的基础理论教学中,开设数理统计学的主要目的是为了指导研究生正确地应用统计学的原理与方法,解决医学研究中如何科学地进行科研资料的搜集、整理和分析推断问题.传统的经典的和基本的统计学理论与方法仍然是当前硕士研究生进 行科研工作的统计学方面的主要工具.论文中采用的完全随机、配对及配伍等单因素设计的比重较大占94.0%,多因素设计占的比重较少为6.0%,总的来说,其统计学设计的正确率是比较高的.说明学生对统计学设计理论比较重视并能正确应用.论文中使用经典的基本统计学方法占绝对多数为97.9%(856/874),主要为t检验、F检验、χ2 检验及秩和检验等,这与这些方法成熟、简单明了且实用性极强有很大关系,而近些年来新发展的比较前沿的统计学分析方法[5-12] ,由于对设计要求严格,使用过程复杂,非专业人员在短时间内难以掌握而实际应用较少.这提示在今后的研究生教学过程中,除应继续进行基础部分内容的学习外,还应加强新的统计学方法和使用条件的教学力度.
论文中以基本的经典的统计学方法为主,但实际应用时的正确应用率仅为75.7%,且不同的统计学方法之间的正确应用率存在着差别,对参数统计方法的正确应用率低于非参数统计方法.经进一步分析,应用参数统计时出现的主要问题是未进行适用条件判断,而应用非参数统计时出现的主要问题则是推断结论有误.作为一门应用学科,数理统计学有着其独特的逻辑性,概念多、公式多且连贯性强,众多的公式和分析方法既有联系又有区别,同时有着严格的适用条件.传统的教材编写和教学重点是统计学方法的计算技巧,其结果容易将学生引导到仅注重学习统计计算方法上,忽略了各种方法的适用条件和对资料的综合分析.所以t检验、F检验等经典的统计方法虽看似简单,但要正确应用到实际工作中,对学生来说仍有相当难度.秩和检验等非参数统计由于其适用条件较参数统计宽松,使得其正确应用率高于参数检验,而并非学生对非参数检验掌握的比参数检验更好.
随着计算机技术和统计软件的完善与普及,各种复杂的统计计算不必再用手工计算.本次研究表明大部分人(91.0%)通过应用著名的统计分析软件SPSS及SAS获取结果,这些结果比手工计算的更准确、更规范,所以各种统计方法的计算过程大可不必细致介绍,而要重点介绍各种数理统计方法的使用条件,加强资料分析实践,提高硕士生解决实际问题的能力.
参考文献
[1]Wang GS,Qian GS,Yang XJ,Huang CJ,Wei H.The statis-tics of application of laboratory animals in clinical research pa-pers in China [J].Di-san Junyi Daxue Xuebao(Acta Acad Med Militaris Tertiae),1997;19(2):163-165.
[2]Chen P,Zu SX.The analysis of statistical techniques used in the Chinese journal of clinical medicine [J].Anhui Yike Daxue Xue-bao(Acta Univ Med Anhui),1998;33(2):108-110.
[3]Fang JQ,Ling L,Zhang MR.Frequently appearing statistical mistakes in recent medical articles and relevant suggestions [J].Zhongshan Yike Daxue Xuebao(Acad J Sun Yat-sen Univ Med Sci),1999;20(4):314-318.
[4]Wang Q,Zhang BH.Current use of statistical methods in five core Chinese medical journals [J].Zhonghua Yixue Zazhi(Natl Med J China),1998;78(3):230-233.
[5]Zhang GK,Yao C,Xu YY.Contrast between two schools of thought on hypothesis test [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(2):85-87.
[6]Shang L,Xu YY,Hou RL,Zhang SP,Zhou YR,Chen CS.Comparison of different approaches of fitting centile curves for growth standard [J].Di-si Junyi Daxue Xuebao(J Fourth Mil Med Univ),2000;21(6):676-678.
[7]Li XS,Ni ZZ.On the problems of fitting linear regression mo-dels for hierachically structured data in medical research [J].Huaxi YikeDaxueXuebao(J WestChina Univ Med Sci),1999;30(1):59-62.
[8]Li XS,Zhang WT,Ni ZZ.Multilevel models in analysis of crossover design [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(5):273-275.
[9]Li XS,Liu QY,Ni ZZ.Meta analysis using multilevel models [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999:16(3):133-135.
[10]Sun XW,Fang JQ,Yang XF.Number-theoretic method for pa-rameters estimation in multivariate nonlinear regression with ap-plication [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(1):6-7.
统计学参数概念范文4
【关键词】经济类非统计专业 统计学教学
统计学是一门研究统计活动规律和方法的方法论科学。统计学是经济类各专业的主要课程或主干学科,几乎所有的专业都把统计学作为一门专业基础课来开设,以便为学生进行专业研究时提供一种可行的定量分析工具。而面对不同层次的教学对象,不同专业的教学需求,统计学课程教学过程面临诸多挑战。
一、教学中存在的一些困难与问题
统计学实际教学效果并不理想,不少学生认为统计学概念多,公式多,十分枯燥,比较难学,并且在实际中没什么用处。本文主要从一个教师的角度对目前经济类非统计专业的统计学教学存在的问题进行探讨。
(1)对于非统计专业的学生来说,他们本身的专业课学习负担已经不轻, 加上对统计知识的认识不够, 让他们腾出更多的时间来学习统计知识是很难做到的。 而且,由于其本专业的课程体系要求,学生本身的数学基础特别是概率论知识学得又不是很好,这就使得他们感到统计学知识难以理解,出现了统计难学的看法,最终导致一些学生彻底放弃。 这样,学生在认识不到统计知识用处的情况下, 所学又和实际结合不紧密。 容易产生学统计无用的想法,学习兴趣不高,以至于被迫学习,教学效果不佳。
(2)在实际教学中,由于各种条件所限,教学方式还局限在传统的教学手段上。随着计算机的普及, 有关数据处理的软件也越来越多,统计学的教学手段也应该日新月异。 多媒体教学使得教学信息量有所增加, 但是并没有改变传统的教师讲、学生听的教学方式,往往是一节课下来,教师讲的嗓子冒烟,学生听得直打瞌睡,究其原因还在于过于单一的教学手段, 使得学生不能直接参与到教学中去。
(3)教学定位不清楚。统计学教学分为统计学专业的统计学教学和非统计专业的统计学教学。对统计学专业的学生而言要求他们掌握一整套系统的统计学分析方法,以便将来专门进行有关数据的研究;而对绝大多数非统计专业的学生来说,学习统计学主要是为他们提供一种统计学的思想, 在信息社会,如何辨别信息的真伪,做出判断和决策,这都需要他们具备一些统计学的思想;其次是给他们提供一些实用的数据处理方法。 可是不少学校的非统计教学由于定位不清楚, 导致教学过程中还是充斥着大量的公式推导和概念阐述,如不少统计学教材上大篇幅介绍统计图表, 并对其进行比较, 可是对于如何利用计算机软件画出这些图表却没有阐述。 其结果是学生学完了统计学后只记得一些概念,而具体如何收集、整理、分析数据,并做出图表却一无所知, 结果是不少学生得出《统计学》难学也没什么用的结论。
二、教学方法与教学手段的更新
(1)合理地安排教学内容
经济类非统计专业统计学教学的主要目的是通过学习统计学使学生具备在随机性事物中寻找规律的能力,以及懂得如何在生活、学习、工作中运用统计学知识。 因此在教学内容的选择上也应该有所取舍。整个统计学的教学应该按照收集数据、整理数据和分析数据的步骤进行。其主要内容还是包括描述统计和推断统计两部分,而重点应加以调整,应以推断统计为主,描述统计为辅。 在描述统计部分,着重介绍搜集、整理、分析数据的方法。 在推断统计部分,不仅要介绍抽样推断、参数估计、假设检验、方差分析和回归分析,还应该介绍关于统计决策、多元统计分析和非参数统计等现代统计方法。 计算机的飞速发展给统计学的发展带来了前所未有的突破。 统计学常用的软件是 Excel 和 SPSS, 为了让学生更多了解统计学方法在实际中的应用,因此实践课程的加入是必须的。实践课程中介绍这些软件的使用方法, 使得统计学不在是高高在上的阳春白雪,成为可以随时接触的、使用的工具。
(2)采用多样化的教学手段
统计学能否引起学生的兴趣 ,教学手段多样化也是一个关键的因素。 因此,当务之急是改变当前单一的教学手段,使用多样化的教学手段。 首先,在教学过程中,将传统的“灌输式”教学转变为“启发式”教学。 充分调动学生的积极性,在课堂中应将讲授式教学法、启发式教学法和讨论式教学法相结合,相互取长补短,以达到更好的效果。其次,由于统计学内容的繁多与复杂,适当加入学生的环节可以增强学习的主动性。例如让学生用软件设计问卷, 对自己收集的数据进行简单的分析,写出分析报告。 最后,统计学是一门实践性、应用性很强的学科,应该加强教师和学生之间的互动和交流, 因此在教学中利用计算机辅助教学,加大实践教学的比重。 这样,既便于进行案例教学、小组讨论,也便于调动学生学习的积极性,使每个学生都能参与到教学中去,真正做到“教学相长”。
(3)部分内容采用实践教学和灵活的考核方式
单纯的笔试往往使学生认为考试为大, 别的都是次要的,重点在于考试前死记硬背,而对于是否掌握知识没有兴趣。实践教学一定比例的加入必然要求考核方式的多样化。 因此,单纯进行笔试考试改革势在必行。并且统计学中的一些内容,例如推断分析、方差分析和回归分析等不借助计算机很难在笔试中实现甚至没办法实现,导致的结果是重要内容没办法考,能考的内容有可能反而不重要。 因此,必须采用灵活多样的考核方式,尤其是以实践教学为主的考核方式势在必行。
三、结语
总之,在对经济类非统计专业的统计学教学中,教师应充分调动学生学习的积极性。 不仅需要教师在选择教学内容的时候要紧密联系实际, 还要求教师要全方位的展示统计学的魅力,增加实践课时,让学生充分理解统计无处不在、无处不用。 其次, 教学手段与方式的选择也起到事半功倍的作用。 统计软件的应用、统计案例的讲解,完全可以使统计学成为人人喜欢学习的一门数据处理的工具。
参考文献:
[1]王来栓.财经院校非统计专业统计学教学法探讨,内蒙古统计[J].2013(06).
[2]董瑞.]经管类专业统计学教学改革的背景与设想.河南科技学院学报[J].20 l1(06).
统计学参数概念范文5
Abstract: The variable is in a statistics basic category, but each kind of statistics teaching material is different to its definition, creates the understanding confusion; The author unified the teaching experience to carry on the thorough ponder to the variable concept, caused its better and better by the time.
关键词:变量标志统计指标统计数据
Key words: Variable Symbol Statistical target Statistical data
作者简介:鲁瑜,女,1963年9月出生,讲师。籍贯:安徽省桐城县,出生地:河南省洛阳市。1986年洛阳大学计划统计专业专科毕业,1997年中南财经政法大学财务会计学本科毕业,2007年西安建筑科技大学工业工程硕士毕业。研究方向为统计核算、企业会计。
那么统计学中讲的“变量”该如何理解呢?变量的概念是发展变化的,按发展变化的时序有以下几种理解:第一、统计中的变量是指可变的数量标志;第二、变量是指可变的数量标志和全部统计指标;第三、变量是指可变的数量标志和可变的统计指标;第四、变量是说明现象某种可变特征的概念,更明确一点,即:变量包括可变的品质标志和可变的数量标志和可变的统计指标。普遍的认为第四种理解更符合客观实际,笔者也赞同第四种理解。
一、统计中的变量是指可变的数量标志这种理解较狭隘,通过讲解引入可变的品质标志也是变量,即“可变的标志”都应作变量看待。
一般变量的讲解是这样进行下去的:首先明确统计学中的几个基本概念,三对六个:第一对是统计总体和总体单位,简称总体和单位;第二对是统计标志和统计指标,简称标志和指标;第三对是变异和变量。总体是所研究对象的全体,是由具有某种共同性质的许多个体所构成的整体,构成总体的各个个别单位,简称单位,也称个体,总体和单位的概念是随着研究目的的不同而发生变化的;标志是说明单位特征的名称,强调单位是标志的承担着,指标是反映现象总体数量特征的概念或名称和具体数值(指标名称+指标数值构成完整的统计指标,但只有概念或名称的指标是统计设计和统计理论中使用的指标概念),是综合各单位的某一标志而得到的,通过对指标概念的理解,首先明确指标是说明总体的,其次明确指标都是用数值表示的,没有不用数值表现的统计指标,这是指标和标志的区别之一,由于总体和单位之间存在着变换关系,标志和指标之间也会发生变换;变异和变量,我多年的教学经验通常是通过对标志的分类讲下去的,标志按在总体单位上的表现是否稳定可分为不变标志和可变标志,一个总体中,各个单位的某一标志的具体表现都相同的标志为不变标志(强调同质性),一个总体中,各个单位的某一标志的具体表现不都(尽)相同的标志为可变标志(强调变异性),如人口总体性别是可变标志,男性人口总体性别就是不变标志;可变标志在总体各个单位上具体表现上的差别就是变异,变异有品质变异和数量变异,如人口总体性别就是品质变异,年龄就是数量变异,数量变异也称变量,即可变的数量标志称为变量,变量的具体取值为变量值。很显然,通过以上的讲解,通常认为变量是指可变的数量标志,即第一种变量的概念。
这种理解,未免太过于狭隘。教师若以此思想去指导教学,难免会陷入不能自圆其说的境地。我们知道,一切总体单位都具有属性特征和数量特征,统计学中将其称为品质标志和数量标志。例如人口总体,这些特征可能是性别、民族、籍贯、文化程度,也可能是身高、体重、年龄、工龄等。对统计研究对象而言,无论其属性特征还是数量特征,往往均具有可变性。并且一个具体的特征可能在一种场合是可变的,而在另一场合是不变的。例如,上述所说人口总体性别是可变标志,男性人口总体性别就是不变标志了。可见性别这个品质标志有时也是可变的。推而广之,品质标志也具有可变性。这样,凡是“可变的标志”都应作变量看待。
然而,这只是对总体内部各单位的差异作静态考察时的变量。如果仅仅把变量定义为“可变的标志”,那么可变的统计指标怎么解释?它是否属变量范畴呢?所以,还得对统计总体作考察。
二、变量是指可变的数量标志和全部统计指标这种理解也不准确,不是所有的统计指标都是变量,通过讲解引入可变的统计指标才是变量,即只有“可变的统计指标”才应作变量看待。
统计有数量性、总体性、具体性和社会性的特点(《基础统计》,梁前德主编,高等教育出版社,2000年8月第1版),由统计的具体性可知,统计所研究的社会经济现象的数量方面是具体的量,是具体的社会经济现象在具体时间、地点、条件下的数量表现、数量关系和数量界限。例如,甲公司2005年的销售收入60亿元就是一个统计指标,而且是具体的、唯一的数值。对于2005年的来讲,销售收入这个指标只有一个数字。因而并非所有的统计指标都是变量。但是若把甲公司2005年至2008年的销售收入60万元、69万元、80万元、84万元依次排列,这时销售收入就是一个变量。可见,只有当同一统计总体的同一指标在不同时间的指标数值形成数列时,统计指标才可能成为变量。
因此,从静态上看,某总体的某一统计指标是常量,但把若干总体的同一指标放在一起,指标就变成变量了。例如,以洛阳市为总体时,2005年各公司销售收入指标是各不相同的,它是一变量。从动态上看,我们常常使用时间数列来处理统计数据,时间数列中的指标数值往往随时间变化而变化。如上,这种不断变化的指标也是变量,前后不同的指标数值就是变量值。可见,统计指标也有可变与不变之分,因而,“可变的统计指标”才应看作变量。
上述第二种观点是把全部统计指标视为变量了,但不是所有的统计指标都是变量,只有可变的统计指标才是变量,因而我认为是不妥的。第三种观点倒是把可变的统计指标视为变量了,但未包括可变的品质标志因而我认为也是不妥的。第四种观点我认为比较可取,但在文字表述上还可进一步具体化,由于说明现象某种特征的概念可以是标志(说明总体单位的),也可以是指标(说明总体的),因而我们不妨对变量作如下明确的定义:所有可变标志和可变的统计指标都是变量,即变量是说明现象某种可变特征的概念。
三、变量的分类:
(一)变量按具体表现不同分为分类变量(品质变量)和数值变量(数量变量)。
分类变量是用于说明事物所属类别方面的可变特征的变量,分类变量具体表现为分类数据,它又可以分为定类变量和定序变量。定类变量是用于区分现象不同类别的变量,它的取值表现为定类数据(如产业部门)。定序变量是说明现象的有序类型的变量,它的取值表现为定序数据(如产品的质量等级)。数值变量是用于说明事物数值方面的可变特征的变量,数值变量具体表现为数值数据,按数值数据的性质不同它可以分为定距变量和定比变量。定距变量是用于测度事物次序之间的距离的变量,它的取值表现为定距数据(如考试分数)。定比变量是说明现象的比例数据的变量,它的取值表现为定比数据(如体重)。
(二)变量按所使用的测量尺度不同分为定类变量、定序变量、定距变量和定比变量。
四种变量的概念已如上所述。四种变量对事物的反映是由低级到高级,由粗略到精确逐步递进的,高级变量能转化为低级变量,但不能反过来。如可将考试成绩百分制转化为五分制,但不能反过来。另外,四种变量适合于不同的统计计算方法。定类变量适合计算频数、频率、x2检验、列联相关系数等;定序变量适合计算中位数、四分位差、等级相关、非参数检验等;定距变量适合计算算术平均数、方差、积差相关、复相关、参数检验等;定比变量适合所有的统计计算方法。几乎所有的物理量和绝大多数经济量都属于定比变量。因此,不仅可以计算总量指标反映它们的总规模、总水平,还可以计算相对指标和平均指标反映它们的相对水平和一般水平。
(三)数值变量按变量取值是否连续分为连续型变量和离散型变量。
连续型变量是指可取无穷多个值,其取值是连续不断的,不能一一列举。它是用测量或计算的方法取得的数据,如温度、身高等。离散型变量是指只能取有限个值,而且其取值都是从整数位数断开,可一一列举。它只能用计数的方法取得的数据,如企业数、人数等。
(四)数值变量按性质不同分为确定性变量和随机变量。
确定性变量是具有某种或某些起决定性作用的因素致使其沿着一定的方向呈上升、下降或水平变动的变量,如我国国民经济总是不断发展的,具体表现为各种经济指标数值上升或下降(如人均收入和单位能耗),虽然也有些波动,但变化的方向和趋势是不可改变的,这些经济指标就是确定性变量。随机变量是指受多种方向和作用大小都不相同的随机因素影响,致使其变动无确定方向即呈随机变动的变量,如,在正常情况下某种机械产品的零件尺寸就是一个随机变量。
总之,统计学是一门逻辑严密的传统学科体系,作为统计学中几个基本概念之一的变量应有一个公认的正确的解释。这对今后统计学理论的研究发展都是很重要的。
参考文献:
[1]王军虎主编.统计学基础[M].武汉:武汉理工大学出版社,2007年7月:10
[2]梁前德主编.基础统计[M].北京:高等教育出版社,2000年8月:6~9
[3]高凯平.关于社会经济统计学原理中变量概念的思考[J].山西财政税务专科学校学报.1999(6)
统计学参数概念范文6
关键词 抽样极限误差;;区间估计
中图分类号C8 文献标识码A 文章编号 1674-6708(2011)50-0079-02
1 问题提出
抽样调查是统计非全面调查中的一种重要方法,以其方法的科学性、样本的随机性、调查的经济性、推断的准确性以及时效性强在统计调查工作中被广泛采用。抽样调查的目的在于抽样推断,抽样推断这部分内容教材中公式众多,推导过程繁杂,学生普遍反映难以理解与掌握。加之,在讲授这部分时,由于涉及到数理统计的很多知识,包括大数定律、中心极限定理等,对于高职高专学生来说学习起来非常困难。
在统计学教材中,抽样推断这一章内容的安排一般分为4部分: 首先介绍抽样调查的意义、特点,抽样中的基本概念和指标;再介绍抽样的理论依据( 大数定律、中心极限定律);第三步讲解抽样平均误差和抽样极限误差;最后是区间估计和必要的抽样单位数。对于教材这样的安排,在教学过程中往往存在的问题是,抽样推断的原理与抽样平均误差、抽样极限误差及区间估计之间内容不连贯、有脱节。学生对于怎样计算抽样平均误差和抽样极限误差及如何进行区间估计按照讲解程序都会算出结果,但是它们之间的关系没有彻底理解,可以说只是比着“葫芦画瓢”,没有真正理解抽样推断比其他非全面调查的科学性高在何处。
2 由对的理解引出抽样推断的核心内容――区间估计
抽样推断的核心内容就是区间估计,而区间估计必然用到抽样极限误差,由于抽样极限误差的抽象性和部分教科书对这部分内容的论述不完善,使学生学习起来很难掌握,特别是对于没有概率论基础知识的学生来说更是如同雾中探路,如何正确的引导学生,将会影响到后续内容的学习。要想让学生掌握并理解抽样推断,我认为教师在授课过程中更应理顺教学思路,注重思路的讲解,特别是以的讲解为突破口,帮助学生理清各种关系,更好的掌握抽样推断。
1)总体思路如图1所示:
具体思路分析:
(1)讲清3个抽样误差
抽样调查是以少量的样本数据信息推断大量的总体数量特征,必然存在着误差问题。抽样误差是指由于随机抽样的偶然因素的作用使样本结构不足以代表总体结构,而引起抽样指标与全及指标之间的绝对离差。抽样误差又包括三种形式:抽样实际误差、抽样平均误差和抽样极限误差。抽样实际误差是指某一次抽样结果所得到的样本指标与总体指标数值之差。并且,因为在抽样过程中总体参数总是一个未知的常数,所以,样本估计值与总体参数的真实值之间即抽样实际误差究竟有多大的差距,实际上是无法得知的;同时,由于样本估计值是一个随机变量,它随着每次抽出的样本不同而不同,某一次抽样结果的误差,仅仅是反复抽样中一系列抽样结果可能出现的误差数值中的一个,显然不能用它来概括一系列可能抽样结果所产生的所有实际误差。科学的方法应该是从整体考虑,采用抽样平均误差,作为参数估计的抽样误差大小的尺度。其理论公式:
理论公式有助于学生理解抽样平均误差的概念,但是由于样本可能数目很多,抽取所有的样本计算其平均数和成数是不实际的,同时总体平均数与成数P也是不知道的,在实际应用中,要用其计算公式。
抽样极限误差是从另一个角度来抽样误差问题的,既然抽样误差总是存在的,我们希望把这个误差控制在一定的范围内,即。只要在这个范围内,样本资料就是有价值的,这个范围就是允许误差范围,即抽样极限误差。
(2)理顺中的关系(由图中A向B分析)
总体指标虽然是一个确定的量,但它是未知的,而样本指标是一个随机变量,其取值是不定的,它是围绕着总体指标左右变动的,因此就不能期望某次抽样的样本估计值落在一定区间内是一个必然事件,而只能给予一定的概率保证。因此,在进行抽样估计时,既需要考虑抽样误差的可能范围,同时还需考虑落到这一范围的概率大小。这就要求向学生讲清以下3点:①抽样极限误差不是一、抽样误差的最大范围,即;
②并不是绝对成立的,只能以概率为F(t) 的保证程度使其在这个范围内;③由于抽样是按随机原则进行的,所有不同的样本组合都可能抽到,这样所得到的每个样本实际误差,有可能小于抽样平均误差,也有可能大于抽样平均误差。我们就以抽样平均误差为尺度,考虑抽样误差的可能范围,同时还需考虑落到这一范围的概率大小得出抽样极限误差的计算公式:
(3)参数区间估计得出(由图中A向C分析)
以总体平均数的估计区间为例说明
根据样本平均数的分布特征可知:p(|x-X|≤Δx ) = F(t)=1-α
等价于成立
即:在概率保证程度为F(t),概率度为t的情况下,总体平均数的数值将在x-Δx和x+Δx的范围内。其中,x-Δx称为估计下限,x+Δx称为估计上限。区间[x-Δx,x+Δx]称为置信区间,估计可靠性程度称为置信度。
(4)区间估计的两种模式(由图中B、C向D分析)
在进行抽样估计时,既需要考虑抽样误差的可能范围,同时还需考虑落到这一范围的概率大小。前者是估计的准确度问题,后者是估计的可靠性问题,两者紧密联系不可分开。在做估计时常常希望准确性尽可能提高,而且可靠性也不能小,但是这两个要求是矛盾的。在样本单位数不变的条件下,要想缩小估计区间,提高估计的准确性,势必要减小置信度,降低估计的可靠性。同样,提高了估计的可靠性,也必然要降低估计的准确性。因此,在抽样估计的时候,只能对其中的一个要素提出要求,而推断另一个要素的变动情况。所以总体参数的区间估计根据所给定的条件不同,而有两种估计方法。第一种,根据给定的抽样误差范围,估计其概率保证程度F(t):其步骤如下:①抽取样本,根据样本单位标志值计算样本指标,如计算样本平均数或样本成数,作为总体指标的相应估计值。并计算样本标准差以推算抽样平均误差;②根据给定的抽样极限误差范围,估计出总体指标(平均数或成数)的下限和上限;③根据给定的抽样极限误差除以抽样平均误差,求出概率度t值,再根据t值查《正态分布概率表》,求出相应的概率保证程度F(t)。并对总体参数作区间估计。第二种,根据置信度的要求,估计总体指标出现的可能范围。具体步骤是:①抽取样本,根据样本单位标志值计算样本指标,如计算样本平均数或样本成数,作为总体指标的相应估计值。并计算样本标准差用以推算抽样平均误差;②根据给定的置信度F(t)的要求,查《正态分布概率表》,求得概率度t值;③根据概率度和抽样平均误差来推算抽样极限误差的可能范围,并据以计算被估计总体指标的上下限,对总体参数作区间估计。
由于抽样调查是在遵循随机原则的基础上仅需收集少量样本的数据信息, 就能推知大量总体的全部信息,因此抽样调查是一种科学实用的调查方法,具有灵活方便、时效性强、经济节约的优点,尽管无法消除抽样误差,但可以对其事先加以计算和控制,推断结果的准确性往往高于全面调查和其他形式的非全面调查,不仅广泛应用于自然科学领域,也愈来愈多地应用于社会经济现象数量方面的研究。高职统计学教学的目的重在应用,为了让学生在实践中应用好抽样推断,授课过程应对抽样推断中涉及的概念从面上的理解深入到点,再从点的认识回到面上的拓展;不仅从概念在推断统计中的作用、地位上去理解它,还要深入分析它的内涵,而后认识它与其它概念的联系,在帮助学生理顺思路的前提下,再来讲授具体公式的推导与实际应用。
参考文献
[1]姚仁海.关于抽样极限误差的几点评注[J].黔东南民族师专学报:自然科学版,1997(12).
[2]黄良文主编.统计学原理[M].北京:中国统计出版社,2002,10.
[3]李洁明,祁新娥著.统计学原理[M].4版.上海:复旦大学出版社,2007,6.