教学文库网 - 权威文档分享云平台
您的当前位置:首页 > 精品文档 > 学前教育 >

抽样分布、参数估计和假设检验

来源:网络收集 时间:2026-02-04
导读: 抽样分布 一、抽样分布的理论及定理 (一) 抽样分布 抽样分布是统计推断的基础,它是指从总体中随机抽取容量为n的若干个样本,对每一样本可计算其k统计量,而k个统计量构成的分布即为抽样分布,也称统计量分布或随机变量函数分布。 (二) 中心极限定理 中

抽样分布

一、抽样分布的理论及定理 (一) 抽样分布

抽样分布是统计推断的基础,它是指从总体中随机抽取容量为n的若干个样本,对每一样本可计算其k统计量,而k个统计量构成的分布即为抽样分布,也称统计量分布或随机变量函数分布。 (二) 中心极限定理

中心极限定理是用极限的方法所求的随机变量分布的一系列定理,其内容主要反映在三个方面。

1.如果总体呈正态分布,则从总体中抽取容量为n的一切可能样本时,其样本均数的分布也呈正态分布;无论总体是否服从正态分布,只要样本容量足够大,样本均数的分布也接近正态分布。 均数(?)即

2.从总体中抽取容量为n的一切可能样本时,所有样本均数的均数(?X)等于总体

?X??

3.从总体中抽取容量为n的一切可能样本时,所有样本均数的标准差(?X)等于总体标准差除以样本容量的算数平方根,即

?X??n

中心极限定理在统计学中是相当重要的。因为许多问题都使用正态曲线的方法。这个定理适于无限总体的抽样,同样也适于有限总体的抽样。中心极限定理不仅给出了样本均数抽样分布的正态性依据,使得大多数数据分布都能运用正态分布的理论进行分析,而且还给出了推断统计中两个重要参数(即样本均数?X与样本标准差?X)的计算方法。

(三)抽样分布中的几个重要概念

1.随机样本。统计学是以概率论为其理论和方法的科学,概率又是研究随机现象的,因此进行统计推断所使用的样本必须为随机样本(random sample)。所谓随机样本是指按照概率的规律抽取的样本,

2.抽样误差。从总体中抽取容量为n的k个样本时,样本统计量与总体参数之间总会存在一定的差距,而这种差距是由于抽样的随机性所引起的样本统计量与总体参数之间的不同,称为抽样误差。

3.标准误。样本统计量分布的标准差或某统计量在抽样分布上的标准差,符号SE或?X表示。根据中心极限定理其标准差为

?X??n

★(問答 爲什麽說標準誤是進行統計推斷可靠性高低的標準?)

正如标准差越小,数据分布越集中,平均数的代表性越好。同理,在推断统计中,标准误越小,说明样本统计量与总体参数的之间越接近,即样本对总体的代表性越好,这时用样本统计量去推断总体就越可靠、越准确;相反,标准误越大,说明样本统计量与总体参数之间的差距越大,即样本对总体的代表性越差,这时用样本统计量去推断总体就越不可靠、越不准确。所以说标准误是进行统计推断可靠性高低的指标。

4.自由度。一群数据或观测值可以独立自由变动的数目称为自由度,用符号df或n?表示。

X??XN中, df?N。在计算方差或标准差时,因受??X?X??0的限制,

df?N?1,即有方差

二、常用抽样分布

S2???X?X?N?12。

在心理与教育统计中,常用的抽样分布有正态分布、渐近正态分布、t分布、F分布、q分布和?2分布等等。

(一) 正态分布及渐近正态分布

当统计量的分布符合正态分布或渐近正态分布时,进行统计推论的理论依据即为正态分布的理论。以样本平均数为例,正态分布的应用情形如下。

1.总体呈正态,总体方差?已知,则样本均数的分布也呈正态。根据中心极限定理则有

① 样本均数的均数等于总体均数,即?X??

② 样本均数的标准差等于总体标准差除以样本容量的平方根,即

2?X??n

Z?③ 差异检验值为

X??SEX

22.总体呈非正态,总体方差?已知,样本容量n足够大,样本均数的分布为渐近正态分布。根据中心极限定理,亦有

① 样本均数的均数等于总体均数:?X??

② 样本均数的标准差等于总体标准差除以样本容量的平方根。

?X??n

Z?③ 检验值

X??SEX

(二)t分布 1.t分布的定义

t分布是由小样本统计量形成的概率分布。 2.t分布的特点

① t分布也是对称分布。即平均数位于曲线的中央,在这一点上有一个单峰,从中央向两侧逐渐下降,尾部无限延长,但不与基线相交。

② t分布曲线的形状易变,曲线不是一条而是一族,其曲线形状随着样本容量的变化而有规律地变动,即随自由度的大小而变化。

③ 理论上,当n→∞时,t分布曲线以标准正态曲线为极限,即呈正态分布。当n逐渐减少时,分布的离散程度逐渐增大,曲线逐渐与标准正态分离;其峰顶逐渐下降,尾部抬高。

④ t分布的t值及对应的概率值(p)是根据自由度的大小由理论模型推导出来的,构成t分布临界值,表见附表4。

3.t分布的应用

1)总体正态,?未知,且n<30时,样本平均数的分布呈t分布。

2t分布的标准误为

SEX?Snn?1或

SEX?Sn?1n

因为总体标准差?未知,只能以样本标准差Sn来代替。而样本标准差Sn与总体标准差

?的差距较大,统计学家发现总体标准差的良好无偏估计量为Sn?1,即

Sn?1???X?X?N?12所以用Sn?1代替?则有上式。

t分布的检验值为

t?

22)总体呈非正态,?未知,n>30时,则样本均数的分布呈t分布或渐近正态分布,其①样本均数的标准误为

X??SEX

SEX?检验值为

Snn?1或

SEX?Sn?1n

X??X??Z?SEX或SEX

2此外,当?未知时,两个样本均数之差(X1?X2)的分布、相关系数的分布、回归t?系数的分布等也服从近似正态分布。

参数估计

第一节 统计推断的有关问题

一、 什么是推断统计

推断统计就是指由样本资料去推测相应总体情况的理论与方法。也就是由部分推全体, 由已知推未知的过程。

推断统计根据推测的性质不同而分为参数估计和假设检验两方面。参数估计是用样本去估计相应总体的状况,其具体方法有点估计和区间估计。假设检验的主要用途是对出现差异的两个或多个现象或事物进行真实性情况的检验,又称统计检验。它又为参数检验和非参数检验。参数检验法在检验时对总体分布和总体参数(?,?)有所要求,而非参数检验法

2在检验时则不依赖于总体的分布形态和总体参数的情况。 二、统计推断的基本问题

进行统计推断时应首先考虑以下三个方面的问题。

一是关于统计推断的基本前提。统计推断的前提是随机抽样。进行统计推断时,首先要了解抽样的方式,是随机抽取的,还是人为抽取的。

二是样本的规模与样本的代表性。抽样研究需要有一定的样本规模,而样本要具有代表性也需要有一定的样本规模来保证,以减少抽样误差。值得注意的样本规模和样本代表性是建立在随机抽样基础之上的,否则即使样本再大也是无意义的。

三是统计推断的错误要有一定限度。统计推断是在特定的时间、空间和条件下得出的结

论,加上抽样误差的影响,在用样本推测总体时总会犯一定的错误。但这种错误要有一定的限度,统计推断中允许犯错误的限度是用小概率事件来表示。

第二节 参数估计的原理

一、参数估计的定义

所谓参数估计就是根据样本统计量去估计相应总体的参数。 二、参数估计的方法

(一)点估计

点估计是在参数估计中直接以样本的统计量(数轴上的一个点)作为总体参数的估计值。良好点估计的统计量必须具备一定的前提条件。

1.无偏性

无偏性要求在用各个样本的统计量作为估计值时,其偏差为0,即??X2.一致 …… 此处隐藏:3110字,全部文档内容请下载后查看。喜欢就下载吧 ……

抽样分布、参数估计和假设检验.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.jiaowen.net/wendang/599387.html(转载请注明文章来源)
Copyright © 2020-2025 教文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:78024566 邮箱:78024566@qq.com
苏ICP备19068818号-2
Top
× 游客快捷下载通道(下载后可以自由复制和排版)
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
× 常见问题(客服时间:周一到周五 9:30-18:00)