抽样分布、参数估计和假设检验
抽样分布
一、抽样分布的理论及定理 (一) 抽样分布
抽样分布是统计推断的基础,它是指从总体中随机抽取容量为n的若干个样本,对每一样本可计算其k统计量,而k个统计量构成的分布即为抽样分布,也称统计量分布或随机变量函数分布。 (二) 中心极限定理
中心极限定理是用极限的方法所求的随机变量分布的一系列定理,其内容主要反映在三个方面。
1.如果总体呈正态分布,则从总体中抽取容量为n的一切可能样本时,其样本均数的分布也呈正态分布;无论总体是否服从正态分布,只要样本容量足够大,样本均数的分布也接近正态分布。 均数(?)即
2.从总体中抽取容量为n的一切可能样本时,所有样本均数的均数(?X)等于总体
?X??
3.从总体中抽取容量为n的一切可能样本时,所有样本均数的标准差(?X)等于总体标准差除以样本容量的算数平方根,即
?X??n
中心极限定理在统计学中是相当重要的。因为许多问题都使用正态曲线的方法。这个定理适于无限总体的抽样,同样也适于有限总体的抽样。中心极限定理不仅给出了样本均数抽样分布的正态性依据,使得大多数数据分布都能运用正态分布的理论进行分析,而且还给出了推断统计中两个重要参数(即样本均数?X与样本标准差?X)的计算方法。
(三)抽样分布中的几个重要概念
1.随机样本。统计学是以概率论为其理论和方法的科学,概率又是研究随机现象的,因此进行统计推断所使用的样本必须为随机样本(random sample)。所谓随机样本是指按照概率的规律抽取的样本,
2.抽样误差。从总体中抽取容量为n的k个样本时,样本统计量与总体参数之间总会存在一定的差距,而这种差距是由于抽样的随机性所引起的样本统计量与总体参数之间的不同,称为抽样误差。
3.标准误。样本统计量分布的标准差或某统计量在抽样分布上的标准差,符号SE或?X表示。根据中心极限定理其标准差为
?X??n
★(問答 爲什麽說標準誤是進行統計推斷可靠性高低的標準?)
正如标准差越小,数据分布越集中,平均数的代表性越好。同理,在推断统计中,标准误越小,说明样本统计量与总体参数的之间越接近,即样本对总体的代表性越好,这时用样本统计量去推断总体就越可靠、越准确;相反,标准误越大,说明样本统计量与总体参数之间的差距越大,即样本对总体的代表性越差,这时用样本统计量去推断总体就越不可靠、越不准确。所以说标准误是进行统计推断可靠性高低的指标。
4.自由度。一群数据或观测值可以独立自由变动的数目称为自由度,用符号df或n?表示。
在
X??XN中, df?N。在计算方差或标准差时,因受??X?X??0的限制,
df?N?1,即有方差
二、常用抽样分布
S2???X?X?N?12。
在心理与教育统计中,常用的抽样分布有正态分布、渐近正态分布、t分布、F分布、q分布和?2分布等等。
(一) 正态分布及渐近正态分布
当统计量的分布符合正态分布或渐近正态分布时,进行统计推论的理论依据即为正态分布的理论。以样本平均数为例,正态分布的应用情形如下。
1.总体呈正态,总体方差?已知,则样本均数的分布也呈正态。根据中心极限定理则有
① 样本均数的均数等于总体均数,即?X??
② 样本均数的标准差等于总体标准差除以样本容量的平方根,即
2?X??n
Z?③ 差异检验值为
X??SEX
22.总体呈非正态,总体方差?已知,样本容量n足够大,样本均数的分布为渐近正态分布。根据中心极限定理,亦有
① 样本均数的均数等于总体均数:?X??
② 样本均数的标准差等于总体标准差除以样本容量的平方根。
?X??n
Z?③ 检验值
X??SEX
(二)t分布 1.t分布的定义
t分布是由小样本统计量形成的概率分布。 2.t分布的特点
① t分布也是对称分布。即平均数位于曲线的中央,在这一点上有一个单峰,从中央向两侧逐渐下降,尾部无限延长,但不与基线相交。
② t分布曲线的形状易变,曲线不是一条而是一族,其曲线形状随着样本容量的变化而有规律地变动,即随自由度的大小而变化。
③ 理论上,当n→∞时,t分布曲线以标准正态曲线为极限,即呈正态分布。当n逐渐减少时,分布的离散程度逐渐增大,曲线逐渐与标准正态分离;其峰顶逐渐下降,尾部抬高。
④ t分布的t值及对应的概率值(p)是根据自由度的大小由理论模型推导出来的,构成t分布临界值,表见附表4。
3.t分布的应用
1)总体正态,?未知,且n<30时,样本平均数的分布呈t分布。
2t分布的标准误为
SEX?Snn?1或
SEX?Sn?1n
因为总体标准差?未知,只能以样本标准差Sn来代替。而样本标准差Sn与总体标准差
?的差距较大,统计学家发现总体标准差的良好无偏估计量为Sn?1,即
Sn?1???X?X?N?12所以用Sn?1代替?则有上式。
t分布的检验值为
t?
22)总体呈非正态,?未知,n>30时,则样本均数的分布呈t分布或渐近正态分布,其①样本均数的标准误为
X??SEX
SEX?检验值为
Snn?1或
SEX?Sn?1n
X??X??Z?SEX或SEX
2此外,当?未知时,两个样本均数之差(X1?X2)的分布、相关系数的分布、回归t?系数的分布等也服从近似正态分布。
参数估计
第一节 统计推断的有关问题
一、 什么是推断统计
推断统计就是指由样本资料去推测相应总体情况的理论与方法。也就是由部分推全体, 由已知推未知的过程。
推断统计根据推测的性质不同而分为参数估计和假设检验两方面。参数估计是用样本去估计相应总体的状况,其具体方法有点估计和区间估计。假设检验的主要用途是对出现差异的两个或多个现象或事物进行真实性情况的检验,又称统计检验。它又为参数检验和非参数检验。参数检验法在检验时对总体分布和总体参数(?,?)有所要求,而非参数检验法
2在检验时则不依赖于总体的分布形态和总体参数的情况。 二、统计推断的基本问题
进行统计推断时应首先考虑以下三个方面的问题。
一是关于统计推断的基本前提。统计推断的前提是随机抽样。进行统计推断时,首先要了解抽样的方式,是随机抽取的,还是人为抽取的。
二是样本的规模与样本的代表性。抽样研究需要有一定的样本规模,而样本要具有代表性也需要有一定的样本规模来保证,以减少抽样误差。值得注意的样本规模和样本代表性是建立在随机抽样基础之上的,否则即使样本再大也是无意义的。
三是统计推断的错误要有一定限度。统计推断是在特定的时间、空间和条件下得出的结
论,加上抽样误差的影响,在用样本推测总体时总会犯一定的错误。但这种错误要有一定的限度,统计推断中允许犯错误的限度是用小概率事件来表示。
第二节 参数估计的原理
一、参数估计的定义
所谓参数估计就是根据样本统计量去估计相应总体的参数。 二、参数估计的方法
(一)点估计
点估计是在参数估计中直接以样本的统计量(数轴上的一个点)作为总体参数的估计值。良好点估计的统计量必须具备一定的前提条件。
1.无偏性
无偏性要求在用各个样本的统计量作为估计值时,其偏差为0,即??X2.一致 …… 此处隐藏:3110字,全部文档内容请下载后查看。喜欢就下载吧 ……
相关推荐:
- [学前教育]MC9S12XS256RMV1 xs128芯片手册4
- [学前教育]安东尼语录经典语录
- [学前教育]e级gps控制测量技术设计书
- [学前教育]苏教版2022-2022学年八年级下学期期末
- [学前教育]装修公司推广 营销
- [学前教育]家政服务合同(完整版)
- [学前教育]湖北省2016届高三联考语文试题
- [学前教育]爱立信无涯学习系统LTE题库1-LTE基础知
- [学前教育]揭秘大众柴油车作弊软件原理
- [学前教育]人才流失原因及对策分析
- [学前教育]房屋建筑施工工程劳务分包合同
- [学前教育]国际贸易实务试卷A卷09.6
- [学前教育]校园废品回收活动计划方案书范文格
- [学前教育]电大成本会计试题及答案
- [学前教育]大学物理实验 华南理工出版社 绪论答案
- [学前教育]爱丁堡产后抑郁量表
- [学前教育]液压冲击的危害、产生原因与防止方法(
- [学前教育]学生工作总结高一学生期中考试总结_020
- [学前教育]人民医院医疗废物管理规章制度大全
- [学前教育]阳光维生素的巨大抗癌潜能阅读题答案.d
- 马云在云锋基金江苏论坛闭幕式的发言
- 试论小学体育教育中的心理健康教育-教
- 语文A版一年级下册《语文乐园一》教学
- 2021四川大学物理化学考研真题经验参考
- [人教A版]2015-2016学年高中数学 第二
- 终端网点销售返利协议书
- 江苏省2015年眼科学主治医师青光眼考试
- 2017年部编人教版八年级语文上册教案
- 十一中学七年级英语上册Unit7Howmuchar
- 以赛促教的创新性实验教学机制建设实践
- 平凉市崆峒区2015七年级下生物期末试题
- 琶洲(地块五)A、B塔楼1、2#塔吊基础
- 一级医院工作制度与人员岗位职责
- 2018北京西城区高三二模理科数学试题及
- 炒股密码线技术 - 图文
- 职高学生生涯发展辅导教案
- 语文人教版四年级上册8 世界地图引出的
- 最新最新人教版二年级上册全册数学教案
- 2017高考英语全国2卷精彩试题(有问题
- 普通心理学笔记




