抽样方法和样本量估计
抽样方法和样本量估计
报告人:常 捷
关于抽样的概念
研究对象(unit of analysis) 根据研究目的确定研究对象。
总体(population) 在明确研究对象的基础上,确定其同质范围。调查对象(sampling element)被抽中的研究对象。 抽样单位(sampling unit) (如县、乡、村、医疗机构等等) 观察对象(observation unit) 如调查户主,户主填写户中各个家庭成员 情况
抽样表(sampling frame)列出所有抽样单位的名册 抽样方法(sampling design) 抽样误差(sampling error)只是因为抽样个体差异产生的随机误差
抽样偏移(sampling bias)造成系统误差,样本层面的系统的偏差,对总体的代表性偏差
抽样方法可分为概率抽样法与非概率抽样法两类 概率抽样法(probability sampling ) 总体中每个个体被抽中的概率是已知且不为零的,可以计算抽
样误差并在此基础上做统计推断。主要包括:简单随机抽样;系统抽样;整群抽样;分层抽样
非概率抽样法(non-probability sampling) 不知道总体中每个个体被抽中的概率,选择样本的过程往往不 是随机的。抽样误差无法计算,选择偏移无法控制。
主要包括:方便抽样;配额抽样;目的抽样;滚雪球抽样
单纯随机抽样 simple random sampling
单纯随机抽样就是在总体中以完全随机的方法抽取一部分观察 单位组成样本。常见的办法是先对总体中全部观察单位编号, 然后用抽签、随机数字表或计算机产生的随机数字的方法从中 抽取一部分观察单位组成样本。但是当总体例数较多时,这种 方法不太适用。 单纯随机抽样法是其他概率抽样法的基础。 Random Number Generator
/statistics/random-number-generator.aspx
系统抽样 systematic sampling
系统抽样又称机械抽样或等距抽样,先将总体的观察单位按某一顺序分成n个部分,
再从第一部分随机抽取k号观察单位,一次用相等间隔,从每一部分各抽取一个观察
单位。
系统抽样常作为单纯随机抽样的替代。
整群抽样 cluster sampling
整群抽样是先将总体按照某种与主要研究指标无关的特征划分 为K个群,每个群包含若干观察单位,然后再随机抽取k个群, 由抽取的各个群的全部观察单位组成样本。 与前两种方法不同在于抽样单位不同,不是直接抽取个体,而 是抽群。 单层整群抽样single-stage cluster sampling 多层整群抽样multi-stage cluster sampling 群的变异越小,群越多,抽样误差越小
样本量一定情况下,增加群、减少每群中样本数,能提高总样本的代表性 成本低 代表性差
分层抽样 stratified sampling
分层抽样是先按照对研究指标
影响较大的某个特征 将总体分成若干类别(即“层”),再从每一层内
抽取观察单位,合起来组成样本。
优点1)相同样本量,抽样误差最小
优点2)不同的层中,根据实际情况可以选择不同的抽样方法
各层观察单位数的分配:等比例分配;最优分配1) 2) ;
非概率抽样法(non-probability sampling) 虽然在对总体的代表性上很差,在此基础
上做统计推断也不科学,但在很多情况下,也是适用的。
方便抽样 Convenience Sampling方便获得的个体即选为样本,样本中每个个体的获得都是偶然性的。最终,样本不
能够代表总体。不能在此基础上做统计推断。可以用于研究的初始阶段,目的可以
是为了发现了解相关信息,发现值得研究的问题,为下一步提出假设准备信息。
配额抽样 Quota Sampling
配额抽样为保证样本的代表性,其样本中具有某种特征的比例几乎和母体中 具有此种特征的比例相等。譬如某大学有10000名学生,我们要抽取1000名。 将学生依年级分成如下四个子母体。 年级 一 二 三 四 学生数 在母体之百分比 样本人数 3200 2600 2200 2000 32% 26% 22% 20% 320 260 220 200
与分层抽样区别在于,分层抽样是按随机原则在层内抽选样本,而配额抽样则是 由调查人员在配额内主观判断选定样本。
目的抽样 Purposive Sampling总体量很小时,比如总体中只有三个个体,此时,随机抽样并不一定能抽到具有代表
性的样本。这种情况下,还不如根据自己的专业知识或者通过咨询专家借助他们的
专业知识人为选出最有代表性的样本。
滚雪球抽样 Snowball Sampling通过总体中的一个个体提供的线索找到其他的几个个体,再通过其他几个个体提供的线索找到更多的 个体。 适用于难以找寻、获得的研究对象 如 HIV/AIDS 其抽样的代表性也局限于被调查者的提供的社会网 络。
第四次卫生服务总调查 家庭健康询问调查样本住户的抽取方法
将样本村(居委会)内全部住户(包括非本地户口住户)按名单顺序编 号(Sampling Frame) ;
根据本村(居委会)应抽取的样本户数确定抽样间隔。 国家样本点抽样间隔 = 本村(居委会)内户数 / 60(四舍五入,取整数) 西部扩点抽样间隔 = 本村(居委会)内户数 / 33 (四舍五入,取整数)
确定抽样住户:首先随机抽一张人民币,取其末四位数,该数除以抽样 间隔后的余数确定为K值,则K≤抽样间隔。K值为被抽第1个住户编号,K 值加抽样间隔为被抽中的第2个住户编号,K值加两个抽样间隔为第3个被 抽住户编号,以此类推。 (Systematic Sampling)
第四次卫生服务总调查医务人员调查样本抽取方法
一、调查对象 调查对象为被抽中的临床医生和护理人员。被调查人员将在家庭健康询问调 查的样本县(市、区)中抽取,涉及到的机构包括样本县(市、区)中的所 有三级综合医院、部分二级综合医院及样本乡镇及街道中的所有社区卫生服 务中心和乡镇卫生院。 二、调查对象的选取 (一)综合医院 1、开展家庭健康调查的样本县(市、区)中的所有三级综合医院及部分县 (市、区)医院参与调查,参与调查的机构名单见培训光盘; 2、每所医院选取临床医务人员30名,其中医生20名,护理人员10名。 (二)社区卫生服务中心及乡镇卫生院 样本街道、样本乡镇中所有的社区卫生服务中心和乡镇卫生院均参与调查; 每所社区卫生服务中心和乡镇卫生院选取临床医务人员10名,其中医生7名, 护理人员3名。如机构内人员数量不满足样本需求时,按实际人数进行调查。 三、样本个体选取原则(Quota Sampling) 1、全院所有临床科室均要抽到; 2、样本选取要求职称分布均匀,兼顾高、中、初级职称。
中国健康与养老追踪调查抽样设计
2008预调查抽样介绍 CHARLS预调查抽样程序:县级单位的选取是按区域以及城乡分层,然 后依照PPS(Probability Proportional to Size)方法随机选取的。在每
个县级单位中,CHARLS再依照PPS方法随机抽取3个村级单位(或是一个城镇社区),在每一个村或社区中,再从地图上随机抽取25-36 处住所;然后决定每个住所中家庭户的样本个数。CHARLS随机选取
其中一个符合年龄条件的家庭,然后确定该家庭中符合年龄条件的家庭成员个数并随机抽取一人作为主要受访者。基于这样的随机抽样过 程,每个村或社区会产生25-36个样本家庭,每户家庭产生的受访者
有1名(单身、离婚或丧偶)或2名(主要受访者及其配偶)。
中国健康与养老最总调查抽样方法
相关推荐:
- [专业资料]《蜜蜂之家》教学反思
- [专业资料]过去分词作定语和表语1
- [专业资料]苏州工业园区住房公积金贷款申请表
- [专业资料]保安管理制度及处罚条例细则
- [专业资料]2018年中国工程咨询市场发展现状调研及
- [专业资料]2015年电大本科《学前教育科研方法》期
- [专业资料]数字信号处理实验 matlab版 离散傅里叶
- [专业资料]“十三五”重点项目-虎杖白藜芦醇及功
- [专业资料]2015-2020年中国竹木工艺市场需求及投
- [专业资料]国际贸易理论与实务作业五:理论案例分
- [专业资料]财政部修订发布事业单位会计制度
- [专业资料]BCA蛋白浓度测定试剂盒(增强型)
- [专业资料]工程进度总计划横道图模板(通用版)
- [专业资料]七年级地理同步练习(天气与气候)
- [专业资料]X光安检机介绍火灾自动报警系统的组成
- [专业资料]衢州市人民政府办公室关于印发衢州市区
- [专业资料]经济全球化及其影响[1]
- [专业资料]质粒DNA限制性酶切图谱分析
- [专业资料]国家安全人民防线工作“六项”制度
- [专业资料]劳动力投入计划及保证措施
- 电子账册联网监管培训手册
- 人教版语文七年级上第1课《在山的那边
- 对我区担保行业发展现状的思考与建议
- 平面四边形网格自动生成方法研究
- 2016年党课学习心得体会范文
- 如何设置电脑定时关机
- 全球最美人妖排行榜新鲜出炉
- 社会实践调查报告及问卷
- Visual Basic习题集
- 《鱼我所欲也》课件2
- 浙江省会计从业资格考试试卷
- 全遥控数字音量控制的D 类功率放大器资
- 鞍钢宪法与后福特主义
- 电表的改装与校准实验报告(1)
- 2014年高考理科数学真题解析分类汇编:
- Windows 7 AIK 的使用
- 风电场全场停电事故应急处置方案
- 化工原理选填题题库(下)
- 关于产学研合作教育模式的学习与思考
- 西安先锋公馆项目前期定位报告




