数学地质实验指导书(教材)
《数学地质》
实 验 指 导 书
二零零六年八月
说 明
一、该指导书所属课程:
《数学地质》 二、适用专业:
地质工程 三、实验总学时数:
20学时。可根据需要增开适当的课外机时。 四、各实验项目时数:
实验一 预处理与统计 2学时实验二 线性回归分析 4学时实验三 多元线性回归分析 4学时实验四 趋势面分析 4学时实验五 聚类分析 4学时实验六 两类判别分析 4学时实验七 贝叶斯多类判别分析 4学时实验八 有序地质量最优分割法 2学时五、前修课程知识 1. 计算机编程语言; 2. 线性代数; 3.
概率统计。
必做实验选做实验必做实验必做实验必做实验必做实验选做实验必做实验 目 录
实验一 预处理与统计 ................................................................................................................... 1 实验二 一元线性回归分析 ............................................................................................................ 7 实验三 多元线性回归分析 ...........................................................................................................11 试验四 趋势面分析 .................................................................................................................... 15 试验五 聚类分析 ........................................................................................................................ 20 试验六 两类判别分析 ................................................................................................................. 24 试验七 贝叶斯多类判别分析 ...................................................................................................... 28 试验八 有序地质量最优分割法 ................................................................................................... 32
实验一 预处理与统计
一、目的:
通过完成数据统计和预处理程序的设计和实现及完成算例,掌握统计一组数据的极值、均值、方差、变异系数及进行数据预处理的方法。
二、方法概要
1、进行统计和预处理的原因、目的和应注意的问题
(1)原因
原始数据可能有强非对称性,存在孤立值,大多数的统计方法应用原始数据时存在大而且不是偶然的残差等问题,通过改变表达方式,有时可以增强信息的显示,而这种改变不仅需要改变数值的单位,而且可能改变数据的基本测量尺度;
(2)目的
? 使变量尽可能为正态分布(如回归分析要求因变量为正态分布,要求自变量和因变量之间
具有足够的相关关系); ? 统一变量的数据尺度;
? 使变量之间的非线性关系转换为线性关系;
? 用新的数目少的相互独立的变量代替相互联系的原始变量; ? 方便用简单自然的方式进行解释; ? 帮助理解数据的特征。 (3)注意问题
? 数据范围:只有数据变化范围相对较大,变换才显著;
? 变换是很重要的工作,变换不当则适得其反;所以在认真研究分析的基础上进行,有时要
通过多次试验才能找到合适的变换方法;
? 有些行业中,有些强制性变换或习惯使用的变换,工作中应遵循;
? 变换后数据的可解释性也很重要,有时为了不影响解释,宁可不对其转换。
2、鉴别并剔除异常值
(1)3-σ法则(拉依达准则) 由于随机误差服从正态分布规律,因此
P[|?|?3?]?P[x???3?]?99.7% (1-1)
由式1-1知,误差|?|?3?出现的概率只有0.3%,也就是说,在1000次测量中,误差大于3?的情况只可能出现3次。因此,在有限次测量中,若某次测量值的误差大于3σ时,则认为该测量值
1
含有过失误差,应予以舍去,这就是3?法则。
一般的测量时误差?是得不到的,只能得到残差v?x?x,而总体标准差?也是得不到的,故?,??通常取为样本标准差,只能用它的估计值 ?即??=S。因此,3σ法则只能按下述规则实际应用:
对于测量数据x1,x2,?,xn,若某个测量值xi(1?i?n)对应的残差满足
vi?xi?x?3S (1-2)
则将xi舍去。
根据3σ法则对实验数据进行处理,也有犯“弃真”的错误。就是将一些误差较大但并不含有过失误差的正常测量值当作含有过失误差的测量值舍去了。3σ法则“弃真”概率很小,且随着测量次数的增加而减少,最后稳定与0.3%。一般要求n>10。当n≤10时,即使测量数据中含有粗大误差,用3σ法则也不能判别出来。
(2)Dixon准则
第一步 将样本从小到大顺序排列,得次序统计量:
x(1),x(2),?,x(n)
xmin?x(1),xmax?x(n)称为极端值。
第二步 对不同的n求极端值,选择计算不同的统计量。
Dixon[x]?x(n)?x(n?1)x(n)?x(2)(n) (1-3)
第三步 对比,若计算出的统计量>临界值,则认为相应的极端值为异常值。
3、统计
(1)平均值
设有一批样本数据(x1 ,x2 ,?,xn),其平均值为x
x?1n?xi (1-1)
ni?1(2)样本方差
设有一批样本数据(x1 ,x2 ,?,xn),其离差平方和的平均值为样本方差,记S2
S2?1n?1i?1?(xi?x) (1-2)
n2方差反映了数据的离散程度,其值越大数据越分散;其值越小数据就较多的集中在平均值附近。但它是有量纲的,受到量纲、量级的制约。
(3)变异系数及正态分布检验
样本数据的标准差于平均值之比为变异系数,记Cr
2
…… 此处隐藏:1008字,全部文档内容请下载后查看。喜欢就下载吧 ……相关推荐:
- [学前教育]MC9S12XS256RMV1 xs128芯片手册4
- [学前教育]安东尼语录经典语录
- [学前教育]e级gps控制测量技术设计书
- [学前教育]苏教版2022-2022学年八年级下学期期末
- [学前教育]装修公司推广 营销
- [学前教育]家政服务合同(完整版)
- [学前教育]湖北省2016届高三联考语文试题
- [学前教育]爱立信无涯学习系统LTE题库1-LTE基础知
- [学前教育]揭秘大众柴油车作弊软件原理
- [学前教育]人才流失原因及对策分析
- [学前教育]房屋建筑施工工程劳务分包合同
- [学前教育]国际贸易实务试卷A卷09.6
- [学前教育]校园废品回收活动计划方案书范文格
- [学前教育]电大成本会计试题及答案
- [学前教育]大学物理实验 华南理工出版社 绪论答案
- [学前教育]爱丁堡产后抑郁量表
- [学前教育]液压冲击的危害、产生原因与防止方法(
- [学前教育]学生工作总结高一学生期中考试总结_020
- [学前教育]人民医院医疗废物管理规章制度大全
- [学前教育]阳光维生素的巨大抗癌潜能阅读题答案.d
- 马云在云锋基金江苏论坛闭幕式的发言
- 试论小学体育教育中的心理健康教育-教
- 语文A版一年级下册《语文乐园一》教学
- 2021四川大学物理化学考研真题经验参考
- [人教A版]2015-2016学年高中数学 第二
- 终端网点销售返利协议书
- 江苏省2015年眼科学主治医师青光眼考试
- 2017年部编人教版八年级语文上册教案
- 十一中学七年级英语上册Unit7Howmuchar
- 以赛促教的创新性实验教学机制建设实践
- 平凉市崆峒区2015七年级下生物期末试题
- 琶洲(地块五)A、B塔楼1、2#塔吊基础
- 一级医院工作制度与人员岗位职责
- 2018北京西城区高三二模理科数学试题及
- 炒股密码线技术 - 图文
- 职高学生生涯发展辅导教案
- 语文人教版四年级上册8 世界地图引出的
- 最新最新人教版二年级上册全册数学教案
- 2017高考英语全国2卷精彩试题(有问题
- 普通心理学笔记




