多元统计分析spss分析论文
用聚类分析法分析细菌性食物中毒
学号:1110110047
姓名:何昌业
摘要:探讨我国细菌性食物中毒的发生规律,为预防细菌性食物中毒的发生提供参考。将收集的1994—2003年766起细菌性食物中毒案件的发生情况利用SPSS软件进行聚类分析,按其中毒发生情况将全部23种细菌中毒情况分为4类。本文选取了细菌性食物中毒的报道起数、中毒人数、死亡人数的统计量作为研究数据。各项数据均来自于万方数据搜索。分析结果表明:细菌性食物中毒有其规律性,根据其内在的特点,采取相应的预防措施,将有助于预防其发生。 关键词:食物中毒 细菌性食物中毒 聚类分析
引言:随着生活水平的不断提高,我们的食物也越来越丰富,但随之食物中毒的情况也越来越多。其中细菌性食物中毒比较常见,对人们生活习惯影响较大。因此,本文对1994—2003年766起细菌性食物中毒案件的具体情况进行聚类分析。首先对引起细菌性食物中毒的细菌进行聚类,将全部细菌分为4类,然后对中毒人数、死亡人数、中毒原因等进行分析。通过本文的分析研究,可以清楚地了解细菌性食物中毒的分布情况,以及发生中毒的原因,最终对细菌性食物中的预防起指导作用。
2 聚类分析的原理与方法
2.1主要思想及原理
主要思想:先将待聚类的n个样品(或者变量)各自看成一类,共有n类;然后按照实现选定的方法计算每两类之间的聚类统计量,即某种距离(或者相似系数),将关系最为密切的两类合为一类,其余不变,即得到n-1类;再按照前面的计算方法计算新类与其他类之间的距离(或相似系数),再将关系最为密切的两类并为一类,其余不变,即得到n-2类;如此下去,每次重复都减少一类,直到最后所有的样品(或者变量)都归为一类为止。
聚类分析的原理:直接比较样本中各事物之间的性质,,将性质相近的归为一类,而将性质差别比较大的分在不同类。也就是说,同类事物之间的性质差异小,类与类之间的事物性质相差较大。其中欧式距离在聚类分析中用得最广,它的表达式如下:
其中Xik表示第i个样品的第k个指标的观测值,Xjk表示第j个样品的第k个指标的观测值,dij为第i个样品与第j个样品之间的欧氏距离。若dij越小,那么第i与j两个样品之间的性质就越接近。性质接近的样品就可以划为一类。
当确定了样品之间的距离之后,就要对样品进行分类。分类的方法很多,这里只介绍系统聚类法,它是聚类分析中应用最广泛的一种方法。首先将n个样品每个自成一类,然后每次将具有最小距离的两类合并成一类,合并后重新计算类与类之间的距离,这个过程一直持续到所有样品归为一类为止。
2.2方法步骤
应用系统聚类法进行聚类分析的步骤如下:
①确定待分类的样品的指标;
②收集数据;
③对数据进行变换处理(如标准化或规格化);
④使各个样品自成一类,即n个样品一共有n类;
⑤计算各类之间的距离,得到一个距离对称矩阵,将距离最近的两个类并成一类;
⑥并类后,如果类的个数大于1,那么重新计算各类之间的距离,继续并类,直至所有样品归为一类为止;
⑦最后绘制系统聚类谱系图,按不同的分类标准或不同的分类原则,得出不同的分类结果。
2.3适用范围
聚类分析在商业方面可以用来当细分市场的有效工具,同时也可用于研究消费者行为;在生物方面聚类分析被用来动植物分类和对基因进行分类,获取对种群固有结构的认识;在地理方面聚类能够帮助在地球中被观察的数据库商趋于的相似性;在食品安全方面聚类分析可以用来进行进行分类具体检查等。另外在天文学、考古学、医药、化学、心理学、语言学和社会学等方面也用到聚类分析。
3.基于聚类解决。
3.1问题描述
收集了1994—2003年766起细菌性食物中毒案件的23中细菌的中毒详细统计情况,研究这些细菌中毒案件的细菌之中有什么关系,探究这些细菌有没有什么相同之处以及这些中毒案件发生的原因,以便以后更好地进行预防。
3.2问题分析
要想研究这些细菌之中的联系及相同特征,则应通过把每种细菌的报道起数、中毒人数、死亡人数和发生具体状况及原因等这些因素联系在一起,看看它们之间有什么关系,然后进行具体分类。因此应该使用系统聚类法进行聚类分析,把它们之间具有相似性质的归到一起,研究它们的发生情况,这样才能更好得探究出它们的相同之处以及这些中毒案件发生的原因,为以后的细菌性食物中毒的预防起指导作用。
3.3.。问题的聚类模型及求解
聚类分析:
a) 系统聚类法:
(1)在SPSS窗口中选择分析→分类→系统聚类,调出系统聚类分析主界面,并将变量移入变量 框中。在 分群 栏中选择 个案 单选按钮,即对样品进行聚类(若选择 变量 ,则对变量进行聚类)。在 输出 栏中选择 统计量 和 图 复选框,这样在结果输出窗口中可以同时得到聚类结果统计量和统计图。
图5.1 系统分析法主界面
(2)点击 统计量 按钮,设置在结果输出窗口中给出的聚类分析统计量。我们选择 合并进程表 与 聚类成员 中的方案范围 2-4,如图5.2所示,点击继续按钮,返回主界面。
(其中,合并进程表 表示在结果中给出聚类过程表,显示系统聚类的详细步骤;相似性矩阵 表示输出各个体之间的距离矩阵;聚类成员 表示在结果中输出一个表,表中显示每个个体被分配到的类别,方案范围 2-4即将所有个体分为2至4类。)
(3)点击 绘制 按钮,设置结果输出窗口中给出的聚类分析统计图。选中 树状图 复选框和冰柱栏中的无 单选按钮,如图5.3,即只给出聚类树形图,而不给出冰柱图。单击 继续 按钮,返回主界面。
图5.2 统计量子对话框 图5.3 绘制子对话框
(4)点击 方法 按钮,设置系统聚类的方法选项。聚类方法 下拉列表用于指定聚类的方法,这里选择 组间连接(组间平均数连接距离);度量标准 栏用于选择对距离和相似性的测度方法,选择区间 中的平方Euclidean距离(欧氏距离);单击继续按钮,返回主界面。
图5.4 方法子对话框
图5.5 保存 子对话框
(5)点击保存 按钮,指定保存在数据文件中的用于表明聚类结果的新变量。无 表示不保存任何新变量;单一方案 表示生成一个分类变量,在其后的矩形框中输入要分成的类数;方案范围 表示生成多个分类变量。这里我们选择方案范围 ,并在后面的两个矩形框中分别输入2和4,即生成三个新的分类变量,分别表明将样品分为2类、3类和4类时的聚类结果,如图5.5。点击 继续,返回主界面。
(6)点击 确定 按钮,运行系统聚类过程。
4结果与讨论
聚类分析群集成员表及聚类分析系谱图
* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * *
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
16 -+
22 -+
19 -+
21 -+
17 -+
18 -+
15 -+
13 -+
14 -+-+
9 -+ |
20 -+ |
相关推荐:
- [高等教育]一年级家长课程教案
- [高等教育]封丘县人民医院深入推进纠正医药购销领
- [高等教育]2017年6月大学英语四级真题试卷及答案(
- [高等教育]2017年北京第二外国语学院文学院824中
- [高等教育]7 高中历史第7单元1861年俄国农奴制改
- [高等教育]【K12学习】4、实际测量-苏教版六年级
- [高等教育]药具培训试卷题库及部分参考答案
- [高等教育]本土电子元器件目录分销商如何赢得生意
- [高等教育]七年级岭南版美术教案
- [高等教育]书作文之书法活动通讯稿
- [高等教育]Endnote X 软件使用入门和用法总结(LS)
- [高等教育]嵌入式系统的现状及发展状况
- [高等教育]2012抗菌药物专项整治活动方案解读
- [高等教育]人教版新课本一年级数学下册期末试卷
- [高等教育]爱课程民法学观后感
- [高等教育]930机组使用说明书1
- [高等教育]煤气设备设施点检标准
- [高等教育]常见室内观叶植物图解
- [高等教育]312党员群众路线心得体会
- [高等教育]小学信息(苗版)第一册全册教案
- 在市---局2010党建大会上的讲话
- 《科哲》提纲及补充阅读材料(2010.7)
- 苏州高博软件技术职业学院论文开题报告
- 兼职导游管理的困境及对策探讨
- 基于通用设计理念的现代厨房产品语义研
- 康乐一中2010年至2011年度鼓号队、花束
- 第10章_数据收集整理与描述_期末复习课
- 2008年黑龙江林甸商贸购物中心营销策划
- 水硬度的测定实验报告
- 五分钟教你拍摄夜景光绘照
- 2014年临床妇产科三基三严试题及答案
- 0第二课 纾解压力第一站了解压力
- 解析建筑工程电气设备安装施工技术要点
- 地方性应用型本科高校“双师型”师资队
- 高考语文专题复习课件:小说阅读指导
- 装饰工程投标书2
- 大学生就业难问题探讨及对策
- English and Its History
- 青岛市城市房屋修缮工程质量监督管理办
- 初中英语形容词和副词的用法和练习题




