教学文库网 - 权威文档分享云平台
您的当前位置:首页 > 文库大全 > 高等教育 >

多元统计分析spss分析论文

来源:网络收集 时间:2026-05-14
导读: 用聚类分析法分析细菌性食物中毒 学号:1110110047 姓名:何昌业 摘要:探讨我国细菌性食物中毒的发生规律,为预防细菌性食物中毒的发生提供参考。将收集的1994—2003年766起细菌性食物中毒案件的发生情况利用SPSS软件进行聚类分析,按其中毒发生情况将全部2

用聚类分析法分析细菌性食物中毒

学号:1110110047

姓名:何昌业

摘要:探讨我国细菌性食物中毒的发生规律,为预防细菌性食物中毒的发生提供参考。将收集的1994—2003年766起细菌性食物中毒案件的发生情况利用SPSS软件进行聚类分析,按其中毒发生情况将全部23种细菌中毒情况分为4类。本文选取了细菌性食物中毒的报道起数、中毒人数、死亡人数的统计量作为研究数据。各项数据均来自于万方数据搜索。分析结果表明:细菌性食物中毒有其规律性,根据其内在的特点,采取相应的预防措施,将有助于预防其发生。 关键词:食物中毒 细菌性食物中毒 聚类分析

引言:随着生活水平的不断提高,我们的食物也越来越丰富,但随之食物中毒的情况也越来越多。其中细菌性食物中毒比较常见,对人们生活习惯影响较大。因此,本文对1994—2003年766起细菌性食物中毒案件的具体情况进行聚类分析。首先对引起细菌性食物中毒的细菌进行聚类,将全部细菌分为4类,然后对中毒人数、死亡人数、中毒原因等进行分析。通过本文的分析研究,可以清楚地了解细菌性食物中毒的分布情况,以及发生中毒的原因,最终对细菌性食物中的预防起指导作用。

2 聚类分析的原理与方法

2.1主要思想及原理

主要思想:先将待聚类的n个样品(或者变量)各自看成一类,共有n类;然后按照实现选定的方法计算每两类之间的聚类统计量,即某种距离(或者相似系数),将关系最为密切的两类合为一类,其余不变,即得到n-1类;再按照前面的计算方法计算新类与其他类之间的距离(或相似系数),再将关系最为密切的两类并为一类,其余不变,即得到n-2类;如此下去,每次重复都减少一类,直到最后所有的样品(或者变量)都归为一类为止。

聚类分析的原理:直接比较样本中各事物之间的性质,,将性质相近的归为一类,而将性质差别比较大的分在不同类。也就是说,同类事物之间的性质差异小,类与类之间的事物性质相差较大。其中欧式距离在聚类分析中用得最广,它的表达式如下:

其中Xik表示第i个样品的第k个指标的观测值,Xjk表示第j个样品的第k个指标的观测值,dij为第i个样品与第j个样品之间的欧氏距离。若dij越小,那么第i与j两个样品之间的性质就越接近。性质接近的样品就可以划为一类。

当确定了样品之间的距离之后,就要对样品进行分类。分类的方法很多,这里只介绍系统聚类法,它是聚类分析中应用最广泛的一种方法。首先将n个样品每个自成一类,然后每次将具有最小距离的两类合并成一类,合并后重新计算类与类之间的距离,这个过程一直持续到所有样品归为一类为止。

2.2方法步骤

应用系统聚类法进行聚类分析的步骤如下:

①确定待分类的样品的指标;

②收集数据;

③对数据进行变换处理(如标准化或规格化);

④使各个样品自成一类,即n个样品一共有n类;

⑤计算各类之间的距离,得到一个距离对称矩阵,将距离最近的两个类并成一类;

⑥并类后,如果类的个数大于1,那么重新计算各类之间的距离,继续并类,直至所有样品归为一类为止;

⑦最后绘制系统聚类谱系图,按不同的分类标准或不同的分类原则,得出不同的分类结果。

2.3适用范围

聚类分析在商业方面可以用来当细分市场的有效工具,同时也可用于研究消费者行为;在生物方面聚类分析被用来动植物分类和对基因进行分类,获取对种群固有结构的认识;在地理方面聚类能够帮助在地球中被观察的数据库商趋于的相似性;在食品安全方面聚类分析可以用来进行进行分类具体检查等。另外在天文学、考古学、医药、化学、心理学、语言学和社会学等方面也用到聚类分析。

3.基于聚类解决。

3.1问题描述

收集了1994—2003年766起细菌性食物中毒案件的23中细菌的中毒详细统计情况,研究这些细菌中毒案件的细菌之中有什么关系,探究这些细菌有没有什么相同之处以及这些中毒案件发生的原因,以便以后更好地进行预防。

3.2问题分析

要想研究这些细菌之中的联系及相同特征,则应通过把每种细菌的报道起数、中毒人数、死亡人数和发生具体状况及原因等这些因素联系在一起,看看它们之间有什么关系,然后进行具体分类。因此应该使用系统聚类法进行聚类分析,把它们之间具有相似性质的归到一起,研究它们的发生情况,这样才能更好得探究出它们的相同之处以及这些中毒案件发生的原因,为以后的细菌性食物中毒的预防起指导作用。

3.3.。问题的聚类模型及求解

聚类分析:

a) 系统聚类法:

(1)在SPSS窗口中选择分析→分类→系统聚类,调出系统聚类分析主界面,并将变量移入变量 框中。在 分群 栏中选择 个案 单选按钮,即对样品进行聚类(若选择 变量 ,则对变量进行聚类)。在 输出 栏中选择 统计量 和 图 复选框,这样在结果输出窗口中可以同时得到聚类结果统计量和统计图。

图5.1 系统分析法主界面

(2)点击 统计量 按钮,设置在结果输出窗口中给出的聚类分析统计量。我们选择 合并进程表 与 聚类成员 中的方案范围 2-4,如图5.2所示,点击继续按钮,返回主界面。

(其中,合并进程表 表示在结果中给出聚类过程表,显示系统聚类的详细步骤;相似性矩阵 表示输出各个体之间的距离矩阵;聚类成员 表示在结果中输出一个表,表中显示每个个体被分配到的类别,方案范围 2-4即将所有个体分为2至4类。)

(3)点击 绘制 按钮,设置结果输出窗口中给出的聚类分析统计图。选中 树状图 复选框和冰柱栏中的无 单选按钮,如图5.3,即只给出聚类树形图,而不给出冰柱图。单击 继续 按钮,返回主界面。

图5.2 统计量子对话框 图5.3 绘制子对话框

(4)点击 方法 按钮,设置系统聚类的方法选项。聚类方法 下拉列表用于指定聚类的方法,这里选择 组间连接(组间平均数连接距离);度量标准 栏用于选择对距离和相似性的测度方法,选择区间 中的平方Euclidean距离(欧氏距离);单击继续按钮,返回主界面。

图5.4 方法子对话框

图5.5 保存 子对话框

(5)点击保存 按钮,指定保存在数据文件中的用于表明聚类结果的新变量。无 表示不保存任何新变量;单一方案 表示生成一个分类变量,在其后的矩形框中输入要分成的类数;方案范围 表示生成多个分类变量。这里我们选择方案范围 ,并在后面的两个矩形框中分别输入2和4,即生成三个新的分类变量,分别表明将样品分为2类、3类和4类时的聚类结果,如图5.5。点击 继续,返回主界面。

(6)点击 确定 按钮,运行系统聚类过程。

4结果与讨论

聚类分析群集成员表及聚类分析系谱图

* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * *

Dendrogram using Average Linkage (Between Groups)

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25

Label Num +---------+---------+---------+---------+---------+

16 -+

22 -+

19 -+

21 -+

17 -+

18 -+

15 -+

13 -+

14 -+-+

9 -+ |

20 -+ |

12 -+ |…… 此处隐藏:2530字,全部文档内容请下载后查看。喜欢就下载吧 ……

多元统计分析spss分析论文.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.jiaowen.net/wenku/128631.html(转载请注明文章来源)
Copyright © 2020-2025 教文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:78024566 邮箱:78024566@qq.com
苏ICP备19068818号-2
Top
× 游客快捷下载通道(下载后可以自由复制和排版)
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
× 常见问题(客服时间:周一到周五 9:30-18:00)