模糊聚类案例分析
模糊聚类分析
模糊数学方法及其应用
论文题目: 模糊聚类方法案例分析
小组成员:
王季光 宋申辉 兰洁 陈倩芸 肖仑 杨洋 吴云峰
2013年 10 月 27 日
模糊聚类分析
模糊聚类分析方法
1.1距离和相似系数
为了将样品(或指标)进行分类,就需要研究样品之间关系。目前用得最多的方法有两个:一种方法是用相似系数,性质越接近的样品,它们的相似系数的绝对值越接近1,而彼此无关的样品,它们的相似系数的绝对值越接近于零。比较相似的样品归为一类,不怎么相似的样品归为不同的类。另一种方法是将一个样品看作P维空间的一个点,并在空间定义距离,距离越近的点归为一类,距离较远的点归为不同的类。但相似系数和距离有各种各样的定义,而这些定义与变量的类型关系极大,因此先介绍变量的类型。
由于实际问题中,遇到的指标有的是定量的(如长度、重量等),有的是定性的(如性别、职业等),因此将变量(指标)的类型按以下三种尺度划分: 间隔尺度:变量是用连续的量来表示的,如长度、重量、压力、速度等等。在间隔尺度中,如果存在绝对零点,又称比例尺度,本书并不严格区分比例尺度和间隔尺度。
有序尺度:变量度量时没有明确的数量表示,而是划分一些等级,等级之间有次序关系,如某产品分上、中、下三等,此三等有次序关系,但没有数量表示。
名义尺度:变量度量时、既没有数量表示,也没有次序关系,如某物体有红、黄、白三种颜色,又如医学化验中的阴性与阳性,市场供求中的“产”和“销”等。
不同类型的变量,在定义距离和相似系数时,其方法有很大差异,使用时必须注意。研究比较多的是间隔尺度,因此本章主要给出间隔尺度的距离和相似系数的定义。
设有n个样品,每个样品测得p项指标(变量),原始资料阵为
x1 x2 xp
X1
XX 2
Xn
x11 x 21 xn1
x12
x22 xn2
x1p x2p
xnp
其中品
Xi
xij(i 1, ,n;j 1, ,p)
为第i个样品的第j个指标的观测数据。第i个样
为矩阵X的第i行所描述,所以任何两个样品XK与XL之间的相似性,可
xK
以通过矩阵X中的第K行与第L行的相似程度来刻划;任何两个变量间的相似性,可以通过第K列与第L列的相似程度来刻划。
1.2 F相似关系 1.2.1定义
与
xL
之
设R F(U U),如果具有自反和对称关系,则称R为U上的一个F相似关
模糊聚类分析
系(F表示模糊)
F相似关系可以用F矩阵表示。当论域U为有限时,具有F相似关系的矩阵,称为F相似矩阵。在实际应用时,通常只能得到自反矩阵和对称举证,即相似矩阵。现在的问题是对具有相似关系的元素怎样进行分类,也就是如何将相似矩阵
改造为等价矩阵。
1.2.2 定理
T
若R R,则称R为对称矩阵。(1)
若R I(I是单位矩阵),则称R为自反矩阵。(2)
2
R R若,则称R为传递的F关系。(3)
若满足上面三点则称为等价矩阵。
n
定理1:相似矩阵R un n的传递闭包是等价矩阵,且R R。
证 只需要证明R是自反的、对称的。
2nR IRR因是自反的,故, R。不难得到R不减,因此
R Rk Rn I
k 1
n
,
即R是自反的。
nTTnn
(R) (R) RR R因为,,故R是对称的。
T
有定理1可见,要想将相似矩阵改变为等价矩阵,只需求相似矩阵的传递闭
包。
定理2:设R un n是自反矩阵,则任意自然数m n,都有
R Rm
证 由R自反性推得
R R2 ... Rn ... 当m n时,有
n
m
k
k 1
R R R R R
模糊聚类分析
1.3 聚类分析
所谓聚类分析,就是用数学的方法对事物进行分类,它有广泛的实际应用。在模糊数学产生之前,聚类分析已是数理统计多元分析的一个分支,然而现实的分类问题往往伴有模糊性。例如,环境污染分类、春天连阴雨预报、临床症状资料分类、岩石分类,等等。对这些伴有模糊性的聚类问题,用模糊数学语言来表达更为自然。
模糊聚类分析的步骤: 第一步:数据标准化 数据矩阵
设论域U {x1,x2, xn}为被分类的对象,每个对象由m个指标表示其性状, 即
xi (xi1,xi2,...,xim)
x11 x21 xn1
于是得到原始数据矩阵为
x12 x1m
x22 x2m
xn2 xnm
数据标准化 在实际问题中,不同的数据一般有不同的量纲。为了使有不同的量纲的量也能进行比较,通常需要对数据作适当的变换。但是,即使这样,得到的数据也不一定在区间[0,1]上。因此,这里说的数据标准化,就是要根据模糊矩阵的要求,将数据压缩到区间[0,1]上。
通常需要作如下集中变换。 1)平移 标准差变换 2)平移 极差变换 3)对数变换
第二步 标定(建立模糊相似矩阵)
设U {u1,u2, ,un}为待分类的全体。其中每一待分类对象由一组数据表征如下:
ui (xi1,xi2,...,xim) 现在的问题是如何建立
ui
和
uj
之间的相似关系。这有许多方法(这里选一些,
ui
列在下面),我们可以按照实际情况,选其中一种来求与
uj
的相似关系
R(ui,uj) rij
。
模糊聚类分析
(1)形似系数法 数量积法
其中M为一适当选择之正数,满足
k 1
1 rij 1
M
当i j
x
m
m
ik
.xjk
当i j
M max( xik.xjk)
i,j
k 1
夹角余弦法
rij
x
m
ij
xjk
相关系数法
rij
|x
m
ik
i||xjk j|
1m11
i xik,j xjk
mk 1mk 1 其中
最大最小法
rij
min(x
k 1
mk 1
m
ik
,xjk),xjk)
max(x min(x
k 1m
ik
算术平均最小法
ik
rij
,xjk)
1m
(xik xjk) 2k 1
m
几何平均最小法
rij
min(x
k 1
ik
,xjk)
k 1
m
绝对值指数法
模糊聚类分析
rij e
|xik xjk|
k 1
m
绝对值减数法
1 mrij
1 c |xik xjk|
k 1 其中,c适当选取,使
当i j当i j
0 rij 1
。
(2)距离法
1)直接距离法 海明距离 欧几里得距离 切比雪夫距离 2)倒数距离法 3)指数距离法
选择上述哪一个方法好,要按实际情况而定。在实际应用时,最好采用多种方法,选取分类最符合实际的结果。 第三步 聚类(求动态聚类图)。
由第一步得到的矩阵R一般只满足自反性和对称性,即R是相似矩阵,
,R 便是所需将它改造成模糊等价 …… 此处隐藏:2008字,全部文档内容请下载后查看。喜欢就下载吧 ……
相关推荐:
- [行业范文]美好的法语句子
- [行业范文]描写露珠的句子
- [行业范文]精彩禅语句子图片
- [行业范文]关于满嘴谎言的句子
- [行业范文]关于安静的句子48句
- [行业范文]关于小河的句子
- [行业范文]描写稻田的句子
- [行业范文]思念好朋友的句子
- [行业范文]赞美雪的句子
- [行业范文]早上激励人心的句子
- [行业范文]失恋忧伤的句子
- [行业范文]努力积极向上的句子
- [行业范文]对工作心灰意冷的句子
- [行业范文]失恋让人心疼的句子
- [行业范文]描写珍惜青春的句子
- [行业范文]表达思念的句子简短
- [行业范文]关于父爱的句子范例
- [行业范文]浪漫的英语句子
- [行业范文]关于周末的句子
- [行业范文]思念牵挂的句子
- 有关感恩班会课件简短(二篇)(感恩班会
- 2025年初二下乡军训心得体会800字(15篇
- 关于新员工培训方案汇编(关于新员工培
- 精选高考生寒假学习计划书(精)(高考生
- 毕业实训报告心得体会(3篇)(实训报告心
- 银行工作感悟及心得范文怎么写(四篇)(
- 精选领导干部个人政治画像报告通用(七
- 精选超市11.11活动促销方案(精品超市品
- 2025年怎么做自我介绍汇总(5篇)(至2025
- 最新企业错峰生产方案(26篇)(山西企业
- 最新暑期三下乡社会实践调研报告范本(
- 最新幼儿园大班教育教学总结怎么写(最
- 最新教师节主持词小学(优秀9篇)(教师节
- 关于小学安全教育教学方案(推荐)(关于
- 员工信模板范文怎么写(五篇)(员工信息
- 最新保险销售离职申请书(十六篇)(最新
- 最新XX小学防校园欺凌工作方案怎么写(2
- 有关特岗教师辞职信范文(推荐)(特岗教
- 精选党的建设工作要点简短(党的建设的
- 如何写安康杯竞赛活动总结汇总(4篇)(安




