教学文库网 - 权威文档分享云平台
您的当前位置:首页 > 精品文档 > 高等教育 >

最新DIStruct使用说明

来源:网络收集 时间:2026-07-02
导读: 1 Introduction 2 聚类软件结构;提供了将个体置入K簇的迭代算法。 K是预先选择的参数,3 但可以在独立structure软件运行中是可以变化的。每个个体都会被分到每个4 簇(总簇为K)“成员系数(成员协同因素/系数)”,使得每个个体在K簇中的“成5 员系数”系

1

Introduction

2

聚类软件结构;提供了将个体置入K簇的迭代算法。 K是预先选择的参数,3

但可以在独立structure软件运行中是可以变化的。每个个体都会被分到每个4

簇(总簇为K)“成员系数(成员协同因素/系数)”,使得每个个体在K簇中的“成5

员系数”系数总和均为1(意思是把每个个体的成分分到K簇中去,这样每个个6

体在K簇中就都有成分了,一个个体在K簇中的成分值加起来就为1,不是每个7

个体在每个簇中都有成分分布,个体在某一个簇中没有成分则其“成员系数”8

系数则为0)。隶属系数矩阵,其中个体数就是行数,K就是列数,这里被称为9

单独的Q矩阵。对于每个群体(population),可以对每个簇(亚群)的成员10

系数可以通过每个个体进行平均计算,以创建群体Q的矩阵。

11

12

显示structure软件结果的一种方便的方式是将每个体显示为一条线段。该13

线段被划分为K个彩色组分(K种不同的颜色),它们代表个体在K个簇中预估14

的成员系数(成员协同因素/系数)隶属系数。structure软件提供了基于这15

个一般想法创建图形的各种选择。可以制作没有使用structure软件的分散图16

来生成单独(个体)的Q矩阵和群体Q矩阵。如果使用其他程序,则这些程17

序的输出结果(格式)必须简单地被格式化以匹配distruct的数据输入格

18

式。对于本手册的其余部分,默认structure软件产生的数据作为本软件的19

输入数据与格式。

20

Basic owerview

21

distruct程序用C语言编写,编译版本适用于Linux,Mac OSX和Windows。

22

它根据structure软件的输出数据(格式)来读取数据文件(意思是必须使用23

structure软件的结果文件,才能在用本软件上使用)。它允许其他可选文件,

1

24

允许用户控所要显示群体的从左到右的顺序,标签打印在图上方和/或下方的25

数据,簇的从底到顶的顺序以及所使用的颜色。输出以PostScript格式打印,26

可以使用Ghost View等程序显示生成的图形。如果这个数字不能令人满意,27

通常可以直接修改Post Script代码,而不必重新运行distruct(实际上,如28

果程序似乎没有做你想要的操作,PostScript脚本经常可以帮助修改和完善)。

29

程序设置在文件drawparams中指定,尽管有些可以使用命令行参数给出。本30

文档中的全部大写字母中的变量用于drawparams

31

Input files

32

要绘制的数据以从structure软件输出派生的ASCII文本格式的文件中指定。

33

为了允许structure软件输出文件的多次修改,不使用结构输出文件本身。相34

反,程序采用一个具有群体Q矩阵(必需)的文件,并且具有单个Q矩阵(可35

选)的单独文件,这都是structure软件的输出文件,这些(本软件需要的)36

文件可以很容易地生成,例如通过剪切和粘贴。

37

本文档中使用的示例输入文件是从Rosenberg等人的图2中显示的针对中南/ 38

南亚群体的K = 5图形进行修改的。除了破坏代码,distruct包包含与此数据39

集相关的七个文件以及文件drawparams。文件casia f是structure软件的输40

出文件。文件casia.ps是应用于其他五个文件中的数据和设置时的输出结果,41

如表1到5(刚好为5个文件)所示。 Color Brewer目录中提供了各种各样的42

配色图。

43

群体Q 矩阵

44

如果NUMPOPS(number of population)是预定义群体的数量,K是簇数量,则45

distruct期望具有每行NUMPOPS行和K + 2列的文件。此文件存储在INFILE POPQ 46

中。空白行和额外的空格是容忍的。在表1的示例中,NUMPOPS = 9和K = 5。

47

在表1中,每行代表一个群体的结果。第一列是一个整数是为一个群体(品种

2

48

/品系)提供的一个代码(编号),且后面要跟一个冒号。挨着的K列是簇1,2,...,49

K([0,1]中的实数)的隶属系数(成员协同因素/系数)。理想情况下,这些K 50

列中的数字总和为1; 如果他们不这样做,那么程序将它们归结为一般。最后51

一列给出了群体(品种/品系)(一个整数)的样本大小(意思就是一个品种/品52

系采了好多份样品)。

53

54

虽然大多数应用程序可能会显示单个Q矩阵,但一些应用程序可能希望仅显55

示群体Q矩阵(例如,Wilson等人(2001)的表2)。因此,如果PRINT- INDIVS 56

设置为零,则distruct将仅显示群体Q矩阵。如

57

58

2.2 个体Q矩阵

59

如果NUMINDS(number of individual)是个体的数量,PRINT INDIVS设置

3

60

为1,则distruct需要具有NUMINDS行的文件,每行至少有K + 6列。该文件61

存储在INFILE-INDIVQ。空行和空格是被允许的。此外,structure软件输出的62

用于置信区间的一些列将被忽略。在表2所示的示例中,NUMINDS = 210。每63

一行显示1个体的成员系数(成员协同因素/系数)。第2列给出个体的代码(编64

号)。第4列给出了个体所属种群(品种/品系)的代码。第1列,第3列和65

第5列被忽略。列6至K + 5显示群集1,2,...,K的成员系数(成员协同因66

素/系数)。理想情况下,这些K列中的数字为1; 如果他们没有,程序将它们的67

总和归一化。

68

个体根据种群(品种/品系)的代码自动分组归类,图中个体的从左到右的顺69

序与输入文件中个人的从上到下的顺序相同。显示单个Q矩阵的示例在70

Rosenberg等人的图1和图2中。

71

72

2.3 Labels below the figure

73

要将标签放在图下方,请将PRINT LABEL BELOW设置为1.程序将搜索INFILE 74

LABEL BELOW指定的文件。默认值是将群体代码(编号)打印为标签。如果找75

到该文件,文件行上的群体的输入顺序将用于群体图形的左右顺序。第一列包76

含群体代码(一个整数); 其余的列包含要打印在图下方的文本。

77

请注意,数据中未找到的其群体可以包含在该文件中。这些额外的行将被忽78

略。

4

79

80

当使用PRINT LABEL ATOP = 1时,图形上方的标签类似于以下标签。程序81

将搜索INFILE LABEL ATOP指定的文件。默认是将群体的代码打印为标签。如82

果找到该文件,文件行上的群体顺序将用于总体图形的左右顺序。如果图形的83

顶部和底部需要标签,INFILE LABEL ATOP和INFILE LABEL BELOW中的条目应84

按相同的顺序列出。第一列包含群体的代码(编号)(一个整数); 其余的列85

包含要在图表上方打印的文本。与下图中的标签一样,此文本可以由多列组成。

86

颜色数的确定,K值多大就有多少种颜色,当颜色数不够时可以在文件夹87

ColorBrewer中选用。

88

89

2.5 Vertical cluster order and cluster colors(垂直集群顺序和集群90

颜色)

91

描述簇的垂直顺序的排列可以在指定的INFILE CLUST PERM …… 此处隐藏:2970字,全部文档内容请下载后查看。喜欢就下载吧 ……

最新DIStruct使用说明.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.jiaowen.net/wendang/346011.html(转载请注明文章来源)
Copyright © 2020-2025 教文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:78024566 邮箱:78024566@qq.com
苏ICP备19068818号-2
Top
× 游客快捷下载通道(下载后可以自由复制和排版)
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
× 常见问题(客服时间:周一到周五 9:30-18:00)