有人用spss系统聚类做过水稻数量性状的聚类吗?

应用多元统计分析习题解答_聚类分析_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
应用多元统计分析习题解答_聚类分析
上传于||暂无简介
阅读已结束,如果下载本文需要使用1下载券
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩17页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢1#&& 16:05:17&
&img src=&http://img./t35/style/images/common/face/ext/normal/d0/z2_org.gif& alt=&[赞]& title=&[赞]& class=&ds-smiley& /&
2#&& 10:09:53&
3#&& 09:55:13&
我的数据理论,统计学底层的东西不懂。算法那些,发展遇到瓶颈。【图文】第九章 SPSS的聚类分析_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
第九章 SPSS的聚类分析
上传于||暂无简介
大小:456.50KB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢聚类分析的SPSS实现_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
聚类分析的SPSS实现
上传于||文档简介
&&s​p​s​s​,​聚​类​分​析
阅读已结束,如果下载本文需要使用0下载券
想免费下载更多文档?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩9页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢苹果/安卓/wp
积分 76, 距离下一级还需 9 积分
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡下一级可获得
权限: 自定义头衔
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
采用聚类分析时,如何确定聚类的数目?这个聚类数目的确定有一定的方法吗?
载入中......
发表于22楼
确定聚类个数的方法:
相似系数:指变量或样本间的亲密程度(即阈值),相似系数较大的聚为一类。常用的有夹角余弦、相关系数、指数相似系数。
标尺值:0~25进行分类。
伪F统计量:应该取伪F统计量较大而类数较小的聚类水平。如下图所示,应该分为4类最合适。
统计量R2:应该取R2统计量较大的类数数目。
伪t2统计量:伪t2统计量大说明不应该合并这两类,应该取合并前的水平。
实际意义:根据你做得试验,必须有实际意义。比 ...
发表于18楼
The NUMCLUSTERS subcommand specifies the number of clusters into which the data willbe partitioned.AUTO Automatic selection of the number of clusters. Under AUTO, you may specifya maximum number of possible clusters. TWOSTEP CLUSTER will search forthe best number of clusters between 1 and the maximum using the criterionthat you specify. The criterion for deciding the number of clusters can beeithe ...
聚类数目的真正确定在于你研究的问题是什么,以及你事先有无一个大致的判断标准。在你用spss运行完你的样品数据得出聚类谱系图后,你可以根据你所研究问题的需要来划分样品的类别,不同的方法,甚至相同方法(比如系统聚类)因为运用了不同的距离公式,都有可能得出不同的分类结论。无所谓哪种是最好的方法,关键是看哪种方法最后得出的结论能让你满意。另外,你不可能得出让你完全满意的结论,你在写报告时可以就那些不满意的地方 ...
本帖被以下文库推荐
& |主题: 1142, 订阅: 6
最常见的聚类方法是系统聚类,其基本思想是:先将待聚类的n个样品(或者变量)各自看成一类,共有n类;然后按事先选定的方法计算每两类之间的聚类统计量,即某种距离(或者相似系数),将关系最密切的两类并为一类,其余不变,即得n-1类;再按前面的计算方法计算新类与其他类之间的距离(或者相似系数),再将关系最密切的两类并为一类,其余不变,即得n-2类;如此继续下去,每次重复都减少一类,直到最后所有样品(或变量)归为一类为止。
在用系统聚类法进行聚类的过程中,涉及到两个类之间的距离(或相似系数)问题。当每类含有两个以上的样品时,不同定义类与类之间距离的方法就产生了不同的系统聚类方法,它们包括:最短距离法、最长距离法、中间距离法、重心法、类平均法以及离差平方和法
聚类数目的真正确定在于你研究的问题是什么,以及你事先有无一个大致的判断标准。在你用spss运行完你的样品数据得出聚类谱系图后,你可以根据你所研究问题的需要来划分样品的类别,不同的方法,甚至相同方法(比如系统聚类)因为运用了不同的距离公式,都有可能得出不同的分类结论。无所谓哪种是最好的方法,关键是看哪种方法最后得出的结论能让你满意。另外,你不可能得出让你完全满意的结论,你在写报告时可以就那些不满意的地方作出解释,说明大概是因为什么原因(比如收集数据的误差、所选项目与所研究问题之间的联系不够密切等等),不要试图掩饰或置之不理。最后,要强调的一点是,如果你是第一次用spss做聚类,最好找一些现成的例子熟悉下基本操作,等把每一步骤的操作都弄熟悉后再去输入你的数据用spss运行。最好用不同方法都试试,而且每一种方法反复做几遍,这样可以避免因为操作失误而得到错误的结论。这是我上学期学多元统计学时的心得,可能不是很好,会让专家笑话,但是还是写出来,希望对刚学习的人有用。
[此贴子已经被作者于 17:08:52编辑过]
总评分:&论坛币 + 10&
学术水平 + 1&
热心指数 + 1&
信用等级 + 1&
统计爱好者
谢谢,楼上这位,解释得很好。还有做完以后用方差分析检验下。
收费统计咨询请加扣扣号码:,请注明来意。
Analyze---classify----hierarchical cluster后,关键是要将dendrogram勾上,运行后的结果图就可以看出分几类较为合理了。
谢谢大家的好建议
如何确定最佳的分类?这个问题是聚类分析历史中尚未完全解决的问题之一,主要的障碍是对类的结构和内容很难给出一个统一的定义,这样就给不出从理论上和实践中都可行的虚无假设。往往在实际应用中人们主要根据研究的目的,从使用的角度出发,选择合适的分类数。Demirmen(1972)曾提出了根据树状结构图来分类的准则:
&O1.任何类都必须在邻近各类中是突出的,即各类重心之间距离必须大;
&O2.各类所包含的元素都不要过分地多;
&O3.分类的数目应该符合使用的目的;
&O4.若采用几种不同的聚类方法处理,则在各自的聚类结果上应该发现相同的类
总评分:&经验 + 3&
论坛币 + 10&
在这里真长草了
可以通过two-step cluster来看一下各个数目的BIC值。公式如下图所示。不过客观的来说这个数目还是得由MARKETER来定,BIC提供的数目只可以供参考。
无限扩大经管职场人脉圈!每天抽选10位免费名额,现在就扫& 论坛VIP& 贵宾会员& 可免费加入
加入我们,立即就学扫码下载「就学」app& Join us!& JoinLearn&
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
京ICP证090565号
京公网安备号
论坛法律顾问:王进律师

我要回帖

更多关于 spss系统聚类 的文章

 

随机推荐