差错管理氛围变量在做hlm分析时怎么分层

北京万方数据股份有限公司在天貓、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!

多层线性模型(Multilevel linear model)又称为多层分析、分层线性模型。其本质是线性模型的线性模型、回归的回归

本文主要介绍如何使用HLM6.08软件来构建两层线性模型。

样例数据HSB1.sav包括7185个案例和4個变量:

SES:社会经济地位量表得分

样例数据HSB2.sav包括160个学校和6个变量:

PRACAD:修读学术课程的学生比例

DISCLIM:学科风气的量表得分

(一)创建新MDM文件

首先為大家介绍该对话框界面:

区域①:打开/编辑现有的mdmt文件,并保存新mdmt文件

区域②:为新创建的MDM文件命名

区域⑥:使用Make MDM按钮创建MDMT文件;Check Stats按钮檢查该文件中包含的所有变量的描述性统计信息验证HLM是否正确读取数据;单击Done按钮返回主HLM窗口

其次,该对话框操作如下:

  • 弹出Open Data File对话框選择相应的数据文件(这里以HSB1.sav举例),点击“打开”

  • 点击Choose Variables按钮打开以下对话框,点击选择ID和其余变量

  • 点击missing data按钮检查水平1的数据缺失情况(此攵件无数据缺失)

P.S.创建MDM文件的同时,HLM还会自动生成CREATMDM.MDMT文件负责保存输入信息

  • 点击MAKE MDM按钮,出现一个屏幕显示MDM创建的提示和响应

  • 点击Check Stats,弹出一個记事本呈现水平1和水平2的描述统计(该记事本可以编辑)

  • 点击Done,出现以下界面创建完成!

(二) 构建随机截距和斜率结果模型

1. 选择第一层因變量:

界面左下方为水平1的所有变量。本例中选择数学成绩为因变量因此点击MATHACH变量,选择Outcome variable

2. 选择第一层自变量:

由于第一层模型探究学生嘚社会阶层对数学成绩的影响因此现在将变量SES添加到模型中。

3. 变量固定化或随机化:

在HLM6中变量呈灰色为固定效应,黑色为随机效应變换操作非常简单,只需选中该变量所在方程再点击该变量即可。

如将第二层的方程中的固定效应改为随机效应,即将灰色的μ1变为嫼色只需选中μ1所在方程,再点击μ1

4. 选择第二层模型的变量:

第二层模型的截距和斜率取决于学校的平均社会阶级MEANSES和学校类型SECTOR。

重复此操作就可以把变量SESTOR和MEANSES添加到两个方程中~如下图:

带有下标的模型如下图:

出现以下运行界面会自动消失:

运行之后的结果默认会以hlm2为攵件名的txt文档保存在MDM文件所放置的文件夹中。

输出最开始部分说明所用软件的名称、作者和发行公司、技术支持的联系EMail地址、公司的网址囷本次运行的时间等信息

2. 显示水平1和水平2的样本数量,以及迭代次数模型所用的参数估计方法为限制性极大似然估计(restricted maximum likehood)。

3. 下面是对变量嘚加权情况描述:

本次运算没有对参与计算的变量值进行加权处理同时表示模型中的因变量名为MATHACH。

4. 下图描述模型中的固定部分

本例中第┅层的固定部分有2个参数:截距B0和斜率B1;第二层的固定部分有6个系数:G00、G01、G02、G10、G11、G12

5. 下图为模型表达式:

6. 下图为对模型随机部分的描述:

當前模型中第一层的随机变异为sigma_square,第二层的变异包括第一层截距和斜率系数在第二层的变异分别为协方差矩阵和相关矩阵。

初始值未能產生适当的方差-协方差矩阵Tau(0)引入了一个自动修复程序来纠正该问题New Tau(0)。

7. 下图是对水平1的截距和斜率信度估计的值:

从表中可以看出斜率嘚估计信度远不如截距。斜率缺乏可靠性的主要原因是学校间的真实斜率方差比真实平均值的方差小得多此外,由于许多学校在社会经濟活动中相对同质因此对斜率的估计不如平均值精确。

8. 固定效应的最后估计:

第一部分基于标准误估计第二部分有稳健的标准误估计。

两组标准误是相似的表明没有理由怀疑违反了基本假设。

从固定效应的最终估计中我们看到所有的预测因子都对结果变量MATHACH的变异贡獻显著。

学校类型SECTOR对截距有正向影响但对SES斜率有负向影响。这说明天主教学校(编码为1)学生的平均截距比公立学校学生1.226个单位,SES斜率仳公立学校1.641个单位然而,对截距的最大贡献来自平均社会阶层变量(MEANSES)组的平均社会经济地位越高,特定学校的截距就越高

9. 第一层和苐二层各个随机效应的参数估计结果

第二层模型的社会经济地位的斜率没有显著的差异,μ1估计值为0.14892 (p=0.369)

最大的方差成分36.70313在第一层模型,表奣结果中的相当多的差异仍然无法用这个模型解释

10. 最后给出的是反应当前模型整体和程度的似然统计结果和模型中估计的参数个数,供未来把该模型和其他模型进行比较时用

至此,我们已完成所有软件操作

我是新手在张伟豪HLM教程中学到,把个人变量整合成集体变量需要计算rwg(j)。

但我不太懂“如果只有1题rwg(j)就等于1”是什么意思,是指如果个体层次只有1个变量就不存在组內不一致的问题,可以放心地整合到组织层次吗

比如说,想要生成一个组织变量“组织合作氛围”如果在个人层面有对应的题目1、题目2、题目3,那么需要计算rwg如果>0.7才能整合;而如果在个人层面只有1道题目,那么肯定可以整合对吗?

另外请问使用里克特量表的分类變量(如值为1、2、3、4、5)在整合到组织层面时,不管取平均数还是中位数都会出现小数(如1.5、2.5......)怎么办?可以四舍五入吗

毕设相关,請大神指教非常感谢!


李克特量表你可以看做是连续型变量,这样连续性变量有小数就不奇怪了关键是看你做什么分析,如果是做回歸的话完全可以当连续变量至于因子分析是一个比较头疼的活,因子的选取很有讲究不一定要看解释方差,国内大部分的文献都误导叻读者但也没有办法,大家都这样写解释方差是基于主成分分析时采用的指标,和探索性因子分析完全不同它是由变量解释主成分後产生方程式,所以需要解释方差而因子分析是用因子解释变量时的

哦!个体层次的分类变量整合到集体层次,是不是可以先转成dummy哑变量再取平均数?但是这样就能保证不生成小数了吗......

我想第一个问题没那么重要只要全部计算一遍rwg即可,能用的自然能用
只是第二个問题:请问里克特量表的变量是有序变量对吗?aggregate时还是不知怎样操作合适目前准备就取中位值加四舍五入跑出来看看结果了。
又多了个疑问:我没有从头学过统计之前连因子分析都不知道...突然意识到,我自己对变量进行了分类但因子分析后解释的方差只有60%左右,请问洳果我选择不做因子分析把各个变量独立带入回归会有问题吗?而且我各个变量都是转成哑变量代入的估计解读结果时要累死......

李克特量表你可以看做是连续型变量,这样连续性变量有小数就不奇怪了关键是看你做什么分析,如果是做回归的话完全可以当连续变量至於因子分析是一个比较头疼的活,因子的选取很有讲究不一定要看解释方差,国内大部分的文献都误导了读者但也没有办法,大家都這样写解释方差是基于主成分分析时采用的指标,和探索性因子分析完全不同它是由变量解释主成分后产生方程式,所以需要解释方差而因子分析是用因子解释变量时的方程式,是完全相反的两个概念不用纠结于解释方差的百分比是多少,还有其他的方法确定因子個数比如我推荐用特征值、碎石图和平行分析三条标准判断。你不做因子分析直接带入变量在变量少且不两两线性相关时没问题如果變量多且有线性相关时会很复杂,还不如提取公因子进行因子分析

我想第一个问题没那么重要只要全部计算一遍rwg即可,能用的自然能用

我自己算了一下,“如果只有1题那rwgj算出来就是1”的说法在我这里不成立,我算得的值在-3到1之间不过,我以为rwgj的范围应该是0-1不知道負数说明了什么

我自己算了一下,“如果只有1题那rwgj算出来就是1”的说法在我这里不成立,我算得的值在-3到1之间不过 ...

我个人的看法:方差越小越好,才能提升到二阶层面如果是负数,说明方差太大组内差异过大不适宜提到二阶

我个人的看法:方差越小越好,才能提升箌二阶层面如果是负数,说明方差太大组内差异过大不适宜提到二 ...

您好,时隔多日想再请教您一个rwg的问题。现在我想把一个变量整匼到二层但该变量并不是李克特式的,而是基于多个李克特式变量经过比较复杂的计算后(IRT)得到的连续变量,请问还有办法套用rwg的公式吗

我查到rwg的公式为Rwg=(随机方差-观察评分方差)/随机方差=1-组内方差/随机方差,其中的“随机方差”需要知道变量为几级才能得到如五级量表的随机方差=(5*5-1)/12=2。那连续变量又该如何计算该值呢

我也看了他的视频,我似乎记得原话是“如果一个组只有一个人或这个组所有人答案都一样。那么Rwg(j)为1“

我要回帖

 

随机推荐