怎么看residual vs fittedLeverage图

后使用快捷导航没有帐号?
查看: 10816|回复: 33
请问plot()函数画出的Residuals vs Leverage这张图怎么理解
中级会员, 积分 442, 距离下一级还需 58 积分
论坛徽章:1
就是我想知道这张图的数据个代表什么意思?
x=c(171,175,159,155,152,158,154,164,168,166,159,164)
y=c(57,64,41,38,35,44,41,51,57,49,47,46)
无标题.png (16.35 KB)
15:48 上传
论坛徽章:2
其实吧……
这种东西wiki上就有,现在居然轮到我这个非统计出身的人来回答……
这个反应的是cook距离
Cook's distance.:A measure of how much the residuals of all cases would change if a particular case were excluded from the calculation of the regression coefficients. A large Cook's D indicates that excluding a case from computation of the regression statistics changes the coefficients substantially.
简单地讲,就是如果某一条数据记录被排除在外,那么由此造成的回归系数变化有多大,如果影响太大就要考虑剔除
注意0.5和1的虚线,从这数据上来看,去除之后的影响都不大,所以就都保留下来。
高级会员, 积分 659, 距离下一级还需 341 积分
论坛徽章:2
寇强 发表于
其实吧……
这种东西wiki上就有,现在居然轮到我这个非统计出身的人来回答……
这个反应的是cook距离
让我纠结的是 不知道 leverage是什么东西 有个定义是 leverage=d(预测值)/ d(真实值) 但弄出这个东西有什么用啊~~
金牌会员, 积分 1968, 距离下一级还需 1032 积分
论坛徽章:1
albertriddle 发表于
让我纠结的是 不知道 leverage是什么东西 有个定义是 leverage=d(预测值)/ d(真实值) 但弄出这个东西有 ...
同感呀,leverage都不知道代表了什么统计意义,查英语词典也没有什么意思是比较符合的。这样的话就不知道这个图代了什么了……
论坛徽章:2
albertriddle 发表于
让我纠结的是 不知道 leverage是什么东西 有个定义是 leverage=d(预测值)/ d(真实值) 但弄出这个东西有 ...
没这个怎么求cook距离呀,没这个怎么做这个图呀
金牌会员, 积分 2743, 距离下一级还需 257 积分
论坛徽章:1
建议可以看一下统计建模与r软件 薛毅书 的第六章里面有讲到cook统计量的~不过本人还是不太明了~
第几页啊?&
金牌会员, 积分 1540, 距离下一级还需 1460 积分
论坛徽章:1
<font color="#378025 发表于
同感呀,leverage都不知道代表了什么统计意义,查英语词典也没有什么意思是比较符合的。这样的话就不知道 ...
弱弱的回一句,可以参考(statistics),虽然比较难看懂,但还是可以有个大概了解
金牌会员, 积分 1398, 距离下一级还需 1602 积分
论坛徽章:1
寇强 发表于
其实吧……
这种东西wiki上就有,现在居然轮到我这个非统计出身的人来回答……
这个反应的是cook距离
注意0.5和1的虚线,从这数据上来看,去除之后的影响都不大,所以就都保留下来。
这句话具体是什么意思啊?
金牌会员, 积分 1227, 距离下一级还需 1773 积分
论坛徽章:1
寇强 发表于
其实吧……
这种东西wiki上就有,现在居然轮到我这个非统计出身的人来回答……
这个反应的是cook距离
请问下:横坐标代表的意义是什么?
金牌会员, 积分 1968, 距离下一级还需 1032 积分
论坛徽章:1
sarinashan 发表于
弱弱的回一句,可以参考http://en.wikipedia.org/wiki/Leverage_(statistics),虽然比较难看懂,但还是可 ...
看了之后有点懂了,大概就和离群值神马的有关系~~继续琢磨去~~~
扫一扫加入本版微信群苹果/安卓/wp
积分 467, 距离下一级还需 333 积分
权限: 自定义头衔, 签名中使用图片
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡, 匿名卡, 抢沙发下一级可获得
权限: 隐身
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
开心签到天数: 40 天连续签到: 1 天[LV.5]常住居民I
本帖最后由 gr23 于
13:01 编辑
对于回归分析中识别强影响点所用残差杠杆图的一个较为全面的理论介绍。
参考资料:A Modern Approach to Regression with R
以下图为范例说明:& && &&&该“残差杠杆图”涉及对标准化残差、杠杆值、库克距离三者的测算,可以通过识别离群点和高杠杆值点(杠杆点)进而识别强影响点。假如存在杠杆点的话,要确定哪些是bad leverage point,具体到图中也就是看库克距离大于<font color="#.5-1的点,也即这样的点我们要评估它对拟合模型的影响(如何进一步评估影响不涉及)。
12:50:54 上传
支持楼主:、
购买后,论坛将奖励 10 元论坛资金给楼主,以表示您对TA发好贴的支持
载入中......
12:54:24 上传
售价: RMB 10 元
无限扩大经管职场人脉圈!每天抽选10位免费名额,现在就扫& 论坛VIP& 贵宾会员& 可免费加入
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
京ICP证090565号
论坛法律顾问:王进律师[转载]一元线性回归分析&(excel,R&软件,SPSS,stata,Minit
一元线性回归 Simple Linear
Regression
Regression
with a Single Continuous Explanatory Variable
(关于残差的3个假设)
of the residuals is constant, whatever the value of
x. This means that if we
take a slice through the scatter plot of y versus x at any particular value of
x, the y values have approximately the
same variation as at any other value of x. If the variance is constant,
we say the residuals are homoskedastic. Otherwise they
are said to be heteroskedastic.&&
with one another, i.e. they are independent. Correlations might
arise if some individuals contribute more than one observation
(e.g. repeated measures) or if individuals are clustered in some
way (e.g. in schools). If it is suspected that residuals are
correlated, the regression model needs to be modified, e.g. to a
multilevel
model.&&&&
and unexplained variance and R-squared
[能解释和不能解释的变异,以及R的平方]
&&&&&&&&&&&&&&&&&&&&&&&&&&&&响应
= 系统部分 +&随机部分
the random part is the residual
between the response and the predictor(s),
while the random part is what is
left over (the unexplained part) after taking account of
the included
predictor(s).&&&
. The part of the
variance in Y that is explained by X (the systematic part of the
model) is called the explained variance in Y.
(no correspondence) and 1
(complete correspondence).
R-squared can also be interpreted as the proportion of the total variance in Y
that can be explained by variability in
Hypothesis
testing 假设检验
.& 实践中用Z-rato检验,
很少用置信区间检验
- predicted&
ri which we obtain by
dividing residual
. If the normality
assumption holds, the points in a normal plot should lie on a
straight line.
against X and
check that the vertical scatter of the residuals is roughly the
same for different values of X with no ‘funnelling’.
. We would expect
approximately 95% of the residuals to lie between &2 and
还可以从以上任何残差图中检查异常值. 异常值是那些残差特别大的点. 期望约95%的残差居于正负2之间.
. If the results are very similar to those based on
all observations, we would conclude that the outlier does not have
undue influence. An observation’s influence can also be measured by
a statistic called Cook’s
&----------------------------------实例-------------------------------
&一元线性回归分析的F检验、t检验都与相关系数检验等价,故通常只需要3个方面的检验:相关系数、标准误差和DW值检验(Durbin-Watson
test,该检验的统计用表可以百度一下)。
数据 (在excel中单列, 太长, 修改成如下形式, 少占地方)
1 用excel 2007分析
在“数据”下拉菜单,可以找到“数据分析”选项框,左击之显示“分析工具A”,在里面找到“回归”分析工具:
Y就是dependent or response variable, X 就是independent,
explanatory, or predictor variable,要选中或者输入它们所在的区域。
标志:选中时,指定第一行是变量名
常数为零:选中时,拟合的模型没有截距。
置信度:默认值是95%。
输出选项:用于指定输出位置
残差:用于指定输出的残差图种类。
正态分布:选中后将给出正态概率图。
完成各个选项后,点击确定,即可得到相应的表格(SUMMARY OUTPUT, RESIDUAL OUTPUT,
PROBABILITY OUTPUT),残差图等。
-------------------------------
------------------------------------
(y的均值)]=
0.0037&10%
。标准化残差等于残差值
,因此无法很好地指示异常值:相应
。计算观测值的
---------------------下图是自己动手画的, 可能是版本有问题,
自动输出的图没法看---------------------
--------------------------------------------------------------------------------------------------
部分(在“会话”窗,点右键,选择“发送节到
回归分析:y 与 x
回归方程为
y = 2.55 + 1.81 x
自变量&&&&
系数标准误&&&&&&
2.5536&&&&&
1.81460&&&&
S = 0.368925&&
R-Sq = 100.0%&&
R-Sq(调整)
自由度&&&&
MS&&&&&&&&&
回归&&&&&&&&&&
残差误差&&&&&
合计&&&&&&&&&
异常观测值
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
拟合值&&&&&&&&&
观测值&&&&
表示此观测值含有大的标准化残差
Durbin-Watson
统计量 = 2.02262
下面是三种残差图,实践中选一种即可
-------------------------------------------------------------
------------------------------------------------------
-------------------------------------以上是SPSS输出结果------------------------------------------
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

我要回帖

更多关于 homemade leverage 的文章

 

随机推荐