经济模型，多元线性回归相关性回归分析一个解释变量和被解释变量相关性，t检验和F值检验都通过了，R&#178;大小重要吗？

羽毛球技术 | 体育赛事 | 英文歌曲 | 住宅风水 | 用户界面设计师 | 六爻 | 书籍改编电影 | 德国足球甲级联赛 | 欧美明星 | PLC | 中国足球 | aj1 | 国家队 | 拜仁慕尼黑足球俱乐部 | 小说创作 | 配音 | iOS应用 | NBA 2K | 古典音乐 | 面相 | 火影忍者 | 武汉大学 | 土拨鼠 | 营销策划 | 秦时明月之天行九歌 | 设计师 | 巴塞罗那足球俱乐部 | 尤文图斯 | 实况足球（游戏） | 少帅 | 罗玉凤 | 比利时 | 跑鞋 | 冷知识 | 肖战 | 李元胜 | 古琴 | 按键精灵 | 罗兰 | 徐波 | 激光手术 | 角色扮演 | 关晓彤 | 微电影 | safari | 北京国安 | 古汉语 | 曼彻斯特联 | 玄幻小说 | 科幻小说 | 双眼皮手术 | 主题曲 | 年会 | 检测仪 | 徒步 | 互联网公司 | 百度输入法 | 镜头 | 宜昌市 | 自拍 | 金蝶 | 电子烟 | 网站建设 | 广播体操 | 文身 | nba篮球 | 索尼(sony) | 天体物理学 | 痛风 | 象棋 | 牛皮癣 | 皮肤护理 | 周星驰（人物） | 试管婴儿 | 亚足联亚洲杯（AFC Asian Cup） | 健美 | 美术生 | 迅雷（软件） | 战斗机 | 穿越小说 | 张璐 | 姓氏 | 诸葛亮 | 后宫·甄嬛传（书籍） | 虎牙直播 | snh48 | 阿迪达斯 | 投影仪 | 组装机 | 微信群 | 阿迪达斯(adidas) | 网球王子 | 分子生物学 | 耽美 | 武磊 | 婚礼 | 表演 | 中国武术 | 动画电影 | Air Jordan | 张子枫 | 免费软件 | 相声演员 | 摩羯座 | 宿舍 | ansys | 法国足球甲级联赛 | 户外 | 剧场版 | 杨凡 | 科幻电影 | galgame | 融资 | 关节炎 | NBA季后赛 | 神话 | 王力宏（人物） | 建模 | 计算机病毒 | 广州恒大淘宝足球俱乐部 | 北京奥运会 | 电脑电源 | 百度翻译 | 字幕 | 讯飞输入法 | 海关 | 易烊千玺 | 深度学习 | 编辑器 | 澳门特别行政区 | 直播 | 流氓软件 | 事故 | 大片 | 李景亮 | 郭富城 | 日语歌曲 | 卡牌游戏 | 小品 | 东京 | 花卉 | 音乐剧 | 互联网创业 | 占卜 | 羽毛球拍 | 婆媳关系 | 日本动画 | 巴黎 | 拳击比赛 | 东南亚 | 足球经理（FM）（游戏） | youtube | 胡歌（演员） | 地铁跑酷 | 植发 | 张继科 | 三国 | 用户界面 | 演技 | 百度竞价 | 青梅竹马 | 移动硬盘 | 韩晓鹏 | 马龙 | 瘦腿 | 宠物医疗 | 巨蟹座 | 徐峥 | 天蝎座 | 胸肌 | 赵丽颖（演员） | adidas阿迪达斯 | 低音炮 | 星际争霸（游戏） | 豆瓣电影 | 微信开放平台 | 手绘 | 吉他学习 | 江苏卫视 | 模特 | 创意 | 团队管理 | 奢侈品 | 王源 | TANK | 笛子 | 偶像 | 莱斯特城 | 维生素 | 新百伦 | 国际物流 | 前女友 | 李小龙 | 华语流行音乐 | 猎头公司 | crm | 搏击项目 | 网站运营 | 鼻炎 | 篮球游戏 |

你的位置：网站首页 >> 频道首页 >>数据分析 >>经济模型，多元线性回归相关性回归分析一个解释变量和被解释变量相关性，t检验和F值检验都通过了，R&#178;大小重要吗？

经济模型，多元线性回归相关性回归分析一个解释变量和被解释变量相关性，t检验和F值检验都通过了，R&#178;大小重要吗？

来源：蜘蛛抓取(WebSpider) 时间：2016-05-08 11:15 标签：多元回归分析t检验

多元回归分析与Logistic回归分析的应用研究_大学生考试网
当前位置： >>
多元回归分析与Logistic回归分析的应用研究
南京信息工程大学硕士学位论文多元回归分析与Logistic回归分析的应用研究姓名：孙振宇申请学位级别：硕士专业：应用数学指导教师：李刚
中文摘要本文主要研究了线性回归分析中多元回归分析及非线性回归分析中Ｌｏｇｉｓｔｉｃ回归分析在实际中的应用。第一部分综合使用影响分析、聚类分析以及多元回归分析等方法，并把这些方法融合在一起预测五强溪水库的流量。在对湖南沅水流域包括河溪、风滩、浦市等２２个水文观测站１９９６―２００３年的日雨量、流量资料等记录数据进行分析后，运用影响分析的统计方法对大量的观测数据进行筛选，在去除异常点并找出主要影响因子之后作聚类分析，根据分类后的数据再分别采用多元回归分析建立模型对进入五强溪水库的水流量进行预报，三个模型的预报准确率都在９０％以上，获得了很好的预报效果。第二部分结合教师互评，上级领导（或专家）对教师评价，学生对教师的评价这三方面应用Ｌｏｇｉｓｔｉｃ回归分析的方法来进行研究，提出一个对教师教学质量的总体评估模型，并用ＳＡＳ软件进行编程实现。这种评估模型能比较科学客观的评价教师的教学情况，可以广泛应用于其他领域的评估工作。关键词多元回归分析；Ｌｏｇｉｓｔｉｃ回归分析；影响分析；聚类分析；流量预报ＡｂｓｔｒａｃｔＩｎｔｈｉｓｐａＤｅｒ，ｗｅｍａｉｎｌｙｄｉｓｃｕｓｓｅｄｔｈｅｐｒａｃｔｉｃａｌａｐｐｌｉｃａｔｉｏｎｏｆｔｈｅｍｕｌｔｉｐｌｅｒｅｇｒｅｓｓｉｏｎａｎａｌｙｓｉｓｍｅｔｈｏｄｂｅｌｏｎｇｅｄｐａｒｔ，ｗｅｍａｉｎｌｙｕｓｅｄｔｈｅｉｎｆｌｕｅｎｃｅｔｏｔｈｅｌｉｎｅａｒｒｅｇｒｅｓｓｉｏｎｍｅｔｈｏｄａｎｄＬｏｇｉｓｔｉｃｒｅｇｒｅｓｓｉｏｎａｎａｌｙｓｉｓｍｅｔｈｏｄｂｅｌｏｎｇｅｄｔｏｔｈｅｎｏｎ．１ｉｎｅａｒｒｅｇｒｅｓｓｉｏｎｍｅｔｈｏｄ．Ｉｎｔｈｅｆｉｒｓｔａｎａｌｙｓｉｓ，ｔｈｅｃｌｕｓｔｅｒｉｎｇａｎａｌｙｓｉｓａｎｄｔｈｅｍｕｌｔｉｐｌｅｒｅｇｒｅｓｓｉｏｎａｎａｌｙｓｉｓｏｆｍｅｔｈｏｄａｎｄｍｅｒｇｅｔｈｅｓｅｍｅｔｈｏｄｓｔｏｇｅｔｈｅｒｔｏｆｏｒｅｃａｓｔｔｈｅｒｕｎｏｆｆｔｈｅ耽Ｑｉａｎｇｘｉｒｅｓｅｒｖｏｉｒ．Ｂｙａｎａｌｙｚｉｎｇｔｈｅｄａｉｌｙｐｒｅｃｉｐｉｔａｔｉｏｎａｎｄｆｌｏｗｄａｔａｏｆ２２ＨｕｎａｎＹｕａｎｓｈｕｉｖａｌｌｅｙｉｎｃｌｕｄｉｎｇＨｅｘｉ．Ｆｅｎｇｔａｎ．ｏｎｕｓｅｈｙｄｒｏｌｏｇｙｏｂｓｅｒｖａｔｉｏｎｓｔａｔｉｏｎｓｏｆＰｕｓｈｉ．ｗｅｆｉｒｓｔｔｈｅｓｔａｔｉｓｔｉｃａｌｍｅｔｈｏｄｏｆｉｎｆｌｕｅｎｃｅａｎａｌｙｓｉｓｍａｓｓｏｂｓｅｒｖａｔｉｏｎｄａｔａｔｏｆｉｌｔｒａｔｅ．ａｎｄｔｈｅｎｅｍｐｌｏｙｔｈｅｃｌｕｓｔｅｒｉｎｇｍｅｔｈｏｄｔｏｔｈｅｍａｉｎｌｙｉｎｆｌｕｅｎｃｅｆａｃｔｏｒｆｏｕｎｄｅｄａｆｔｅｒｒｅｍｏｖｉｎｇｔｈｅａｂｎｏｒｍａｌｓｐｏｔ．Ａｔｌａｓｔ．ｔｈｅｍｕｌｔｉｐｌｅｒｅｇｒｅｓｓｉｏｎｍｅｔｈｏｄｉｓａｄｏｐｔｅｄｓｏｒｔｅｄｄａｔａｔｏｂｕｉｌｄｍａｔｈｅｍａｔｉｃａｌｍｏｄｅＩｔｏｆｏｒｅｃａｓｔｏｆｔｈｅｔｈｒｅｅｍｏｄｅｌｓｔｈｅｓｅｃｏｎｄｐａｒｔ，ｗｅａｎａｌｙｓｉｓｏｎｔｈｅｒｕｎｏｆｆｏｆｔｈｅｒｅａｃｈｅｓｕｐｔｏＷｕＱｉａｎｇｘｉｒｅｓｅｒｖｏｉｒ．Ｔｈｅａｃｃｕｒａｃｙｒａｔｉｏ９０％ａｎｄｇｅｔｓａｐｒｅｆｅｒａｂｌｙｐｒｅｄｉｃｔｉｎｇｒｅｓｕｌｔ．ＩｎａｐｐｌｙｔｈｅＬｏｇｉｓｔｉｃｒｅｇｒｅｓｓｉｏｎａｎａｌｙｓｉｓｗａｙｔｏｃｏｎｄｕｃｔｔｈｅｒｅｓｅａｒｃｈｔｅａｃｈｅｒｓ’ｃｏｍｍｅｎｔｓｍｕｔｕａｌｌｙ，ｈｉｇｈｅｒａｕｔｈｏｒｉｔｙｔｅａｃｈｅｒ，ｓｔｕｄｅｎｔｓ’ａｐｐｒａｉｓｅｓｔｏｔｈｅｃｏｍｂｉｎｅｄ诚ｔｈｌｅａｄｅｒｓ’（ｏｒｅｘｐｅｒｔｓ’）ａｐｐｒａｉｓｅｓｔｏｔｈｅｔｅａｃｈｅｒ．Ｗｅｐｒｏｐｏｓｅａｎｏｖｅｒａｌｌａｐｐｒａｉｓａｌｍｏｄｅｌｔｏｃａｎｅｖａｌｕａｔｅｔｈｅｔｅａｃｈｅｒ’ＳｔｅａｃｈｉｎｇｑｕａｌｉｔｙｂｙｕｓｉｎｇｔｈｅＳＡＳｓｏｆｔｗａｒｅ．１１１ｉＳｍｏｄｅｌａｐｐｒａｉｓｅｔｈｅｔｅａｃｈｅｒｓｃｉｅｎｔｉｆｉｃａｌｌｙａｎｄｂｅｕｓｅｄｗｉｄｅｌｙ．Ｋｅｙｗｏｒｄｓ：ｍｕｌｔｉｐｌｅｒｅｇｒｅｓｓｉｏｎａｎａｌｙｓｉｓ；Ｌｏｇｉｓｔｉｃｒｅｇｒｅｓｓｉｏｎａｎａｌｙｓｉｓ；ｉｎｆｌｕｅｎｃｅａｎａｌｙｓｉｓ；ｃｌｕｓｔｅｒｉｎｇａｎａｌｙｓｉｓ；ｆｌｏｗｆｏｒｅｃａｓｔｉｎｇＩＩ学位论文独创性声明本人郑重声明：１、坚持以“求实、创新＂的科学精神从事研究工作。２、本论文是我个人在导师指导下进行的研究工作和取得的研究成果。３、本论文中除引文外，所有实验、数据和有关材料均是真实的。４、本论文中除引文和致谢的内容外，不包含其他人或其它机构已经发表或撰写过的研究成果。５、其他同志对本研究所做的贡献均已在论文中作了声明并表示了谢意。彳．、作者签名：固！当ｋ善日期：≯弘乒．，．；一学位论文使用授权声明本人完全了解南京信息工程大学有关保留、使用学位论文的规定，学校有权保留学位论文并向国家主管部门或其指定机构送交论文的电子版和纸质版；有权将学位论文用于非赢利目的的少量复制并允许论文进入学校图书馆被查阅：有权将学位论文的内容编入有关数据库进行检索：有权将学位论文的标题和摘要汇编出版。保密的学位论文在解密后适用本规定。作者签名：拯妊覃日期：丝￡生第一部分五强溪水库上游流量的预报研究第一章绪论１．１研究目的与意义在当今社会，随着科技的发展，我们已经人为的尽量减少自然灾害造成破坏。在各种自然灾难中，洪水造成死亡的人口占全部因自然灾难死亡人口的７５％，经济损失占到的４０％。更加严重的是，洪水总是在人口稠密、农业垦殖度高、江河湖泊集中、降雨充沛的地方，如北半球暖温带、亚热带。中国、孟加拉国是世界上水灾最频繁、肆虐的地方，美国、日本、印度和欧洲也较严重。在我国，２０世纪死亡人数超过１０万的水灾多数发生在这里，１９３１年长江发生重大洪水，淹没７省２０５县，受灾人口达２８６０万，死亡１４．５万人，随之而来的饥饿、瘟疫致使３００万人惨死。而号称“黄河之水天上来”的中华母亲河黄河，曾在历史上决口１５００次，重大改道２６次，淹死数百万人。１９９８年中国的“世纪洪水”，在中国大地到处肆虐，２９个省受灾，农田受灾面积３．１８亿亩，成灾面积１．９６亿亩，受灾人Ｃ１２．２３亿人，死亡３千多人，房屋倒塌４９７万间，经济损失达１６６６亿元。水库是为解决水患和蓄水备用而出现和发展起来的。在水流量较大或发洪水时，水库可以起到蓄水拦洪削峰的作用，而在干旱的时候放水灌溉，解决部分地区水资源不足的情况。我们通过长时间的观测某一区域的雨量与流量，并通过分析这些观测数据来预报流入水库的流量，这对于水库合理调度是非常重要的。在灾害洪水频繁发生时，提前对洪水流量进行准确的预测并及时发出预警对于减灾抗灾意义重大，关系到当地人民群众的生命安全与财产安全。综上所述，对影响分析、聚类分析和多元回归分析的研究，特别是在对水库流量预测的应用研究，具有重大的社会经济意义，也具有重要的学术和科研意义。１．２研究背景五强溪水库位于沅水下游沅陵县境内，于１９９５年建成。水库控制集雨面积８３８００平方公里，占沅水流域总面积的９３％，坝址年平均降雨量１７２４毫米，年平均流量２０４０秒立米，年径流总量６４３亿立方米。水库总库容为４２亿立米，正常水位１０８米以下预留防洪库容１３．６亿立米，库容系数０．０３１，为季调节水库。五强溪水电站则是沅水梯级开发的骨干工程，枢纽工程主要由左岸三级船闸、河床溢流坝段、右岸引水坝段及坝后厂房组成。随着气候的异常变化以及江湖关系的逐渐恶化，进入９０年代，沅水流域连续几年发生特大洪水，五强溪坝下游洪涝灾害损失惨重。关于洪水预报的研究工作从２０世纪７０年代开始，随着大型计算机的应用以及一些新的理论如控制理论的实时预报技术大量被引入洪水预报中，洪水预报的研究工作在我国迅速发展。【ｌＪ１．２．１聚类分析的研究及应用聚类分析是将一批样本或变量，按照它们在性质上的亲疏程度进行分类的一种多元统计方法。它能很好地解决在没有先验知识的情况下样本或指标的分类问题。这一方法被广泛应用于金融、电信、医药、制造等各个领域。在研究对金融发展与经济发展的联系中，美国经济学家ＧｏｌｄＳｍｉｔｈ［２１曾详细论述了金融发展与经济发展的关系，并开拓了用定量方法描述金融发展的先河，揭示了各国金融发展的规律性趋势。国内一些学者也对金融发展进行了一定的研究，中央财经大学的冯颖洲、曲炳洋【３】运用系统聚类的方法对我国３１个省区的金融发展水平进行了比较分析，但是只采用了２０００年的数据，结论也只基于２０００年一个时间段。田霖Ｈ对区域金融综合竞争力进行了聚类分析。冯碉【５Ｊ等也对我国区域经济发展进行了聚类分析。随着股票在人们生活中所占的比重越来越大，李敏【６】等也将聚类分析应用在证券投资基本分析中，通过分析比较出有成长潜力的股票，为投资者特别是中小投资者提供理性的长期投资的参考数据。另外聚类分析在统计分组中也被广泛适用，在统计分组理论中，为了深入地揭示所研究现象的特征，往往要同时选择若干个标志进行复合分组。然而由此却产生了一个问题，由于组数过多导致总体单位的分布过于分散，从而不利于揭示总体的分布特征，为此往往引进聚类分析方法。比如在研究人口问题、国民经济等问题中，往往都会遇到分组分类的问题。李福平【＿７】等将聚类分析方法应用在统计分组中，并通过实例证明所得结果符合统计分组的要求。１．２．２影响分析的研究及应用在线性回归分析中，为了分析某组数据对参数估计，预测，模型等得影响大小，找出那些所谓的强影响点，人们从不同角度提出了衡量一组数据是否为强影响点的度量，即影响分析。从目前来看，影响分析的内容大致可分为两个方面：（１）全局影响分析法。在定义度量影响的统计量后，用影响统计量来刻划２了删除一个或多个数据点对回归分析影响的大小，这是影响分析初期研究的重点，也是最有实用价值的内容。这种分析法一般基于影响函数的统计量，如ＣｏｏＫｌ８１统计量。（２）局部影响分析法。局部影响分析法是由ＣｏｏＫｌ９１（１９８６）首次提出的一种新方法，其思想是在某种扰动模式下，用基于似然替换的影响图的正则曲率以及相应的最大响应方向以识别数据中的影响点。这种方法使用灵活，可以分析数据中的联合影响，进而识别数据中的Ｍａｓｋｉｎｇ效应，因而得到了广泛的应用。在此之后，许多新的方法逐渐发展起来，如基于广义影响函数和广义ＣｏｏＫｕＪ统计量的局部影响分析（如ＣｏｏＫ（１９８６），Ｌｅｓａｆｆｒｅ（１９９８），ＥｓｃｏｂａｒａｎｄＭｅｃｋｅｒＩＩ等），Ｂａｙｅｓ局部影响分析等（如韦博成【ｌｌ】等（１９９１）），以发展和完善局部影响分析的理论和思想。从某种意义上讲，影响分析是统计推断关于数据的稳定性问题。因此，对其他统计问题，它同样是必要的。实际上在判别分析，广义线性模型，主成分分析等方面都有一些研究成果。在实际应用中，这一方法也被用于各种领域，朱仲义【１２】等研究了半参数非线性回归模型的局部影响分析，并且所得结果与线性模型分析的结果一致。张春丽【”】等也应用该方法研究了单纯形分布非线性模型的局部影响分析，并通过实例证明了这一方法的应用价值。石磊【１４】等应用局部影响分析方法，讨论了主因子模型中影响点的识别方法，并将这一方法用于地质数据中，以识别特殊地质数据及结构。１．２．３多元回归分析的研究及应用回归分析是一种通过一组预测变量（自变量）来预测一个或多个响应变量（因变量）的统计方法。它也可用于评估预测变量对响应变量的效果ｌＩ副。在大多数的实际问题中，影响因变量的因素不是一个而是多个，一般称这类问题为多元回归分析问题。它是多元统计分析的各种方法中应用最广泛的一种。多元回归分析，是经济预测中常用的一种方法，通过建立经济变量与解释变量之间的数学模型，对建立的数学模型进行Ｒ检验，Ｆ检验，ｔ检验，在符合判定条件的情况下把给定的解释变量的数值代入回归模型，从而计算出经济变量的未来值即预测值。【１６ｌ在实际应用中，采取将预报因子和预报量按一定标准分为多级，用分级尺度代换较大的数字，更能揭示预报因子与预报量的关系，预报效果比采用数值统计方法有明显的提高，在实际应用中具有一定现实意义。多元回归方法因其实用性及有效性，在现今社会越来越多的领域得到广泛应用。早在１９８６年，郑钟光【１７】就将多元回归分析应用在矿石体重测定中，并用实践证明了这一方法具有较大的优越性。苑玉风【ｌ列应用多元回归分析和逐步回归分析，研究某种汽车发动机用球墨铸铁活塞环球化率的影响因素，并建立了相关关系。李金海【１９】在多元回归数学模型基础上，提出了多元回归方法的应用步骤。另外这一方法也被广泛的应用于预报各种气象参数，牛桂萍，黄祖英唧Ｊ用多元回归分析做暴雨的长期预报，虽然误差较大，但他们同时指出有待于因子本身作进一步的改进。林祖享，梁舜华［２Ｈ运用多元回归方程，绘制出赤潮生物的变化趋势图，并预报是否可能发生赤潮。此外，多元回归分析方法也被越来越多的应用于预报各种自然灾害，王震掣２２】等将这一方法用于滑坡预报，并用实例证明了能在一定程度上解决滑坡的预报问题。刘昌蓉１２３Ｊ等采用多元线性回归分析方法，建立地质灾害危险级别的评价模型，按照计算结果综合反映出的地质灾害活跃程度的高低，对该区域进行有效防治，从而有利于地质灾害的减轻减少。袁宇【２４】运用多元回归分析法，建立了化学污染面积，纵身与诸条件的关系，快速估算预测出突出性化学污染危害，并提前做出防范措施。索南仁欠【２５】也提出了水质污染的多元回归分析方法，这一方法的建立有助于我们更好加直观地了解水质的最显著污染因素及在具体治污过程中，更有针对性地实施合理治污方案。对于最近太湖大面积的蓝藻事件，如果我们也应用这一方法，提前预测并做好防范工作，那污染所带来的危害及经济损失一定会有所减少。而本文也是利用这一方法通过预报水库流量并及时发出预警，以便提前做好防范工作。１．３本文主要研究内容如今，面对数字科技的进步和信息社会的发展，我们在科学研究与工作中都会遇到成千上万的统计数据，如何从中挖掘出对我们有用的信息并利用这些数据来对我们的研究发挥启示性的作用或者在我们的实际工作中起到指导作用，这成了我们研究的重点。很多科研工作中要处理的数据量非常之大，于是我们想到把数据先分类然后再做分析。数据分类是指按照分析对象的属性、特征，建立不同的组类来描述事物。数据分类是数据挖掘的主要内容之一。数据分类过程一般分两个步骤。第１步：建立一个模型，描述给定的数据类集或概念集。通过分析由属性描述的数据库元组来构造模型。第２步：使用模型对数据进行分类。包括评估模型的分类准确性以及对类标号未知的元组按模型进行４分类。在本文中主要研究了影响分析、聚类分析与回归预报及其应用，并在实际问题预报湖南沅水流域的五强溪水库流量中应用此种方法，对水库上流各水文站的近十年的观测数据做聚类分析及影响分析，并对分类数据分别建立多元回归模型，从而得到优良的预报结果。第二章２．１资料和方法资料说明本文所使用的具体资料数据由南京水利所提供，其中主要为湖南沅水流域部分区间１９９６－２００３年的日雨量、流量资料，包括河溪、风滩、浦市等２２个水文观测站的记录数据。２．２理论和方法说明若某次观测严重偏离回归模型，则称它是野点（ｏｕｔｌｉｅｒ）或异常点。分析每次观测数据对估计出的参数的影响，进而判断是否存在野点，并找出野点的统计分析称为影响分析（ｉｎｆｌｕｅｎｃｅａｎａｌｙｓｉｓ）［２６１。影响分析通过计算影响统计量，从而查找野点。影响分析的两种常用方法是数据删除模型（Ｃａｓｅｄｅｌｅｔｉｏｎｍｏｄｅｌ．ＣＤＭ）和均值漂移模型（Ｍｅａｎｓｈｉｆｔｏｕｔｌｉｅｒｍｏｄｅｌ．ＭＳＯＭ）。在本文中我们采取数据删除模型。数据删除模型是将某次观测删去，分析删去某次观测后所算出的结果与不删除观测所算出结果的差异，例如对模型ｙ５ｂ。＋６ｌｘｌ＋…＋６ｍｘ珊＋￡用观测值硝１…ｘｌ朋ｙ１ｘＨｌ…ｘ＂１Ｙ”拟合一次，再用用观测值ｘｌ】…而Ⅲ乃ｘｔ一１。１ｘｆ＋１，１…ｘｉ．１∞ …ｘ“１，肘ｌｙｉ―ＩＹｉ＋ｌＸｎｌ…ｘｎｌＹ月拟合一次，比较两次计算的结果。由于影响统计量一般都是随机变量，其分布一般不易得到，只能给出经验准则，用以判别影响统计量是否异常。而某个影响统计量表现异常，不一定相应观测值就是野点。６由影响统计量怀疑第１个观测是野点的经验准则（１）％＞２ｐ／ｎ（２）库克距离口＞１（３）ｌｄ够ｔｓ，Ｉ＞２、／ｐ／ｎ（４）Ｉｒｓｔｕｄｅｎｔ，ｌ＞２（５）Ｉｃｏｖｒａｔｉｏ，一ｌｆ＞３ｐ／ｎ（６）］ｄｆｂｅｔａｓｋ，＿＞２／４ｎ在ＳＡＳ的ＲＥＧ过程中，ｍｏｄｅｌ语句中加上选项ｉｎｆｌｕｅｎｃｅ后，计算机就会计算ｒｓｔｕｄｅｎｔ（学生化残差），ｃｏｖｒａｔｉｏ（协方差比），ｄｆｆｉｔｓ，ｄｆｂｅｔａｓ。［２７】聚类分析（ｃｌｕｓｔｅｒａｎａｌｙｓｉｓ）也称群分析，是一种新兴的多元统计方法，是当代分类学与多元分析的结合，聚类分析方法较为粗糙，理论上还不够完善，正处于发展阶段，但由于该方法应用方便，分类效果较好，因此越来越为人们所重视。聚类分析是一组分类方法的统称，是对变量或观察个体进行归类的统计方法，即把相似的变量或观察个体归为一类，也称为一个集群（ｃｌｕｓｔｅｒ），而有较大差异的则归到不同的类别根据聚类对象（变量或观察个体）的不同，聚类分析可分为变量聚类（ｃｌｕｓｔｅｒｉｎｇｆｏｒｆｏｒｖａｒｉａｂｌｅｓ）和样品聚类（ｃｌｕｓｔｅｒｉｎｇｉｎｄｉｖｉｄｕａｌｓ）。具体说就是根据已知数据，计算各观察个体或变量之间亲疏关系的统计量（距离或相关系数），再根据某种准则（最短距离法、最长距离法、中间距离法、重心法等）将观察个体或变量进行合并，使同一类内的差别较小，而类与类之间的差别较大，最终将观察个体或变量分为若干类别。聚类分析的分类过程完全依赖于数据自身，而不依赖任何已经存在的或外来的分类标准。聚类分析与判别分析同属于分类方法的范畴。所不同的是，聚类分析的对象的分类情况是未知的，事先没有可供参考的分类依据，面判别分析的对象必须是有事先存在已知的分类，每类的若干样品或分类依据。聚类分析的结果主要是经验性的，使用不同的聚类分析方法可能产生各不相同的结果，对所得出的结果重复性也较差，而从统计学理论上也难以判断某一个分类结果是否正确或接近正确的程度大小。聚类分析结果与真实情况的接近程度还取决于分析变量的选择，因此，聚类分析之前应尽量应用专业知识剔除对分类不起作用的变量，以减少聚类分析时无关变量对分类结果的干扰。【２８ｊ由于聚类分析技术所需的计算量比较庞大，所以一般都需要借助于专业的统计分析软件中的聚类分析模块来执行聚类分析。ＳＡＳ软件中有关聚类分析的过程有ｃｌｕｓｔｅｒ、ｆａｓｔｃｌｕｓ、ｖａｒｃｌｕｓ、ｔｒｅｅ、ａｃｅｃｌｕｓ过程等。Ｆａｓｔｃｌｕｓ过程常用于大样本数据的聚类分析，它以系统聚类（ｄｉｓｊｏｉｎｔｃｌｕｓｔｅｒｉｎｇ）的方法执行聚类分析的过程，聚类所依据的同样是以若干个数值型变量经特定计算所得出的某种距离，经ｆａｓｔｃｌｕｓ过程分析的观测（样品）最终将被分到若干个互不相容的类别中。若要对大样本的数据进行系统聚类，可先调用ｆａｓｔｃｌｕｓ过程进行分析以确定样品的初始分类，再将输出的结果作为输入数据调用ｃｌｕｓｔｅｒ过程进行聚类分析。默认情况下，ｆａｓｔｃｌｕｓ过程以欧氏距离作为分类的判断标准。ｌｚ９ｊ回归分析是对客观事物数量依存关系的分析，是一种重要的统计分析方法，广泛地应用于各类社会现象变量之间的影响因素和关联的研究。ｐｏＪ由于客观事物的联系错综复杂，很多现象的变化往往受到两个或多个因素的影响。为了全面揭示这种复杂的依存关系，准确的测定现象之间的数量变动，提高预测和控制的准确度，就要建立多元回归模型进入深入、系统的分析。多元回归分析是研究多个自变量与某个应变量之间相关关系的一种常用统计方法。同时根据贝叶斯统计学理论，我们还要研究流量本身在连续时间上的影响，考虑时间序列模型，在回归中引入自回归。多元回归分析是根据统计资料建立预报公式（经验公式）的统计方法。【２７Ｊ例如统计若干人身高与脚长数据，从而建立由脚长预测身高的预报公式。又如统计若干棵松树的胸径与材积（可利用木材体积），建立由胸径预报材积公式。都用到回归分析方法。当然回归分析不只是建立预报公式，还要对预报误差的大小，预报公式的合理性等问题讨论，有着非常丰富的内容。回归分析在自然科学，社会科学和应用技术中都有重要应用。现实世界中大量存在相关关系，具有相关关系的变量间不能完全确定。具有相关关系的变量间，由一些变量可以大体预报其它变量。前者称为解释变量，也叫做自变量或预报因子。回归分析的目的是，得到由解释变量预报响应变量的公式，以便通过解释变量去预测或控制响应变量。对于回归模型中的解释变量，有两种处理方法：一种当作确定性变量处理，另一种当作随机变量处理，所得计算公式式相同。本文采用前一种处理方法。回归分析是建立预报公式的一种方法。其一般步骤是：首先取得解释变量和响应变量的多次观测值，这些观测值可能是实验得到的，也可能是调查出的；然后根据这些数据确定经验公式的类型，建立数学模型，列出待估参数；再用这些数据进行拟合；最后作统计分析。数据拟合是计算方法的内容，它也能解决回归分析中的数据拟合，但回归分析与计算方法的数据拟合不同，计算方法的数据拟合只估计未知参数，而回归分析不仅仅估计参数，而且要对拟合的结果作统计分析。１３ＪＪ一般地，我们有定义１．１Ｙ＝ｂｏ＋匆ｔ＋…＋ｂｘ＋￡（１。１）称为多元线性回归模型，其中Ｅｅ＝Ｏ，Ｄ６＝盯２；６０，岛，．．石，，ｔ７２是未知参数。‰称为常数项或截距，五，．．．，Ｘ。是解释变量，本文中把它们作为确定变量；Ｙ是响应变量，为了区别，称（１．１）为理论回归模型。１３２ｊ实际上，定义１．１中应补充条件：不同次观测的误差互不相关，以与线性模型等区别，也即是说定义１．２更准确。为了确定线性回规模型的未知参数，必须配有解释变量和响应变量的若干次观测值。ＭＸ¨：、●●兑．ｍ定义１．２一．厂● ● ，、 ● ，● 一，以Ｘ叭：、●●Ｘ胁咒＝既＋历ｔ＋¨●＋玩ｔ孵＋￡． ●一一虬（１．２）＝既＋反■十¨●＋６ｍ石。哪＋ｇＨ称为整体回归模型，其中附有假设（Ｇａｕｓｓ．Ｍａｒｋｏｖ条件）９Ｅｅ，＝０ｉ＝１，２，…ｎ蝌以（１．２）式可简写成矩阵形式以利公式推演，令Ｙｌ … ｙ＝●●●ｂｏＳ１１，Ｘ２Ｘｌｌ…毛。，卢＝ｂｌ…… …Ｓ月ｙｎｂｍ１ｘＨｌ…Ｘ月ｍ则（１．２）可写为Ｙ＝即＋ｓ定义１．２（１．３）Ｙ＝即＋ｓ附有假设Ｅｅ＝０ｆｔ附（ｓ）：口２，称为整体线性回归模型，其中ｘ称为回归设计矩阵，通常简称为设计矩阵。［２７１１０第三章３．１沅水流域水库流量预报引言五强溪水库位于沅水下游，控制集雨面积８３８００亿ｍ３，占沅水流域面积９３％。五强溪水库总库容４２亿ｍ３，防洪库容１３．６亿ｍ３，它的防洪和发电作用在湖南省具有十分重要的地位ｌｌＪ。因此，对流入水库的流量进行较为准确地预报具有重大经济意义和政治意义。为使预报更加准确，运用聚类分析，把所有的观测数据分类，并找出分类的依据和各类数据之间的关系，分别对他们进行建模，通过回归的方法预报水库流量。同时根据时间序列分析理论，我们还要研究流量本身在连续时间上的影响，考虑时间序列模型，在回归中引入自回归。本文通过五强溪上游各个水文观测站的观测数据，运用现代统计方法对流入五强溪水库的流量进行预报实践，为和谐社会建设提供科学依据。３．２分析观测数据和预建模首先我们对原始数据进行分析，总共有河溪、浦市等２２个站点从１９９６年１月２日到２００４年８月１０日的雨量观测数据，还有１０个水文观测站包括五强溪水库的流量观测数据，总的来说一年中无雨的情况较多，降雨期主要在春夏季，另外，在观测数据中还存在不少误差，这些都是我们需要加以注意的。其次我们选取一个小区域进行建模，对夺希一矮寨一三拱桥一兴隆场一河溪这一区域进行分析，考虑连续４天的观测数据，通过夺希、矮寨、三拱桥、兴隆场、河溪的雨量，再加上河溪的流量建立河溪流量自回归的预报模型，画出如下预报图（见图１），图中黑色小加号代表实际值，红色小星号代表预报值。漉ｔ（锭疗柬，秒）图ｌ３．３河溪流量自回归预报图模型存在的问题在对运行结果进行分析后我们发现在雨量较大时预报比较接近，但总体上误差还是较大。由于雨量的不连续性，并考虑到第二天的流量不仅跟当天的雨量有关，跟前一天的流量也有关系。在用四天的数据建模时发现前几天的雨量与流量影响不大，而有几个观测数据可能是观测或者记录中存在一些操作失误，数据不符合实际情况，所以需要相应的对模型进行改进，并对有些错误的数据进行处理。第四章４．１模型改进分析数据做聚类分析我们考虑先作影响分析，去除异常点，然后用聚类分析的方法对数据进行分类，并对主要影响因素加上权重后再做自回归分析，这样得出的结果更为科学合理，更加准确，从而使预报效果得到进一步改进。【３３Ｊ野点出现的原因很多，例如：记录该次数据时存在误差，可能记录因变量或自变量时，小数点错了；某次观测中，试验条件改变了；未考虑到的其它解释变量在该次观测起作用了；误差项的绝对值特别大…。野点会使估计出的的＾＾Ａ回归系数‰，ｂｌ，．．。Ｄｍ有很大计算误差，从而预报值也有很大误差。为了预报五强溪水库的流量，我们可以根据河溪以上区域站点的雨量和流入五强溪水库的站点流量进行建模。根据当地的地理情况，上游的水流经过一天左右的时间就能流到水库，故而只需要考虑各地前一天的雨量，所观测的站点包括双滩、清水坪、大合坪、浦市、河溪、丹青、阮陵、泸溪、坳坪、张家坪、草龙潭、筒车坪、沅古坪、七甲坪、清浪、官庄、马底驿、棋坪、四都坪，此外还有浦市、河溪、五强溪的流量。每个观测站都有３１４５次观测值，为减少观测误差所带来的影响，我们先做影响分析，去除异常点并且找出主要影响因子之后再对数据作聚类分析。通过ＳＡＳ编程，以所有雨量站连续两天的降雨量为自变量，采用快速聚类法（ｆａｓｔｃｌｕｓｔｅｒ）分类，分为１２类，其分类情况如表１所示：表１ＣＩｕｓｔｅｒ各站雨量聚类分析表ＦｒｅｑｕｅｎｃｙＲＭＳＳｔｄＤｅｖｉａｔＩＯｎｆｒｏｍＳｅｅｄｔｏＮｅａｒｅｓｔＣＩｕｓｔｅｒＤｉｓｔａｎｃｅＢｅｔｗｅｅｎＣｌｕｓｔｅｒ（类）（频数）（标准离差）Ｏｂｓｅｒｖａｔｊｏｎ（最近的类）Ｃｅｎｔｒｏｉｄｓ（与凝聚点的距离）（类中心间的距离）８３１２２２３５５１．１６０５．５１２２３．４１０４８．７１０４７３．７８４２４．５８４２４．５４６０２．２２３４５．０４４０８．６５６９６．１２３４５．０９６１７．７４４０８．６１１５９７．４３４５６７２９８６．３３８５７．１４１３６．１３５６９．０４２６２．１５０００．７１８０１．４２６８７５９５７４１１２０５７８６３．５５４５．６１２６３．５１１８３．１１０１０５８９２５３．３１０４０．０２９１７６８４１０１１１２８９５．４３２８７．８Ｏ２１１０８６．９５１７６．１５１９０．Ｏ４．２根据分类情况做回归预报第１类的两个数据都是异常点应舍去，其余几类按照数据的特点合并成３种情况：第１种情况取第８类的数据，各水文观测点基本无雨；第２种情况取第５类数据，部分地区有降雨，总体雨量不大；第３种情况把余下的几类数据合并，各站降雨量较大，降雨分布面积也较广。分别对每一种情况的数据作回归分析。其中Ｙ代表五强溪的流量，ｙｔ代表五强溪前一天的流量，ｔ代表双滩，清水，大合，浦市，河溪，丹青，阮陵，泸溪，坳坪，张家坪，草龙，筒车，１４沅古，七甲，清浪，官庄，马底，棋坪，四都各站当天雨量之和，ｍ代表提前一天各站的雨量之和，Ｘ２０代表浦市的流量，ｘ２ｌ代表河溪的流量，Ｘ２０ｔ和ｘ２ｌｔ各代表其前一天的流量【３４１。第１种情况的模型为Ｙ＝－３８４．６６＋０．６６７幸只＋２．９７１枣ｒ＋Ｏ．１０９幸ｍ＋Ｏ．７５２奉ｘ２０＋３．７２７事ｘ２ｌ一０．３４７幸ｘ２０，一１．８６９木ｘｚｌ，预报图（图２）如下所示，预测值与真实值误差在２０％以内的达到了总预测量的９２．０６％。［３５】溢量ｅ谨劣棠川睁’图２第２种情况模型为第１种模型预报图Ｙ＝６２．８１７＋Ｏ．５８３幸只＋３．０２１木ｆ一０．０５８｝ｍ＋Ｏ．６３９毒ｘ２０＋Ｏ．８６奉ｘ２ｌ一０．２８６＋恐们一０．３０９奉ｘ２Ｉ，预报图（图３）如下所示，预测值与真实值误差在２０％以内的达到了总预测量的９１．６４％。１５巍曩（讶米，移）图３第２种模型预报图第３种情况的模型为Ｙ＝２０４９．４７６＋０．２７２奉只＋３．２５６｝ｔ＋Ｏ．３２木ｍ＋Ｏ．６８４水ｘ２０－０．２４６木ｘ２ｌ－０．１８４木ｘ２０ｆ＋０．４６２｝ｘ２ｌｆ预报图（图４）如下所示，预测值与真实值误差在２０％以内的达到了总预测量的９２．９７％。１６嚣重（它彦米，移》图４第３种模型预报图从以上预报图可以看出，在雨量较大的第３种模型中预报准确率最高，可以在今后实际工作中加以运用，可有效地提高洪灾的预报准确度。而第１、第２种模型的预报准确率也都在９０％以上，这充分验证了模型的可靠性。４．３模型的不足在本文中我们首先运用影响分析去除了数据中存在的异常点，找出主要的影响因子然后使用快速聚类的方法对数据进行分类，在此过程中由于聚类分析方法本身的特性，使用不同的聚类方法所得出的结论可能各不相同，因此我们在选择聚类方法的过程中经过初步比较确定了快速聚类法，但并未对其他几种聚类方法所产生的结果进行深入研究，几种聚类方法之间的横向比较及应用还待在今后做进一步的研究。对分类方法的选用还有待进一步的验证。模型还不能实现实时数据自动分析，各步骤之间还需要我们进行分析之后才能进入下一个步骤。１７第二部分Ｌｏｇｉｓｔｉｃ回归模型在高校教师教学质量评估中的应用第五章绪论５．１研究目的与意义一个科学合理的评估体系是保证教育体制改革顺利进行的有力措施，也有利于师资队伍的优化，提高教学质量，提升办学水平。如何对高校教师的教学工作进行综合测评，建立定量的科学的评判标准，是十分重要的。目前有一些定量的评判标准，其构成带有很大的主观成分。本文提出的Ｌｏｇｉｓｔｉｃ回归分析的方法则可以避免主观性，把科学的考察和专家的意见综合起来，从而得到较为客观公正的评判结果。５．２研究背景Ｌｏｇｉｓｔｉｃ回归分析作为一种有效的数据处理方法被广泛应用，尤其在医学、社会调查、生物信息处理等领域。在国内，对Ｌｏｇｉｓｔｉｃ回归的研究主要集中在应用方面。近年来，Ｌｏｇｉｓｔｉｃ回归的应用研究在继续拓展。国外开始进行将其应用于多实例标签包（１ａｂｅｌｅｄｂａｇｏｆｉｎｓｔａｎｃｅｓ）分类问题的研究。［３６１国内也开始注意应用累积Ｌｏｇｉｓｔｉｃ回归尤其是多分类累积Ｌｏｇｉｓｔｉｃ回归分析和处理的相关问题。吴兆奇运用Ｌｏｇｉｓｔｉｃ分析建立了学生考试成绩与招生类型之间的关系。［３７】王全众，针对具有相关关系的分类数据的统计分析，介绍了两类Ｌｏｇｉｓｔｉｃ回归模型，并分析了它们的联系与区别。【３８】邹志红基于Ｌｏｇｉｓｔｉｃ回归方法建立了一种水质级别预测模型，利用长江流域的水质监测数据，进行水质建模，对水质级别做出预测。研究结果表明利用Ｌｏｇｉｓｔｉｃ回归进行水质分析，具有良好的拟合和预测效果。［３９】陈广等在医学研究中介绍引进了Ｌｏｇｉｓｔｉｃ回归分析，并应用于判别分析时取得了较高的准确性和较好的预测效果。［４０１１８第六章Ｌｏｇｉｓｔｉｃ回归分析介绍Ｌｏｇｉｓｔｉｃ回归属于概率型非线性回归，假设在自变量五，恐，…，‰作用下，某事件的发生概率为Ｐ，则该事件不发生的概率就为１一Ｐ，发生概率与不发生概率之比为―Ｌ，记作“优势”（ｏｄｄｓ），对ｏｄｄｓ取自然对数，即得逻辑斯１‘’Ｐ缔（Ｌｏｇｉｓｔｉｃ）函数。Ｌｏｇｉｔ（ｐ）＝Ｉｎ（ｏｄｄｓ）＝Ｊｎ（―Ｌ）称为Ｐ的Ｌｏｓｉｔ变换，则Ｌｏｇｉｓｔｉｃ回归模型为Ｌｏｇｉｔ（ｐ）＝砌（了！『－）＝卢ｏ＋ＪＢｌ墨＋应ｘ２＋…＋成‰＋ｓ（１）式（１）中成为常数项，卢。，卢：，…卢。称为回归系数，误差项ｓ是随机变量，均值为零，方差存在。并且从中可以看出，当Ｐ在（Ｏ，１）之间变化时，对应的Ｌｏｇｉｔ（ｐ）在（砌，佃）之间变化，这样，自变量五，ｘ２，…，靠可在任意范围内取值。首先将评判对象划为若干等级，即等级Ｙ＝Ｉ，２，．．．ｋ，Ｙ是有向属性变量，等级越高，对教师评价越好。对教师考察定量指标而，而，…，‰。令Ｐ，＝Ｐ（ｙ≥ｆ）（江１，２…，七）。建立多等级的Ｌｏｇｉｓｔｉｃ回归模型。ｌＩｌ（了羔Ｌ）＝屈ｏ＋卢ｌ五＋…卢。Ｘｍ＋ｓ，（，＝１，２…，ｋ）对若干教师考察其定量指标五，ｘ２，…，‰，再由专家对这些教师等级Ｙ打分。由这些典型数据得到回归系数卢ｍｐｒ．卢。的估计值卢Ⅲ卢Ｐ．卢肼。对每一个待判教师，由他的而，而，…，‰值，通过Ｉｎ（＿Ｌ）＝卢。。＋卢。ｘｌ＋…卢。石脚判他为概率最大的等级。ｆ＝１，２…ｋ，算出他达到每一等级的概率，１９第七章７．１评估高校教师教学质量确定主要影响因子并建立模型以某高校数理学院的２４位任课老师为评估对象建立模型。对高校教师一学期工作情况的评价大致可以分为四个方面：任课总课时数，科研课题完成状况（或发表论文篇数），是否参与编辑教材和同学对老师的评价。我们分别对两个班７８名同学做了不计名的问卷调查，主要针对教学内容、课堂规范、思路拓展和语言表达这几点让他们给这２４位老师打分，除去一些不符合规范的问卷，得到每位老师的平均得分（ｘ５），若在４分以下的用１表示，在４―４．５分的用２表示，在４．５分以上的用３表示。接着我们又调查了一下２４位老师的其他几项数据，其中年龄（ｘ１）在３０－４０岁之间的我们用１表示，在４０．５０之间的用２表示，在５０．６０之间的用３表示；一学期任课的总课时数（ｘ２）在１００课时以下的用１表示，在１００．１５０之间的用２表示，在１５０以上的用３表示；一学期在核心杂志上发表的论文数量或完成的子课题数（ｘ３）；参与编辑教材（Ｘ４），是用１表示，否用０表示。在这里我们把对老师的评价分为优秀犁，称职型和有待改进型三个等级。综合由院系领导评分、评估专家评分和教职工互评这三方面，得到一个比较客观全面的结果，设为Ｙ，优秀型用３表示，标准型用２表示，有待改进型用ｌ来表示。另外预留两位（即２５，２６号）没有评定等级老师的数据，通过模型进行预测检验。具体数据如表２所示：表２综合评测表年龄Ｘｌ。＼轷分＼内容＼１２３４５６总课时课题（论文）编辑教材Ｘ２Ｘ３Ｘ４学生评分总体评估Ｘ５教师＼ｙ１２２３２ｌ３３３１２２０Ｏ１３２１ＯＯＯＯ１０１２ｌ３２２ｌ１２３２１２０７８９３ｌ２１２Ｏ２ｌ３２３３３２３３２Ｏ１３３２２ｌ１１０１ｌ１２１３１４１５１６１７１８１９２０２１２２２３２ｌｌ３ｌ２Ｏ００ＯＯＯＯＯＯ０Ｏ３３３２３２２２２ｌ１１２１Ｏ１ｌ３Ｏ３３３２２３３３３３２３２３２２２３２２２１３１Ｉ１３ｌ２３３０ｌ２２１２２ｌ２ｌ１ｌＯＯ０２ｌ２４２５２６ＯＯ２１２０Ｏ１２在此模型中，应变量Ｙ是分类变量，且是一个有序变量，总共有三个水平。我们采用Ｌｏｇｉｓｔｉｃ回归模型来做，ＸＩ，Ｘ２，Ｘ３，Ｘ４，Ｘ５都是自变量。当Ｙ取３时：Ｉｎ（＿里Ｌ）＝卢３。＋卢ｌｘｌ＋ｐ２ｘ２＋卢４Ｘ４＋卢５ｘ５＋ｓ３Ｉ―ｐ３当Ｙ取２时：Ｉｎ（＿兰生一）＝卢２。＋卢ｌｘｌ＋卢２ｘ２＋卢４ｘ４＋卢５２５＋ｓ２１一ｐ２２ｌ当Ｙ取ｌ时：Ｐｌ＝ｌＰ（】，＝３）＝Ｐ，，Ｐ（Ｙ－－－２）＝Ｐ：一Ｐ，，Ｐ（ｒ＝１）＝ｌ―Ｐ：我们用ＳＡＳ软件编程，用最大似然估计法计算。计算分两大步：（１）是否所有自变量都有意义？（２）估计回归系数卢Ⅲｐ卜．卢，。（１）采用逐步筛选法选择自变量，结果Ｘ３．Ｘ５，Ｘ４．Ｘ２被选入模型，Ｘｌ不被选入，这是符合实际的：年龄不影响对教师的评价。（２）计算结果是：卢２０＝－１５．４０７６，卢２＝２．１８２７，卢３＝３．２１５２，卢４＝６．２４６５，卢５＝４．４１１６，卢３０＝一２５．２３２１。由此可得回归方程如下：Ｉｎ（粤）一２５．２３２１＋２．１８２７ｘ２＋３．２１５２ｘ３＋６．２４６５ｘ４“４１１６ｘ５１１１（｝）＝一１５．４０７６＋２．１８２７ｘ２＋３．２１５２ｘ３＋６．２４６５ｘ４＋４．４１ｌ一仍１６ｘ５将２４位教师的原始资料回代上述两个回归方程，有１８位教师判别正确，４位教师接近正确，若我们设定一个阀值为０．１，如果某个等级概率值比其它概率大０．１（相差超过阀值０．１），那么我们取概率最大的那一个等级；如果某两个等级概率值比其它概率大，但两者相差不超过阀值Ｏ。１，那么我们取得分较高的那个等级。这样我们得到的预测结果有２１位教师预测正确，正确率达到了８７．５％。最后我们来看一下对两位未评分老师的预测情况：由输出表格：表３ＴｈｅＳＡＳＳｙｓｔｅｍ０ｂｓ４１４２４３４４４５４６４７４８４９５０５１ｘｌ１ｘ２ｘ３１１１ｘ４１１ｘ５２２２２１Ｙ―．ＬＥＶＥＬ＿３３２２ｙｈａｔ３３３３３３３３２２３２３２０．４０１５３０．９９９９２０．００１３００．９６００３０。００００２０．２２５７００．００００５０．４９０９１０．００００００．００１３２０．００１３０１２２２２１１００００００００００１１１１１２２．３２１２２００００１１３２２２１１１１３２３２．３３２２．５２．０．９６００３可见第一位教师Ｐ３＝Ｐ（ｙ≥３）＝Ｏ，Ｐ２＝Ｐ（ｙ≥２）＝Ｏ．００１３２，从而ｅ（ｙ＝２）＝０．００１３２―０＝０．００１３２，Ｐ（ｙ＝１）＝１－０．００１３２＝Ｏ．９９８６８，判该教师为等级１。第二位教师Ｐ３＝Ｐ（ｙ≥３）＝０．００１３０，Ｐ２＝Ｐ（ｙ≥２）＾０．９６００３，从而Ｐ（ｙ＝２）＝０．９６００３－０．００１３０＝０．９５８７３，Ｐ（ｙ＝１）＝１－０．９６００３＝Ｏ．０３９９７，判该教师为等级２。７．２预测结果及分析第一位中年教师带课不多，没有课题或论文发表，也没有参加教材编辑，学生打分较低，，各项都差，他属于需要改进型（Ｙ＝１）是自然的。第二位年轻教师带课较多，发表了一篇论文，没有参加教材编辑，学生评分中等，他属于称职型（ｙ＝２）也是合理的。可见，模型很符合实际情况。本部分运用ＬＯＧＩＳＴＩＣ回归模型评估高校教师的教学质量，得出了比较科学客观的评估结果。此模型也可用于各单位科技人员考察、干部评估等等，有较广泛的实用性。第八章本文总结与讨论８．１研究内容总结（１）我国地域广大，水旱灾害频发，这是中国的基本国情。洪水灾害不仅对国家造成巨大的经济损失，也给人民生命财产安全带来严重威胁。本文根据大量的观测数据，运用影响分析和聚类分析先对数据进行分类，再采取多元回归的方法对进入水库的流量进行预报，可以大幅度提高五强溪水库流量的预报效果，为我国沅水流域的防灾减灾事业提供重要的科学依据。同时，此方法也可广泛应用于工农业投资、电信、医药和经济决策，以及城乡雨量预报等等。（２）现阶段对高校教育质量的要求越来越高，而如何对师资水平、教学质量等各方面进行科学合理的评估也愈发重要。本文应用Ｌｏｇｉｓｔｉｃ回归分析的方法，把科学的考察和专家的意见综合起来，尽量避免主观因素的影响，从而得到较为客观公正的评判结果。８．２本文特色创新（１）在之前的许多研究与应用中，大都是单纯的使用一种方法来进行考虑和分析，在本文中充分的结合聚类分析、影响分析及多元回归分析的特点，建立了相应的模型，为作出科学有效的预报夯实了基础，并运用在解决预报水库流量的实际问题中，得到了很好的效果。面对大量的观测数据，应用ＳＡＳ软件编程实现聚类分析、影响分析中繁杂的计算，保证了分类结果的稳定性，在对不同分类情况分别编程建立多元回归模型，提高了预报的准确率与科学性。（２）一般的评估方法其构成带有很大的主观成分，无标准的判别方法。本文提出的Ｌｏｇｉｓｔｉｃ回归分析的方法则可以避免主观性，把科学的考察和专家的意见综合起来，从而得到较为客观公正的评判结果。８．３研究展望本文第一部分研究了影响分析、聚类分析及多元回归分析的应用，在第二部分中研究了Ｌｏｇｉｓｔｉｃ回归分析的应用，但这只是一个初步的应用，还有以下几个方面的问题需要进一步的研究和探讨：（１）如何准确运用影响分析来找出所有的异常点，跟其他方法之间的横向比较？分析对模型产生的影响，并用程序进行检验。（２）进一步研究聚类分析的理论，能否借助ＳＡＳ软件做检验分析？并对不同的聚类方法进行比较研究，是否存在一种可广泛应用的标准的聚类方法？（３）多元回归分析在自然科学，社会科学和应用技术中都有重要应用，回归分析不只是建立预报公式，还要对预报误差的大小，预报公式的合理性等问题讨论，这些都是重要的科研问题，具有重要科研和经济价值。（４）线性回归分析与非线性回归分析之间的比较，以及在实践中的应用范围等等。致谢本文是在导师李刚教授和吴诚鸥教授的精心指导和严格要求之下完成的。在研究生三年的学习和研究中，他们严谨的研究作风、丰富渊博的学识水平、一丝不苟的治学精神和循循善诱的教导方式使我在科研工作和论文写作中大受裨益；他们乐观的人生态度、高尚的人格魅力和平易近人的态度使我受益终身。值此论文完成之际，我特别地向这两位导师表示衷心的敬意和无限的感激！在论文的完成过程中，同门任康、王会、胡丹妮，同学王颖、曹舒娅在程序、绘图和论文写作方面给与了热情的指导和帮助，在此谨向他们表示诚挚的谢意。此外，感谢数理学院的夏大峰教授、门可佩教授、吕红老师、来鹏老师、翟国红老师、陈艳老师、李纯成老师和已退休的张翠英老师以及校研究生部的邱新法教授、葛苏放老师、马革兰老师、何亚群老师、岳爱武老师和龚敬瑜老师在学习和生活中给我的关怀与照顾。研究生这三年的学习和生活中还得到了团委金自康书记等多位老师以及校研会同学和班上各位同学的关心和帮助，在此谨向他们表示真诚的感谢。最后，还要感谢我的父母和亲人朋友，他们的关爱点点滴滴都在心头，给了我莫大的精神鼓励，也是我前进的动力。有了他们的支持、关心和鼓励，使我能安心地进行论文写作，顺利完成学业。２６参考文献［１］汪国平，陈文平．五强溪建库后对沅水下游的防洪影响及治理对策［Ｊ］．湖南水利水电，２０００，（２）．［２］Ｇｏｌｄｓｍｉｔｈ，Ｒ．ＦｉｎａｎｃｉａｌＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ，ｔ９６９．ＳｔｒｕｃｔｕｒｅａｎｄＤｅｖｅｌｏｐｍｅｎｔ［Ｍ］．ＮｅｗＨａｖｅｎ：Ｙａｌｅ［３］冯颖洲，曲炳洋．从统计的视角看金融中心的选择【Ｊ】．北京统计，２００４，（３）：４―５．［４］田霖．科技力与区域金融综合竞争力的模糊曲线分析川．重庆大学学报（社会科学版），２００５，（４）：４４－４８［５］冯碉，王如渊．对我国区域金融发展的聚类分析．统计与决策（理论版），２００７，（１）．［６］李敏，何理．聚类分析在证券投资基本分析中的应用．辽宁师范大学学报（自然科学版），２００６（６）：第２９卷第２期［７］李福平，姜亚玲，姜成志．聚类分析方法在统计分组中的应用．税务与经济［Ｊ］，１９９３，（０１）．［８］ＣｏｏｋＲＤ，ＷｅｉｓｂｅｒｇＳ．ＲｅｓｉｄｕａｌａｎｄＩｎｆｌｕｅｎｃｅｉｎＲｅｇｒｅｓｓｉｏｎ．ＮｅｗＹｏｒｋ：ＣｈａｐｍａｎａｎｄＨａｌｌ，１９８２［９］ＣｏｏｋＲＤ．ＡｓｓｅｓｓｍｅｎｔｏｆＬｏｃａｌｉｎｆｌｕｅｎｃｅ（ｗｉｔｈｄｉｓｃｕｓｓｉｏｎ）．Ｊ．Ｒ．ｓｔａｔｉｓｔ，ＳＯＣ．（ｓｅｒｉｅｓＢ），１９８６，４８：１３３―１６９［１０］ＥｓｃｏｂａｒＬＡ，ＭｅｃｋｅｒＷＱ．ＡｓｓｅｓｓｉｎｇＩｎｆｌｕｅｎｃｅｉｎＲｅｇｒｅｓｓｉｏｎＡｎａｌｙｓｉｓ谢ｔｈＣｅｎｓｏｒｄＤａｔａ．Ｂｉｏｍｅｔｒｉｃ，１９９２，４８：５０７―５０８【ｌｌ】ＷｅｉＢＣ，ＬｕｏＧＢ，ＳｈｉＪＱ，．ＩｎｔｒｏｄｕｃｔｉｏｎｏｆＳｍｔｉＳｔｉｃｓＤｉａｇｎｏｓｔｉｃ．Ｎａｎｊｉｎｇ：ＰｒｅｓｓｏｆＥａｓｔＳｏｕｔｈＵｎｉｖｅｒｓｉｔｙ（ｉｎｃｈｉｎｅｓｅ）［１２］朱仲义，韦博成．半参数非线性模型的统计诊断与影响分析［Ｊ］．应用数学学报，２００１（１０）［１３］张春丽，韦博成．单纯性分布非线性模型的局部影响分析及其应用［Ｊ］．高校应用数学学报Ａ辑，２００６，２１（２）：１４８―１５６［１４］石磊，崔健福，周汝良，王铭．中的应用［Ｊ］．［１５］Ｒｉｃｈａｒｄ主因子模型的局部影响分析及其在地址云南大学学报（自然科学版），２００４（０３）ＡＪｏｈｎｓｏｎ，Ｄｅａｎｗ．Ｗｉｃｈｅｍ，陆璇译．实用多元统计分析［Ｍ］．清华大学出版社，２００１．２７［１６３高惠璇．应用多元统计分析［Ｍ］北京，北京大学出版社，２００５．［１７］郑钟光。多元回归分析在矿石体重测定中的应用［Ｊ］．地质与勘探，１９８６（８）：［１８３苑玉风．多元回归分析的应用研究［Ｊ］．汽车科技，１９９６（４）［１９］李金海．多元回归分析在预测中的应用［Ｊ］．河北工业大学学报，１９９６，（３）：第１５卷［２０］牛桂萍，黄祖英．用多元回归分析作暴雨的长期预报阴．陕西气象，１９９６（１）．［２１］林祖享，梁舜华．探讨运用多元回归分析预报赤潮［Ｊ］．海洋环境科学，２１卷第３期［２２］王震字、孟陆波，滑坡预报的多元回归分析方法［Ｊ］．中国地质灾害与防治学报，２００３（９）［２３］刘昌蓉，何政伟，黄爽兵．多元回归分析在地质灾害危险性评价中的应用一以天山公路Ｇ２１７沿线为例［Ｊ］。环保科技，科技，２００２（０３）２００８（０１）［２４］袁宇，多元回归分析法在突发性事故污染预测中的应用［Ｊ］．辽宁城乡环境［２５］索南仁欠，多元回归分析在水污染评价中的应用［Ｊ］．青海师范大学学报（自然科学版），２０００（４）［２６］朱道元，吴诚鸥，秦伟良．多元统计分析与软件ＳＡＳ［Ｍ３．南京：东南大学出版社，１９９９．［２７］吴诚鸥，秦伟良等．近代实用多元统计分析［Ｍ］．北京：气象出版社，２００７年８月第一版［２８］薛富波，张文彤，田晓燕．ＳＡＳ８．２统计应用教程［Ｍ］．北京：兵器工业出版社，２００４．［２９］岳朝龙，黄永兴，严忠．ＳＡＳ系统与经济统计分析［Ｍ］．合肥：中国科技大学出版社，２００３．［３０］包风达、翁心真．多元回归分析的软件求解和案例分析［Ｊ］．数理统计与管理，２０００，（９）：２０―５［３１］张尧庭、方开泰．多元统计分析引论［Ｍ］．科学出版社，１９８２．［３２］李金海．多元回归分析在预测中的应用［Ｊ］．河北工业大学学报，１９９６，（３）．［３３］顾岚、安鸿志．自回归模型的精细结构与统计分析［Ｊ］．应用数学学报，１９８５，（１０）．［３４］熊金泉，郑萍，刘翌，古和今．江西省修河流域洪水预报系统［Ｊ］．江西科学，２００４，（４）．［３５］刘景泰，张克仁，郑颖．概率论与数理统计［Ｍ］．上海，上海科学技术出版社，１９９１．［３６］吴兆奇，关蓬莱，吴晓明．统计与决策［Ｊ］．２００７（３）：２１―２２［３７］ＸＵｏｆＸ，ＦＲＡＮＫＥ．ＬｏｇｉｓｔｉｃｒｅｇｒｅｓｓｉｏｎａｎｄｂｏｏｓｔｉｎｇｆｏｒｌａｂｅｌｅｄｂａｇｓｉｎＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅ，２００４，３０５６：２７２－２８１．ｉｎｓｔａｎｃｅｓ［Ｊ］．ＬｅｃｔｕｒｅＮｏｔｅｓ［３８］王全众．统计研究［Ｊ］．２００７（２），第２４卷第２期［３９］邹志红，云逸，王惠文，孙靖南．数学的实践与认识［Ｊ］．２００８（１）［４０］陈广，陈景武．医学数学模型探讨［Ｊ］．２００７（３），２０多元回归分析与Logistic回归分析的应用研究作者：学位授予单位：孙振宇南京信息工程大学本文链接：http://d..cn/Thesis_Y1257528.aspx
更多搜索：
All rights reserved Powered by
文档资料库内容来自网络，如有侵犯请联系客服。

经济模型，多元线性回归相关性回归分析一个解释变量和被解释变量相关性，t检验和F值检验都通过了，R&#178;大小重要吗？

我要回帖

更多关于多元回归分析t检验的文章

随机推荐

经济模型，多元线性回归 相关性回归分析一个解释变量和被解释变量相关性，t检验和F值检验都通过了，R&amp;#178;大小重要吗？

我要回帖

更多关于 多元回归分析t检验 的文章

随机推荐

经济模型，多元线性回归相关性回归分析一个解释变量和被解释变量相关性，t检验和F值检验都通过了，R²大小重要吗？

更多关于多元回归分析t检验的文章