26*20*28按比例是什么26个字母形状联想图

[统计学课后习题答案]统计学课后习题答案_统计学课后习题答案-牛宝宝文章网
[统计学课后习题答案]统计学课后习题答案 统计学课后习题答案
第1章 绪论1.什么是统计学?怎样理解统计学与统计数据的关系?2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求:(1)描述总体;
(2)描述研究变量;
(3)描述样本; (4)描述推断。答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求:(1)描述总体; (2)描述研究变量; (3)描述样本;
(4)一描述推断。答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章 统计数据的描述――练习题●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下:B D A B C D B B A CE A D A B A E A D BC C B C C C C C B CC B C D E B C D C EA C C E D C A E C DD D A A B D D A A BC E E B C E C B E CB C D D C C B D D CA E C D B E A D C BE E B C C B E C B C(1) 指出上面的数据属于什么类型; 用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。1解:(1)由于表2.21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。 (2)频数分布表如下:服务质量等级评价的频数分布服务质量等级 家庭数(频数) A B C D E 合计14 21 32 18 15 100频率% 14 21 32 18 15 100(3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→条形图→选择子图表类型→完成(见Excel练习题2.1)。即得到如下的条形图:●2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):152 105 117 97124 119 108 88129 114 105 123116 115 110 115100 87 107 119103 103 137 13892 118 120 11295 142 136 146127 135 117 113104 125 108 126(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率; (2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。 解:(1)要求对销售收入的数据进行分组,全部数据中,最大的为152,最小的为87,知数据全距为152-87=65;为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分;
为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式; 按照“上限不在组内”的原则,用划记法统计各组内数据的个数――企业数,也可以用Excel进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列; 将各组企业数除以企业总数40,得到各组频率,填入表中第三列;在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。 整理得到频数分布表如下:240(2)按题目要求分组并进行统计,得到分组表如下:
某管理局下属40个企分组表按销售收入分组(万元) 企业数(个) 先进企业 良好企业 一般企业 落后企业 合计11 11 9 9 40频率(%) 27.5 27.5 22.5 22.5 100.03.某百货公司连续40天的商品销售额如下(单位:万元):41 46 35 4225 36 28 3629 45 46 3747 37 34 3738 37 30 4934 36 37 3930 45 44 4238 43 26 3243 33 38 3640 44 44 35根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。 解:全部数据中,最大的为49,最小的为25,知数据全距为49-25=24;为便于计算和分析,确定将数据分为5组,各组组距为5,组限以整5的倍数划分;为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值24已落在最小组之中,最大值49已落在最大组之中,故将各组均设计成闭口形式;按照“上限不在组内”的原则,用划记法或用Excel统计各组内数据的个数――天数,(见Excel练习题2.3)并填入表内,得到频数分布表如下表中的左两列; 将各组天数除以总天数40,得到各组频率,填入表中第三列; 得到频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元) 频数(天) 25~30 30~35 35~40 40~45 45~50 合计4 6 15 9 6 40频率(%) 10.0 15.0 37.5 22.5 15.0 100.0直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→柱形3图→选择子图表类型→完成。即得到如下的直方图:(见Excel练习题2.3)●4.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 706 708 668 706 694 688 701 693 713716 715 729 710 692 690 689 671 697 699728 712 694 693 691 736 683 718 664 725719 722 681 697 747 689 685 707 681 726685 691 695 674 699 696 702 683 721 704709 708 685 658 682 651 741 717 720 729691 690 706 698 698 673 698 733 677 703684 692 661 666 700 749 713 712 679 696705 707 735 696 710 708 676 683 695 717718 701 665 698 722 727 702 692 691 688(1)利用计算机对上面的数据进行排序;(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图; (3)绘制茎叶图,并与直方图作比较。 解:(1)排序:将全部数据复制到Excel中,并移动到同一列,点击:数据→排序→确定,即完成数据排序的工作。(见Excel练习题2.4)(2)按题目要求,利用已排序的Excel表数据进行分组及统计,得到频数分布表如下: (见Excel练习题2.4)100只灯泡使用寿命非频数分布按使用寿命分组(小时) 650~660 660~670 670~680 680~690 690~700 700~710 710~720 720~730 730~740 740~750 合计42 5 6 14 26 18 13 10 3 3 100灯泡个数(只) 频率(%)2 5 6 14 26 18 13 10 3 3 100制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,选择全表后,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图: (见Excel练习题2.4)(3)制作茎叶图:以十位以上数作为茎,填入表格的首列,将百、十位数相同的数据的个位数按由小到大的顺序填入相应行中,即成为叶, 得到茎叶图如下:将直方图与茎叶图对比,可见两图十分相似。●5.下面是北方某城市1~2月份各天气温的记录数据:-3 -14 -6 -8 -14 -32 -18 -8 -6 -22 2-4 -15 -12 -15 -13 -4-7 -9 -16 -11 -9 -4-11 -6 -19 -12 -6 -16-1 -1 -15 -19 0 -17 0 -22 -25 -1 78 5 -25 -24 5 59 -4 -24 -18 -4 -6-6 -9 -19 -17 -9 -5-7 -3 -21 -24 -3指出上面的数据属于什么类型; 对上面的数据进行适当的分组;绘制直方图,说明该城市气温分布的特点。 解:(1)由于各天气温的记录数据属于数值型数据,它们可以比较高低,且0不表示没有,因此是定距数据。 (2)分组如下:由于全部数据中,最大的为9,最小的为-25,知数据全距为9-(-25)=34;
为便于计算和分析,确定将数据分为7组,各组组距为5,组限以整5的倍数划分;
为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值-255已落在最小组之中,最大值9已落在最大组之中,故将各组均设计成闭口形式;按照“上限不在组内”的原则,用划记法(或Excel排序法,见Excel练习题2.5)统计各组内数据的个数――天数,并填入表内,得到频数分布表如下表;北方某城市1~2月份各天气温分组-25~-20 -20~-15-15~-10-10~-5-5~00~55~10合计 天数(天) 8 8 10 14 14 4 7 65(3)制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:(见Excel练习题2.5)●6.下面是某考试管理中心对2002年参加成人自学考试的12000名学生的年龄分组数据:对这个年龄分布作直方图;从直方图分析成人自学考试人员年龄分布的特点。解:(1)制作直方图:将上表复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:(见Excel练习题2.6)6(2)年龄分布的特点:自学考试人员年龄的分布为右偏。 7.下面是A、B两个班学生的数学考试成绩数据: A班:44 66 73 76 85 B班:35 55 61 71 8539 56 62 73 9040 56 63 74 9144 57 64 74 9144 57 66 79 9448 57 68 81 9551 58 68 82 9652 59 70 83 10052 60 70 83 10054 61 71 84 10057 66 74 77 8559 67 74 77 8660 69 74 77 8661 70 75 78 9061 70 75 78 9262 71 75 79 9263 72 75 80 9263 73 75 80 9365 73 76 82 96将两个班的考试成绩用一个公共的茎制成茎叶图; 比较两个班考试成绩分布的特点。(2)比较可知:A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。8.1997年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各城市平均相对湿度的分布特征。7资料来源:《中国统计年鉴1998》,中国统计出版社1998,第10页。291 269258 295271 272292 284261 268281 303301 273274 263267 322280 249(1)计算该百货公司日销售额的均值、中位数和四分位数; (2)计算日销售额的标准差。
解:(1)将全部30个数据输入Excel表中同列,点击列标,得到30个数据的总和为8223,
于是得该百货公司日销售额的均值:(见Excel练习题2.9)8223x=n=30=274.1(万元)或点选单元格后,点击“自动求和”→“平均值”,在函数EVERAGE()的空格中输入“A1:A30”,回车,得到均值也为274.1。在Excel表中将30个数据重新排序,则中位数位于30个数据的中间位置,即靠中的第15、第16两个数272和273的平均数:x8272?2732Me==272.5(万元)由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15个数据的中间位置(第8位)靠上四分之一的位置上,由重新排序后的Excel表中第8位是261,第15位是272,从而: 273?2724QL=261+=261.25(万元)同理,后四分位数位于第16~第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273,从而:273?2724QU=291-=290.75(万元)。(2)未分组数据的标准差计算公式为:利用上公式代入数据计算是个较为复杂的工作。手工计算时,须计算30个数据的离差平方,并将其求和,()再代入公式计算其结果:得s=21.1742。(见Excel练习题2.9)我们可以利用Excel表直接计算标准差:点选数据列(A列)的最末空格,再点击菜单栏中“∑”符号右边的小三角“”,选择“其它函数”→选择函数“STDEV” →“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,→“确定”,即在A列最末空格中出现数值:21.17412,即为这30个数据的标准差。于是:s?21.17(万元)。(见Excel练习题2.9)●10.甲乙两个企业生产三种产品的单位成本和总成本资料如下:比较哪个企业的总平均成本高?并分析其原因。解:设产品单位成本为 x,产量为f,则总成本为xf,xff由于:平均成本x=总成本=总产量,而已知数据中缺产量f 的数据,该产品成本xf又因个别产品产量f =该产品单位成本=x9从而 x=xf?x,于是得:甲企业平均成本=xfxf?xxf?x00??.41(元)=, 00??(元)=15,乙企业平均成本=对比可见,甲企业的总平均成本较高。原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。●11.在某地区抽取的120家企业按利润额进行分组,结果如下:按利润额分组(万元) 200~300 300~400 400~500 500~600 600以上 合计企业数(个) 19 30 42 18 11 120计算120家企业利润额的均值和标准差。解:设各组平均利润为 x,企业数为f,则组总利润为xf,由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:按利润额分组(万元) 200~300 300~400 400~500 500~600 600以上 合计于是,120家企业平均利润为:组中值 x 250 350 450 550 650 ―企业数(个) f 19 30 42 18 11 120总利润 xf
xff=51200=120= 426.67(万元);分组数据的标准差计算公式为:手动计算须列表计算各组数据离差平方和(x-426.67)2f,并求和,再代入计算公式:10列表计算如下组中值x 250350450550650合计 企业数(个) f 19 30 42 18 11 120 (x-426.67)2f 1
2 9 表格中(x-426.67)2f的计算方法:方法一:将表格复制到Excel表中,点击第三列的顶行单元格后,在输入栏中输入:=(a3-426.67)* (a3-426.67)*b3,回车,得到该行的计算结果;点选结果所在单元格,并将鼠标移动到该单元格的右下方,当鼠标变成黑“+”字时,压下左键并拉动鼠标到该列最后一组数据对应的单元格处放开,则各组数据的(x-426.67)2f计算完毕;于是得标准差:(见Excel练习题2.11)点击第三列的合计单元格后,点击菜单栏中的“∑”号,回车,即获得第三列数据的和。 方法二:将各组组中值x复制到Excel的A列中,并按各组次数f在同列中复制,使该列中共有f个x,120个数据生成后,点选A列的最末空格,再点击菜单栏中“∑”符号右边的小三角“”,选择“其它函数”→选择函数“STDEV” →“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,→“确定”,即在A列最末空格中出现数值:116.4845,即为这120个数据的标准差。(见Excel练习题2.11)于是得标准差: s =116.4845(万元)。●12.为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了岁的少年儿童作为样本。请回答下面的问题,并解释其原因。(1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较大?或者这两组样本的平均身高相同?(2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?或者这两组样本的标准差相同?(3)哪一位调查研究人员有可能得到这1100名少年儿童的最高者或最低者?或者对两位调查研究人员来说,这种机会是相同的?解:(1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。●13.一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤。请回答下面的问题:(1)是男生的体重差异大还是女生的体重差异大?为什么?(2)以磅为单位(1公斤=2.2磅),求体重的平均数和标准差。11(万元)。(3)粗略地估计一下,男生中有百分之几的人体重在55公斤到65公斤之间?(4)粗略地估计一下,女生中有百分之几的人体重在40公斤到60公斤之间?
解:(1)由于两组的平均体重不相等,应通过比较离散系数确定体重差异较大的组: 因为女生的离散系数为 s5V=x=50=0.1男生体重的离散系数为 s5V=x=60=0.08对比可知女生的体重差异较大。60公斤5公斤(2) 男生:=2.2公斤=27.27(磅),s =2.2公斤=2.27(磅);50公斤5公斤女生:=2.2公斤=22.73(磅),s =2.2公斤=2.27(磅);(3)68%;(4)95%。14.对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果如下:成年组幼儿组 166 169 172 177 180 170 172 174 168 173 68 69 68 70 71 73 72 73 74 75(1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么?(2)比较分析哪一组的身高差异大?解:(1)应采用离散系数,因为成年人和幼儿的身高处于不同的水平,采用标准差比较不合适。离散系数消除了不同组数据水平高低的影响,采用离散系数就较为合理。(2)利用Excel进行计算,得成年组身高的平均数为172.1,标准差为4.202,从而得: 成年组身高的离散系数:vs?4.2?0.;又得幼儿组身高的平均数为71.3,标准差为2.497,从而得:幼儿组身高的离散系数:vs?2.497?0.03571.3;由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。15.一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量(单位:个):方法A164167方法B 129 130 方法C 125 126 12168 165 170 165 164 168 164 162 163 166 167 166 165 129 130 131 130 129 127 128 128 127 128 128 125 132 126 127 126 128 127 126 127 127 125 126 116 126 125你准备采用什么方法来评价组装方法的优劣?如果让你选择一种方法,你会作出怎样的选择?试说明理由。 解:(1)下表给计算出这三种组装方法的一些主要描述统计量:评价优劣应根据离散系数,据上得:2.13方法A的离散系数VA=165.6=0.0129, 1.75方法B的离散系数VB=128.73=0.0136, 2.77方法C的离散系数VC=125.53=0.0221;对比可见,方法A的离散系数最低,说明方法A最优。(2)我会选择方法A,因为方法A的平均产量最高而离散系数最低,说明方法A的产量高且稳定,有推广意义。16.在金融证券领域,一项投资的的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低,预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。
(1)你认为该用什么样的统计测度值来反映投资的风险?(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票? (3)如果你进行股票投资,你会选择商业类股票还是高科技类股票?13-30
60收 益 率
(a)商业类股票
(b) 高科技类股票 解:(1)方差或标准差;(2)商业类股票;(3)(略)。 17.下图给出了2000其绘制方法及其数字说明与【例2.10】相同,试对该图反映的人口、政治、社会、经济状况进行分析。第3章
概率与概率分布――练习题(全免)1 .某技术小组有12人,他们的性别和职称如下,现要产生一名幸运者。试求这位幸运者分别是以下几种可能的概率:(1);(2)工程师;(3)女工程师,(4)女性或工程师。并说明几个计算结果之间有何关系? 解:设A=女性,B=工程师,AB=女工程师,A+B=女性或工程师 (1)P(A)=4/12=1/3 (2)P(B)=4/12=1/3 (3)P(AB)=2/12=1/6(4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/22.
某种零件加工必须依次经过三道工序,从已往大量的生产记录得知,第一、二、三道工14序的次品率分别为0.2,0.1,0.1,并且每道工序是否产生次品与其它工序无关。试求这种零件的次品率。解:求这种零件的次品率,等于计算“任取一个零件为次品”(记为A)的概率P(A)。 考虑逆事件A?“任取一个零件为正品”,表示通过三道工序都合格。据题意,有: P(A)?(1?0.2)(1?0.1)(1?0.1)?0.648于是 P(A)?1?P(A)?1?0.648?0.3523.
已知参加某项考试的全部人员合格的占80%,在合格人员中成绩优秀只占15%。试求任一参考人员成绩优秀的概率。解:设A表示“合格”,B表示“优秀”。由于B=AB,于是P(B)=P(A)P(B|A)=0.8×0.15=0.124. 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。求该选手两发都脱靶的概率。解:设A=第1发命中。B=命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。P(B)=P(A)P(B|A)?P()P(B|)=0.8×1+0.2×0.5=0.9脱靶的概率=1-0.9=0.1或(解法二):P(脱靶)=P(第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.15.已知某地区男子寿命超过55岁的概率为84%,超过70岁以上的概率为63%。试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少?解:
设A=活到55岁,B=活到70岁。所求概率为:P(B|A)=P(AB)P(B)0.63===0.75P(A)P(A)0.846.某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产5件产品全部达到优质。问该企业决策者会倾向于如何决策?解:这是一个计算后验概率的问题。设A=优质率达95%,=优质率为80%,B=试验所生产的5件全部优质。 P(A)=0.4,P()=0.6,P(B|A)=0.955, P(B|)=0.85,所求概率为:P(A|B)=P(A)P(B|A)0.30951==0.6115P(A)P(B|A)?P()P(B|)0.50612决策者会倾向于采用新的生产管理流程。157. 某公司从甲、乙、丙三个企业采购了同一种产品,采购数量分别占总采购量的25%、30%和45%。这三个企业产品的次品率分别为4%、5%、3%。如果从这些产品中随机抽出一件,试问:(1)抽出次品的概率是多少?(2)若发现抽出的产品是次品,问该产品来自丙厂的概率是多少?解:令A1、A2、A3分别代表从甲、乙、丙企业采购产品,B表示次品。由题意得:P(A1)=0.25,P(A2)=0.30, P(A3)=0.45;P(B|A1)=0.04,P(B|A2)=0.05,P(B|A3)=0.03;因此,所求概率分别为:(1)P(B)=P(A1)P(B|A1)?P(A2)P(B|A2)?P(A3)P(B|A3)0.45?0.030.0135==0..04+0.30?0.05+0.45?0.030.0385
=0.25×0.04+0.30×0.05+0.45×0.03=0.0385 (2)P(A3|B)=8.某人在每天上班途中要经过3个设有红绿灯的十字路口。设每个路口遇到红灯的事件是相互独立的,且红灯持续24秒而绿灯持续36秒。试求他途中遇到红灯的次数的概率分布及其期望值和方差、标准差。解:据题意,在每个路口遇到红灯的概率是p=24/(24+36)=0.4。期望值(均值)=1.2(次),方差=0.72,标准差=0.8485(次)9. 一家人寿保险公司某险种的投保人数有20000人,据测算被保险人一年中的死亡率为万分之5。保险费每人50元。若一年中死亡,则保险公司赔付保险金额50000元。试求未来一年该保险公司将在该项保险中(这里不考虑保险公司的其它费用):(1)至少获利50万元的概率;(2)亏本的概率;(3)支付保险金额的均值和标准差。解:设被保险人死亡数=X,X~B(25)。(1)收入=20000×50(元)=100万元。要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过10人。所求概率为:P(X ≤10)=0.58304。(2)当被保险人死亡数超过20人时,保险公司就要亏本。所求概率为:P(X&20)=1-P(X≤20)=1-0.958(3)支付保险金额的均值=50000×E(X)=5×0.0005(元)=50(万元)支付保险金额的标准差=50000×σ(X)=50000×(25×0.=158074(元)10.对上述练习题3.09的资料,试问:(1)可否利用泊松分布来近似计算?(2)可否利用正态分布来近似计算?(3)假如投保人只有5000人,可利用哪种分布来近似计算?解: (1)可以。当n很大而p很小时,二项分布可以利用泊松分布来近似计算。本例中,λ= np=25=10,即有X~P(10)。计算结果与二项分布所得结果几乎完全一致。(2)也可以。尽管p很小,但由于n非常大,np和np(1-p)都大于5,二项分布也可以利用正态分布来近似计算。16本例中,np=25=10,np(1-p)=25×(1-0.,即有X ~N(10,9.995)。相应的概率为:P(X ≤10.5)=0.51995,P(X≤20.5)=0.853262。可见误差比较大(这是由于P太小,二项分布偏斜太严重)。【注】由于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近似计算二项分布的概率时,通常在二项分布的变量值基础上加减0.5作为正态分布对应的区间点,这就是所谓的“连续性校正”。(3)由于p=0.0005,假如n=5000,则np=2.5&5,二项分布呈明显的偏态,用正态分布来计算就会出现非常大的误差。此时宜用泊松分布去近似。11.某企业生产的某种电池寿命近似服从正态分布,且均值为200小时,标准差为30小时。若规定寿命低于150小时为不合格品。试求该企业生产的电池的:(1)合格率是多少?(2)电池寿命在200左右多大的范围内的概率不小于0.9。P(X?150)?P(Z?解:(1)150?200)=P(Z??1..04779合格率为1-0.021或95.221%。(2) 设所求值为K,满足电池寿命在200±K小时范围内的概率不小于0.9,即有: P(|X?200|?K)?P{|Z|=P{Z?即:|X?200|K??0.93030 K?0.9530,K/30≥1.64485,故K≥49.3456。12.某商场某销售区域有6种商品。假如每1小时内每种商品需要12分钟时间的咨询服务,而且每种商品是否需要咨询服务是相互独立的。求:(1)在同一时刻需用咨询的商品种数的最可能值是多少?(2)若该销售区域仅配有2名服务员,则因服务员不足而不能提供咨询服务的概率是多少?解:设X =同一时刻需用咨询服务的商品种数,由题意有X~B(6,0.2)(1)X的最可能值为:X0=[(n+1)p]=[7×0.2]=1
(取整数)P(X?2)?1?P(X?2)?1?(2)k?0?C6k0.2k0.86?k 2=1-0.9第4章
抽样与抽样分布――练习题(全免)1. 一个具有n?64个观察值的随机样本抽自于均值等于20、标准差等于16的总体。 ⑴ 给出的抽样分布(重复抽样)的均值和标准差⑵ 描述的抽样分布的形状。你的回答依赖于样本容量吗?⑶ 计算标准正态z统计量对应于?15.5的值。⑷ 计算标准正态z统计量对应于?23的值。解: 已知 n=64,为大样本,μ=20,σ=16,17⑴在重复抽样情况下,的抽样分布的均值为a. 20,
b. 近似正态
d. 1.502 . 参考练习4.1求概率。 ⑴&16; ⑵&23; ⑶&25; ⑷.落在16和22之间; ⑸&14。解: a. 0.0228
e. 0.00133.
一个具有n?100个观察值的随机样本选自于??30、??16的总体。试求下列概率的近似值:解: a. 0.8944
d. 0.96994.
一个具有n?900个观察值的随机样本选自于??100和??10的总体。⑴ 你预计的最大值和最小值是什么?⑵ 你认为至多偏离?多么远?⑶ 为了回答b你必须要知道?吗?请解释。解:a. 101,
考虑一个包含x的值等于0,1,2,…,97,98,99的总体。假设x的取值的可能性是相同的。则运用计算机对下面的每一个n值产生500个随机样本,并对于每一个样本计算。对于每一个样本容量,构造的500个值的相对频率直方图。当n值增加时在直方图上会发生什么变化?存在什么相似性?这里n?2,n?5,n?10,n?30和n?50。解:趋向正态6. 美国汽车联合会(AAA)是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、金融、保险以及与汽车相关的各项服务。1999年5月,AAA通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News,日)。假设这个花费的标准差是15美元,并且AAA所报道的平均每日消费是总体均值。又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。 描述(样本家庭平均每日餐饮和住宿的消费)的抽样分布。特别说明服从怎样的分布以及的均值和方差是什么?证明你的回答;对于样本家庭来说平均每日消费大于213美元的概率是什么?大于217美元的概率呢?在209美元和217美元之间的概率呢?18解: a. 正态分布,
0.9387. 技术人员对奶粉装袋过程进行了质量检验。每袋的平均重量标准为??406克、标准差为??10.1克。监控这一过程的技术人者每天随机地抽取36袋,并对每袋重量进行测量。现考虑这36袋奶粉所组成样本的平均重量。(1)描述的抽样分布,并给出假设某一天技术人员观察到?400.8,这是否意味着装袋过程出现问题了呢,为什么? 解: a. 406,
c. 是,因为小概率出现了8.
在本章的统计实践中,某投资者考虑将1000美元投资于n?5种不同的股票。每一种股票月收益率的均值为??10%,标准差??4%。对于这五种股票的投资组合,投资者每月的收益率是面临风险的一个度量。假如投资者将1000美元仅投资于这5种股票的其中3种,则这个投资者所面对的风险将会增加还是减少?请解释;假设将1000美元投资在另外10种收益率与上述的完全一样的股票,试度量其风险,并与只投资5种股票的情形进行比较。解:a. 增加
b. 减少9. 某制造商为击剑运动员生产安全夹克,这些夹克是以剑锋刺入其中时所需的最小力量(以牛顿为单位)来定级的。如果生产工艺操作正确,则他生产的夹克级别应平均840牛顿,标准差15牛顿。国际击剑管理组织(FIE)希望这些夹克的最低级别不小于800牛顿。为了检查其生产过程是否正常,某检验人员从生产过程中抽取了50个夹克作为一个随机样本进行定级,并计算,即该样本中夹克级别的均值。她假设这个过程的标准差是固定的,但是担心级别均值可能已经发生变化。 如果该生产过程仍旧正常,则的样本分布为何?假设这个检验人员所抽取样本的级别均值为830牛顿,则如果生产过程正常的话,样本均值?和?的值,以及概率分布的形状;??ri?2???3.2。投资者的每月收益率的方差是,它是投资者所2≤830牛顿的概率是多少?在检验人员假定生产过程的标准差固定不变时,你对b部分有关当前生产过程的现状有何看法(即夹克级别均值是否仍为840牛顿)?现在假设该生产过程的均值没有变化,但是过程的标准差从15牛顿增加到了45牛顿。在这种情况下的抽样分布是什么?当具有这种分布时,则≤830牛顿的概率是多少? 解: a. 正态
b. 约等于0
在任何生产过程中,产品质量的波动都是不可避免的。产品质量的变化可被分成两类:由于特殊原因所引起的变化(例如,某一特定的机器),以及由于共同的原因所引起的变化(例如,产品的设计很差)。一个去除了质量变化的所有特殊原因的生产过程被称为是稳定的或者是在统计控制中的。剩余的变化只是简单的随机变化。假如随机变化太大,则管理部门不能接受,但只要消除变化的共同原因,便可减少变化(Deming,;De Vor, Chang,和Sutherland,1992)。通常的做法是将产品质量的特征绘制到控制图上,然后观察这些数值随时间如何变动。例如,为了控制肥皂中碱的数量,可以每小时从生产线中随机地抽选n?5块试验肥皂作为样本,并测量其碱的数量,不同时间的样本含碱量的均值描绘在下图中。假设这个过程是在统计控制中的,则的分布将具有过程的均值?,标准差具有过程的标准差除以样本容量的平方根,???n。下面的控制图中水平线表示过程均值,两条线称为控制极限度,位于?的上下3?的位置。假如落在界限的外面,则有充分的理由说明目前存在变化的特殊原因,这个过程一定是失控的。当生产过程是在统计控制中时,肥皂试验样本中碱的百分比将服从??2%和??1%的近似的正态分布。假设n?4,则上下控制极限应距离?多么远? 假如这个过程是在控制中,则落在控制极限之外的概率是多少?假设抽取样本之前,过程均值移动到??3%,则由样本得出这个过程失控的(正确的)结论的概率是多少?解:a. 0.015
c. 0.158711. 参考练习4.10。肥皂公司决定设置比练习4.10中所述的3?这一限度更为严格的控制极限。特别地,当加工过程在控制中时,公司愿意接受落在控制极限外面的概率是0.10。
20若公司仍想将控制极限度设在与均值的上下距离相等之处,并且仍计划在每小时的样本中使用n?4个观察值,则控制极限应该设定在哪里??现在是3%假设a部分中的控制极限已付诸实施,但是公司不知道,(而不是2%)。若n?4,则落在控制极限外面的概率是多少?若n?9呢?解: a. (0.012, 0.028)
0.72784.12. 参考练习4.11。为了改进控制图的敏感性,有时将警戒线与控制极限一起画在图上。警戒限一般被设定为??1.96?。假如有两个连续的数据点落在警戒限之外,则这个过程一定是失控的(蒙哥马利,1991年)。假设肥皂加工过程是在控制中(即,它遵循??2%和??1%的正态分布),则的下一个值落在警戒限之外的概率是什么? 假设肥皂加工过程是在控制中,则你预料到画在控制图上的的这40个值中有多少个点落在上控制极限以上? 假设肥皂加工过程是在控制中,则的两个未来数值落在下警戒线以下的概率是多少? 解: a. 0.05
c. 0.000625参数估计●1.
从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。 样本均值的抽样标准差σ等于多少?在95%的置信水平下,允许误差是多少?解:已知总体标准差σ=5,样本容量n=40,为大样本,样本均值x=25,5σ(1)样本均值的抽样标准差x=0.7906(2)已知置信水平1-α=95%,得 Zα/2=1.96,Zα/2于是,允许误差是E =×0.6。●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。假定总体标准差为15元,求样本均值的抽样标准误差;在95%的置信水平下,求允许误差;如果样本均值为120元,求总体均值95%的置信区间。解:(1)已假定总体标准差为σ=15元,σ则样本均值的抽样标准误差为 ==2.142921(2)已知置信水平1-α=95%,得Zα/2=1.96,Zα/2于是,允许误差是E =×2.0。(3)已知样本均值为x=120元,置信水平1-α=95%,得Zα/2=1.96,x?Zα/2这时总体均值的置信区间为±4.2=可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):3.34.4 2.1 4.73.1 2.0 1.9 1.46.2 5.4 1.2 1.25.8 2.6 5.1 2.92.3 6.4 4.3 3.54.1 1.8 4.2 2.45.4 3.5 3.6 0.54.5 5.7 0.8 3.63.2 2.3 1.5 2.5求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。 解:⑴计算样本均值x:将上表数据复制到Excel表中,并整理成一列,点击最后数据下面空格,选择自动求平均值,回车,得到x=3.316667,⑵计算样本方差s:删除Excel表中的平均值,点击自动求值→其它函数→STDEV→选定计算数据列→确定→确定,得到s=1.6093
也可以利用Excel进行列表计算:选定整理成一列的第一行数据的邻列的单元格,输入“=(a7-3.”,回车,即得到各数据的离差平方,在最下行求总和,得到:(x-x)
?=90.652i再对总和除以n-1=35后,求平方根,即为样本方差的值。 ⑶计算样本均值的抽样标准误差:已知样本容量 n=36,为大样本,s1.6093σ得样本均值的抽样标准误差为 x⑷分别按三个置信水平计算总体均值的置信区间:置信水平为90%时:由双侧正态分布的置信水平1-α=90%,通过2β-1=0.9换算为单侧正态分布的置信水平β=0.95,查单侧正态分布表得 Zα/2=1.64,计算得此时总体均值的置信区间为22x?Zα/23.7565s±1.64×0.9可知,当置信水平为90%时,该校大学生平均上网时间的置信区间为(2.87,3.76)小时;置信水平为95%时:由双侧正态分布的置信水平1-α=95%,得计算得此时总体均值的置信区间为Zα/2=1.96,x?Zα/23.×0.0可知,当置信水平为95%时,该校大学生平均上网时间的置信区间为(2.79,3.84)小时;置信水平为99%时:若双侧正态分布的置信水平1-α=99%,通过2β-1=0.99换算为单侧正态分布的置信水平β=0.995,查单侧正态分布表得 Zα/2=2.58,计算得此时总体均值的置信区间为x?Zα/24.0087s±2.58×0.7可知,当置信水平为99%时,该校大学生平均上网时间的置信区间为(2.62,4.01)小时。4. 从一个正态总体中随机抽取容量为8 的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值95%的置信区间。解:(7.1,12.9)。5.某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(公里)分别是:10
2求职工上班从家里到单位平均距离95%的置信区间。解:(7.18,11.57)。●6. 在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%。求总体比率的置信区间,置信水平分别为90%和95%。解:已知样本容量n =200,为大样本,拥有该品牌电视机的家庭比率p =23%, 拥有该品牌电视机的家庭比率的抽样标准误差为σp⑴双侧置信水平为90%时,通过2β-1=0.90换算为单侧正态分布的置信水平β=0.95,查单侧正态分布表得Zα/2=1.64, 23此时的置信区间为p?Zα27.89% ±1.64×2.98%=可知,当置信水平为90%时,拥有该品牌电视机的家庭总体比率的置信区间为(18.11%,27.89%)。⑵双侧置信水平为95%时,得 Zα/2=1.96,28.8408% ±1.96×2.98%=
此时的置信区间为p?Zα可知,当置信水平为95%时,拥有该品牌电视机的家庭总体比率的置信区间为;(17.16%,28.84%)。●7.某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。(1)求总体中赞成该项改革的户数比率的置信区间,置信水平为95%;(2)如果小区管理者预计赞成的比率能达到80%,应抽取多少户进行调查?解:
已知总体单位数N=500,重复抽样,样本容量n =50,为大样本,n132样本中,赞成的人数为n1=32,得到赞成的比率为 p = n=50=64%(1)赞成比率的抽样标准误差为由双侧正态分布的置信水平1-α=95%,得 Zα/2=1.96,计算得此时总体户数中赞成该项改革的户数比率的置信区间为p?Zα77.304%50.696% ±1.96×6.788%=可知,置信水平为95%时,总体中赞成该项改革的户数比率的置信区间为(50.70%,77.30%)。(2)如预计赞成的比率能达到80%,即 p=80%,由0.8?0.22(6.788%)
得样本容量为
n == 34.72 取整为35,即可得,如果小区管理者预计赞成的比率能达到80%,应抽取35户进行调查。8.从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:来自总体1的样本 来自总体2的样本n1?141?53.2n2?7 2?43.4 24s12?96.8求?1??290%的置信区间;求?1??295%的置信区间。 2s2?102.0解:(1.86,17.74);(0.19,19.41)。9.从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:来自总体1的样本 来自总体2的样本1?25s12?16 2?23 2s2?20(1)设n1?n2?100,求?1??295%的置信区间;22n?n?10???122,求?1??295%的置信区间; (2)设,122n?n?10???1212(3)设,,求?1??295%的置信区间;22n?10,n?20???1212(4)设,,求?1??295%的置信区间;22n?10,n?20???22,求?1??295%的置信区间。 (5)设1,1解:(1)2±1.176;(2)2±3.986;(3)2±3.986;(4)2±3.587;(5)2±3.364。10.下表是由4对观察值组成的随机样本:配对号1234 来自总体A的样本 2 5 10 8 来自总体B的样本 0 7 6 5(1)计算A与B各对观察值之差,再利用得出的差值计算和(2)设?1和?2分别为总体A和总体B的均值,构造sd; ?d(?1??2)95%的置信区间。s?2.63;解:(1)?1.75,d(2)1.75±4.27。11.从两个总体中各抽取一个n1?n2?250的独立随机样本,来自总体1的样本比率为p1?40%,来自总体2的样本比率为p2?30%。(1)构造?1??290%的置信区间;(2)构造?1??295%的置信区间。25解:(1)10%±6.98%;(2)10%±8.32%。12.生产工序的方差是共需质量的一个重要度量。当方差较大时,需要对共需进行改进以减小方差。下面是两部机器生产的袋茶重量(克)的数据:2构造两个总体方差比?12295%的置信区间。解:(4.06,14.35)。●13.根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求允许误差不超过4%,应抽取多大的样本?解:已知总体比率?=2%=0.02,由置信水平1-α=95%,得置信度Zα/2=1.96,允许误差E≤ 4%Zα/2即由允许误差公式
E=σ整理得到样本容量n的计算公式:Zα/2σP22Z2α/2π(1-π)1.962?0.02?0.98()E0.042E2n===≥=47.0596由于计算结果大于47,故为保证使“≥”成立,至少应取48个单位的样本。●14.某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每个购物金额的置信区间,并要求允许误差不超过20元,应抽取多少个顾客作为样本? 解:已知总体标准差?=120,由置信水平1-α=95%,得置信度Zα/2=1.96,允许误差E≤ 20Zα/2即由允许误差公式
E=σ整理得到样本容量n的计算公式:(n=Zα/2σE)21.96?1202)20≥=138.2976 (由于计算结果大于47,故为保证使“≥”成立,至少应取139个顾客作为样本。15.假定两个总体的标准差分别为:?1?12,?2?15,若要求误差范围不超过5,相应的置信水平为95%,假定n1?n2,估计两个总体均值之差?1??2时所需的样本容量为多大?
解: 57。16.假定n1?n2,允许误差E?0.05,相应的置信水平为95%,估计两个总体比率之差26?1??2时所需的样本容量为多大?解: 769。第6章
假设检验――练习题(全免)研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,所以原假设与备择假设应为:H0:??1035,H1:??1035。H:??0.04,H1:??0.04。 ?=“某一品种的小鸡因为同类相残而导致的死亡率”,0H0:??65,H1:??65。(1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但检验结果却提供证据支持店方倾向于认为其重量少于60克;(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品;(3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。z?(1)检验统计量(2)如果??s/n,在大样本情形下近似服从标准正态分布; z?z0.05,就拒绝H0;H0。 (3)检验统计量z=2.94&1.645,所以应该拒绝z=3.11,拒绝H0。z=1.93,不拒绝H0。z=7.48,拒绝H0。?2=206.22,拒绝H0。H z=-5.145,拒绝0。H t=1.36,不拒绝0。H z=-4.05,拒绝0。H F=8.28,拒绝0。(1)检验结果如下:t-检验: 双样本等方差假设平均方差变量 2 109.9 33. 变量 1 100.7 24.观测值 20 20 合并方差 28.
假设平均差 0
t Stat -5.
P(T&=t) 单尾 1.73712E-06
t 单尾临界 1.
P(T&=t) 双尾 3.47424E-06
t 双尾临界 2.t-检验: 双样本异方差假设
变量 1 变量 2 平均 100.7 109.9 方差 24.. 观测值 20 20 假设平均差 0
t Stat -5.
P(T&=t) 单尾 1.87355E-06
t 单尾临界 1.
P(T&=t) 双尾 3.74709E-06
t 双尾临界 2.(2)方差检验结果如下:F-检验 双样本方差分析
变量 1 变量 2 平均 100.7 109.9 方差 24.. 观测值 20 20 df 19 19 F 0.
P(F&=f) 单尾 0.
F 单尾临界 0.第7章
方差分析与试验设计――练习题(全免)
F?4.?8.0215(或P?value?0.0409???0.01),不能拒绝原假设。 F?17.?3.8853(或P?value?0.0003???0.05),拒绝原假设。 A?B?44.4??14.4?LSD?5.85,拒绝原假设; A?C?44.4?42.6?1.8?LSD?5.85,不能拒绝原假设;28B?C?30?42.6?12.6?LSD?5.85,拒绝原假设。 F?1.478?F0.05?3.554131(或P?value?0.245946???0.05),不能拒绝原假设。有5种不同品种的种子和4种不同的施肥方案,在20快同样面积的土地上,分别采用5种种子和4种施肥方案搭配进行试验,取得的收获量数据如下表:F种子?7.?3.2592(或P?value?0.0033???0.05),拒绝原假设。 F施肥方案?9.?3.4903(或P?value?0.0019???0.05),拒绝原假设。 F地区?0.?6.9443(或P?value?0.9311???0.05),不能拒绝原假设。F包装方法?3.?6.9443(或P?value?0.1522???0.05),不能拒绝原假设。 F广告方案?10.75?F0.05?5.1432(或P?value?0.0104???0.05),拒绝原假设。F广告媒体?3?F0.05?5.9874(或P?value?0.1340???0.05),不能拒绝原假设。 (或P?value?0.2519???0.05),不能拒绝原假设。F交互作用?1.75?F0.05?5.1432第8章
相关与回归分析――练习题●1. 表中是道琼斯工业指数(DJIA)和标准普尔500种股票指数(S&P500)1988年至1997年对应股票的收益率资料:计算两种指数收益率的相关系数,分析其相关程度,以0.05的显著性水平检验相关系数的显著性。 解:(1)解法一:利用Excel进行表格计算相关系数设DJIA收益率为x,S&P500收益率为y,将已知表格复制到Excel中,
列出计算x2、xy、y2及其合计数的栏目并进行计算,得结果如下: (利用Excel29代入相关系数计算公式得:nxy?xyr == 0.948138解法二:利用Excel函数“CORREL”计算相关系数
(Correlation coefficient, 相关系数)①将已知数据表复制到Excel中,同类数据置于同一列;②在表格外选择某一单元格后,点选菜单栏中“∑”右边的“”后,选择“其它函数”,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“∨”,选择“统计”,再在“选择函数(N)”中选择函数“CORREL”,然后点击“确定”;③在“函数参数”窗口中,点击“Array1”输入栏后,在Excel表中刷取“DJIA收益率”数据,再点击“Array2”输入栏后,在Excel表中刷取“S&P500收益率”数据,然后点击“确定”。(由于相关系数中,两变量是对等的,故两列数据的选择顺序可以对换,而计算结果是相同的。)这时即在第②步骤中所选择的单元格中出现相关系数的计算结果。 可知,相关系数为rXY?0.948138,以上相关系数的计算结果说明,DJIA收益率与S&P500收益率的相关程度属于高度正相关。 (2)计算t统计量(免)t???2.681739?8.4368510.317859给定显著性水平=0.05,查t分布表得自由度n-2=10-2=8的临界值显然t?2为2.306,t?t?,表明相关系数 r 在统计上是显著的。2.利用【例8-3】的表8.3中提供的各省市人均GDP和第一产业中就业比例的数据,试分析各30省市人均GDP与第一产业就业比例的相关性,并对其显著性作统计检验。 解: 表8.3中提供的各省市人均GDP和第一产业中就业比例的数据为:地区 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆GDP 3.00 1.19 545.96 1.67 4.71 138.73 2.51 300.95 298.38 1485.48就业比例% 48.4 60.5 40.0 61.8 60.3 54.7 58.8 66.4 73.6 71.8 55.7 59.4 60.0 56.5 56.6利用Excel中的”数据分析”计算各省市人均GDP和第一产业中就业比例的相关系数,方法同上第1题,即应用统计函数“CORREL”进行计算,也可以构成计算表格进行计算:31将计算结果代入相关系数计算公式中,nxy?xy由上得?= .11= -0.342391解法二:应用Excel中的函数“CORREL”计算, ①将已知数据表复制到Excel中;②在表格外选择某一单元格,点选菜单栏中“∑”右边的“”后,选择“其它函数”,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“∨”,选择“统计”,再在“选择函数(N)”中选择函数“CORREL”,然后点击“确定”;③在“函数参数”窗口中,点击“Array1”输入栏后,在Excel表中刷取“就业比例%”数据,再点击“Array2”输入栏后,在Excel表中刷取“GDP”数据,然后点击“确定”。 这时即在第②步骤中所选择的单元格中出现相关系数的计算结果。 结果也是
r=-0.34239,这说明人均GDP与第一产业中就业比例是负相关,但相关系数只有-0.34239,表明二者相关程度并不大,属于低度负相关关系。 相关系数检验:(免)在总体相关系数??0的原假设下,计算t统计量:32t????1.9624t查t分布表,自由度为31-2=29,当显著性水平取??0.05时,?2=2.045;当显著性水平t取??0.1时,?2=1.699。由于计算的t统计量的绝对值1.9624小于t?2=2.045,所以在??0.05的显著性水平下,不能拒绝相关系数??0的原假设。即是说,在??0.05的显著性水平下不能认为人均GDP与第一产业中就业比例有显著的线性相关性。 但是计算的t统计量的绝对值1.9624大于t?=1.699,所以在??0.1的显著性水平下,可以拒绝相关系数??0的原假设。即在??0.1的显著性水平下,可以认为人均GDP与第一产业中就业比例有一定的线性相关性。●3.表中是16支公益股票某年的每股账面价值和当年红利:(1)建立每股账面价值和当年红利的回归方程; (2)解释回归系数的经济意义;(3)若序号为6的公司的股票每股账面价值增加1元,估计当年红利可能为多少? 解: (1)设当年红利为Y,每股帐面价值为X 则回归方程为Yi??1??2Xi,下面分别应用两种方法计算回归参数:方法一:利用33将计算结果代入回归系数计算公式,得:β2?回归系数nxy?xynx2??x)2?16?498.?26.74216??(261.59)978.1346= = 0.β?y?β2x=初始值
1y?βxn2n26.74261.59?0.0728759?16=0.
= 16方法二:应用Excel函数计算直线回归方程的两个参数:⑴应用统计函数“SLOPE”计算直线斜率: (slope,斜率)①在表格外选定某单元格,作为直线斜率的放置位置,点击:菜单栏中“∑”右边的“”后,选择“其它函数”,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“∨”,选择“统计”,再在“选择函数(N)”中选择函数“SLOPE”,然后点击“确定”;②在“函数参数”窗口中,点击“Known_y’s”输入栏后,在Excel表中刷取y列数据,再点击“Known_x’s”输入栏后,在Excel表中刷取x列数据,然后点击“确定”。 这时即在选定的单元格中出现直线斜率的计算结果?2?0.072876⑵应用统计函数“INTERCEPT”计算直线与y轴的截距――直线起点值: (截距intercept )①在表格外选定某单元格,作为直线斜率的放置位置,点击:菜单栏中“∑”右边的“”后,选择“其它函数”,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“∨”,选择“统计”,再在“选择函数(N)”中选择函数“INTERCEPT”,然后点击“确定”;②在“函数参数”窗口中,点击“Known_y’s”输入栏后,在Excel表中刷取y列数据,再34点击“Known_x’s”输入栏后,在Excel表中刷取x列数据,然后点击“确定”。 这时即在选定的单元格中出现直线斜率的计算结果?1? 0.479775 于是,回归方程为Yi?0..072876Xi^(2)参数的经济意义是:当每股帐面价值增加1元时,当年红利将平均增加0.072876元。 (3)序号6的公司每股帐面价值为19.25元,若增加1元后,每股帐面价值为X=20.25元,则当年红利估算为:Yi?0...25?1.955514^(元)●4.美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》(The Wall Street(1)画出这些数据的散点图;(2)根据散点图。表明二变量之间存在什么关系?(3)求出描述投诉率是如何依赖航班按时到达正点率的估计的回归方程; (4)对估计的回归方程的斜率作出解释;(5)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数是多少? 解:(1)利用EXCEL制作数据散点图:将已知表格的后两列复制到Excel中,选择该表格后,点击:图表向导→XY 散点图→确定,即得散点图如下:(2)根据散点图可以看出,随着航班正点率的提高,投诉率呈现出下降的趋势,说明航班整点率与投诉率两者之间,存在着一定的负相关关系。[利用Excel的统计函数“CORREL”计算得到相关系数r= -0.88261,属于高度负相关]35(3)求投诉率依赖航班正点率的估计的回归方程 设投诉率为Y,航班正点率为X
建立回归方程Yi??1??2Xi解法一:应用Excel函数计算: 应用统计函数“SLOPE”计算直线斜率为:?2=-0.07041应用统计函数“INTERCEPT”计算直线与y轴的截距为:解法二:应用Excel列表计算: 作出Excel运算表格如下:?1= 6.017832β2?得回归系数为:nxy?xynx2??x)2?9?523.215?667.2?7.1829?49590.46?(667.2)?81.561= 1158.3= ―0.0704144β?y?β2x=初始值
1y?βxn2n7.18667.2?0.0704144?9=6.01783
= 9于是得回归方程为i(4)参数的经济意义是:航班正点率每提高一个百分点,相应的投诉率(次/10万名乘客)下降0.07。^Yi?6.X36(5)航班按时到达的正点率为80%时,估计每10万名乘客投诉的次数可能为:??6.?80?0.4187Yi(次/10万)5. 表中是1992年亚洲各国人均寿命(y)、按购买力平价计算的人均GDP(字率(x1)、成人识x2)x、一岁儿童疫苗接种率(3)的数据资料来源:联合国发展规划署《人的发展报告》(1)用多元回归的方法分析各国人均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的关系;(2)对所建立的回归模型进行检验。 解: 由Excel回归输出的结果可以看出: (1)回归结果为Yi?32.619X2i?0.i?0.i^(2)由Excel的计算结果已知:?1,?2,?3,?4 对应的 t 统计量分别为0.5871、t0.025(22?4)?2.101 ,所以各个自变量都对Y374..663731 ,其绝对值均大于临界值有明显影响。由F=58.20479, 大于临界值6.表中给出y对F0.05(4?1,22?4)?3.16,说明模型在整体上是显著的。 x2和x3回归的结果:离差来源
平方和(SS)
自由度(df)
平方和的均值(MSS) 来自回归(ESS)
65965来自残差(RSS)总离差(TSS)
14该回归分析中样本容量是多少?计算RSS;ESS和RSS的自由度是多少?计算可决系数和修正的可决系数;怎样检验x2和x3对y是否有显著影响?根据以上信息能否确定x2和x3各自对y的贡献为多少?解:(1)该回归分析中样本容量是14+1=15(2)计算RSS==77ESS的自由度为k-1=2,RSS的自由度 n-k=15-3=122R??0.9988 (3)计算:可决系数15?12?1?(1?0.
修正的可决系数(4)检验X2和X3对Y是否有显著影响
0.9986F?ESS/(k?1)???5140.11RSS/(n?k)77/126.4166(5) F统计量远比F临界值大,说明X2和X3联合起来对Y有显著影响,但并不能确定X2和X3各自对Y的贡献为多少。7. 在计算一元线性回归方程时,已得到以下结果:试根据此结果,填写下表的空格:38解:23y????x??x??x?ut t12t3t4t检验参数的显著性;检验整个回归方程的显著性;计算总成本对产量的非线性相关指数; 评价此回归分析存在什么不足。解: (1)用Excel输入Y和X数据,生成X和X的数据,用Y对X、X、X回归,估计参数结果为t=(-1.9213)
(2.462897)
(-2.55934)
(3.118062)
R?0.973669
?0.963764222323Yi??.Xi?0..7^t(12?4)?2.306,与t统计(2)检验参数的显著性:当取??0.05时,查t分布表得0.025量对比,除了截距项外,各回归系数对应的t统计量的绝对值均大于临界值,表明在这样的显著性水平下,回归系数显著不为0。22R?0..963794,说明可决系数(3)检验整个回归方程的显著性:模型的,较高,对样本数据拟合较好。由于F=98.60668,而当取??0.05时,查F分布表得39F0.05(4?1,12?4)?4.07,因为F=98.,应拒绝H0:?2??3??4?0,说明X、X2、X3联合起来对Y确有显著影响。(4)计算总成本对产量的非线性相关系数:因为R?0.973669因此总成本对产量的非线性相关系数为R?0.973669或R=0.9867466(5)评价:虽然经t检验各个系数均是显著的,但与临界值都十分接近,说明t检验只是22t(12?4)?3.3554,这时勉强通过,其把握并不大。如果取??0.01,则查t分布表得0.005各个参数对应的t统计量的绝对值均小于临界值,则在??0.01的显著性水平下都应接受H0:?j?0的原假设。试建立曲线回归方程y 解:利用Excel输入X、?y和Y数据,用Y对X回归,估计参数结果为??5.73?0.314xYiit值=(9.46)(-6.515)
?0.775?0.314x?y?307.9693?e整理后得到:22时间序列分析――练习题●1. 某汽车制造厂2003年产量为30万辆。40(1)若规定年年递增率不低于6%,其后年递增率不低于5%,2008年该厂汽车产量将达到多少?(2)若规定2013年汽车产量在2003年的基础上翻一番,而2004年的增长速度可望达到7.8%,问以后9年应以怎样的速度增长才能达到预定目标?(3)若规定2013年汽车产量在2003年的基础上翻一番,并要求每年保持7.4%的增长速度,问能提前多少时间达到预定目标?解:设i年的环比发展水平为x i,则由已知得:x2003=30,x06x?(1?6%)?(1?5%)xxxxx(1)又知:,,求x2008x08??(1?6%)3(1?5%)2xx
2003x1.052即为
30,从而2008年该厂汽车产量将达到得
x2008≥30× 1.06×1.05= 30×1.3131 = 39.393(万辆)从而按假定计算,2008年该厂汽车产量将达到39.393万辆以上。x=2=1+7.8%xx(2)规定由上得=?107.11%可知,2004年以后9年应以7.11%的速度增长,才能达到2013年汽车产量在2003年的基础上翻一番的目标。(3)设:按每年7.4%的增长速度n年可翻一番,1.074n?
a3log20.339log1.(年) n?log1.0742?所以可知,按每年保持7.4%的增长速度,约9.71年汽车产量可达到在2003年基础上翻一番的预定目标。原规定翻一番的时间从2003年到2013年为10年,故按每年保持7.4%的增长速度,能提前0.29年即3个月另14天达到翻一番的预定目标。●2. 某地区社会商品零售额年期间(1987年为基期)每年平均增长10%,年期间每年平均增长8.2%,年期间每年平均增长6.8%。问2003年与1987年相比该地区社会商品零售额共增长多少?年平均增长速度是多少?若1997年社会商品零售额为30亿元,按此平均增长速度,2004年的社会商品零售额应为多少?41解:设i年的环比发展水平为x i,则已知的三段年均增长率表示为:199?2992?1?110%2?(1?10%)5x,即为?(1?8.2%)5x,即为?(1?6.8%)6x,即为997?1?18.2%
?6.8%0012002
于是得:以1987年为基期,2003年与1987年相比,该地区社会商品零售额的发展速度为:x97x2003xxxx
21997556(1?10%)?(1?8.2%)?(1?6.8%)=?3..43%(原解答案中,03~97为5年是错的,导致增长速度也是错的。下同)从而得知,2003年与1987年相比,该地区社会商品零售额共增长254.43%。(2)1987年至2003年之间,年平均发展速度为:200?3
可知,1987年至2003年之间,年平均增长速度为8.23%。(3) 若x1997=30亿元,按平均增长速度8.23%计算x2004,200?4
?1?8.23%730?(1?0.7 (亿元)
x2004=可知,按照假定,2004年的社会商品零售额应为52.1867亿元●3.某地区国内生产总值在年平均每年递增12%,年平均每年递增10%,年平均每年递增8%。试计算:(1)该地区国内生产总值在这10年间的发展总速度和平均增长速度;(2)若2000年的国内生产总值为500亿元,以后平均每年增长6%,到2002年可达多少?(3)若2002年的国内生产总值的计划任务为570亿元,一季度的季节比率为105%,则2002年一季度的计划任务应为多少?解:设i年的环比发展水平为x i,则已知的三段年均增长率表示为:199?3
?1?12%x3?(1?12%)x,即199042199?7200?0?1?10%x4?(1?10%)x,即1993?1?8%x3?(1?08%)x,即1997该地区国内生产总值在这10年间的发展总速度为xx%)3?(1?10%)4?(1?8%)3?2.%则平均增长速度为:1?1..989%2002?若x亿元,以后平均每年增长6%,即由?1?6%%)?561.80(亿元)得到
x2002=,可知,若2000年的国内生产总值为500亿元,以后平均每年增长6%,到2002年可达561.80亿元。若2002年的国内生产总值的计划任务为570亿元,一季度的季节比率为105%,则2002年各季度的平均计划任务是570÷4亿元,于是,2002年一季度的计划任务为:142.5?105%?149.625(亿元)。●4. 某公司近10年间股票的每股收益如下(单位:元):0.64,0.73,0.94,1.14,1.33,1.53,1.67,1.68,2.10,2.50(1)分别用移动平均法和趋势方程预测该公司下一年的收益;(2)通过时间序列的数据和发展趋势判断,是否是该公司应选择的合适投资方向? 解: (1) *用移动平均法预测该公司下一年的收益:在Excel中作出10年间股票的每股收益表,添加“五项平均”计算列,选定“五项平均”列中的第三行单元格,点击菜单栏中“∑”符号右边的小三角“”,选择点击:自动求和→平均值,用鼠标选定前五个数据(b2:b6),回车,即得到第一个五项平均值“0.96”。选择第一个五项平均“0.96”所在的单元格,并将鼠标移动到该单元格的右下方,当鼠标变成黑“+”字时,压下左键并拉动鼠标到该列倒数第三行的单元格处放开,即得到用五项移43再利用上表的计算结果预测第11年的每股收益:选定上Excel表中的全部预测值,并将鼠标移动到该选定区域的右下方,当鼠标变成黑“+”字时,压下左键并拉动鼠标到该列第11年对应的单元格处放开,即获得9~11年的预测值(2.30”。如下表:*
先求出10年间股票每股收益的趋势(回归)方程。设时间为t,每股收益为y,趋势方程为
y=β1+β2 t解法一:应用Excel统计函数进行计算:⑴应用统计函数“SLOPE”计算直线斜率:①在表格外选定某单元格,作为直线斜率的放置位置,点击:菜单栏中“∑”右边的“”后,选择“其它函数”,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“∨”,选择“统计”,再在“选择函数(N)”中选择函数“SLOPE”,然后点击“确定”;②在“函数参数”窗口中,点击“Known_y’s”输入栏后,在Excel表中刷取y列数据,再点击“Known_x’s”输入栏后,在Excel表中刷取t列数据,然后点击“确定”。这时即在选定的单元格中出现直线斜率的计算结果?2?0.192848⑵应用统计函数“INTERCEPT”计算直线与y轴的截距――直线起点值:①在表格外选定某单元格,作为直线斜率的放置位置,点击:菜单栏中“∑”右边的“”后,选择“其它函数”,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“∨”,选择“统计”,再在“选择函数(N)”中选择函数“INTERCEPT”,然后点击“确定”;②在“函数参数”窗口中,点击“Known_y’s”输入栏后,在Excel表中刷取y列数据,再点击“Known_x’s”输入栏后,在Excel表中刷取x列数据,然后点击“确定”。这时即在选定的单元格中出现直线斜率的计算结果?1? 0.365333解法二:应用最小二乘法,用Excel列表计算趋势方程的公式元素:44β2?可得:回归系数nty?tynt2??t)2?10?94.34?55?14.26159.1?0.19284810?385?(55)2825=β?y?β2t=初始值
1y?βtn2n14.2655?0.192848?10=0.365336
= 10于是,得每股收益倚年份序号的趋势方程为:对趋势方程代入
t=11,可预测下一年(第11年)的每股收益为:^Yt?0.365?0.193t??0.365?0.193?11?2.488Y11元(2)时间数列数据表明该公司股票收益逐年增加,趋势方程也表明平均每年增长0.193元。是一个较为适合的投资方向。(2)拟合线性模型测定长期趋势; (3)预测2004年各季度鲜蛋销售量。 解:(1)由于应用移动平均法修匀数据由于周期性或季节性引起的波动,必须以周期或季节的长度作为时距的长度,因此对上面的数据作四项移动平均。45先在Excel中将数据按年序和季度顺序排列成表,然后计算四项移动平均:选定“四项移动平均”列中的第三季度对应的单元格(实际位于第二、三季度之间,即上升半行的位置),点击:菜单栏中“∑”右边的“”后,选择“平均值”后,,在Excel表中刷取2000年的四个季度的销售量数据,回车,即获得第一个四项平均值。选定上Excel表中的第一个四项平均值,并将鼠标移动到该选定单元格的右下方,当鼠标变成黑“+”字时,压下左键并拉动鼠标到该列倒数第三行(实际位于第二、三季度之间,即上升半行的位置) 的单元格处放开,即获得全部四项移动平均值。再计算移正平均:选定“移正平均”列中的第三季度对应的单元格,点击:菜单栏中“∑”右边的“”后,选择“平均值”后,,在Excel表中刷取头两个四项平均值,回车,即获得第一个移正平均值。选定上Excel表中的第一个移正平均值,并将鼠标移动到该选定单元格的右下方,当鼠标变成黑“+”字时,压下左键并拉动鼠标到该列倒数第三行的单元格处放开,即获得全部移正平均值。
可见,移正后的数据基本上呈上升状态,已经消除了原来鲜蛋销售量的季节波动影响,为作数据的长期趋势分析提供了有效支持。
数据如下表:移动平均法消除季节变动计算表(2)设线性趋势方程为
y=β1+β2 t解法一:应用Excel统计函数计算趋势方程的系数:
应用统计函数“SLOPE”计算直线斜率,得:β2=0.639853应用统计函数“INTERCEPT”计算直线与y轴的截距,得:β1=8.6925
解法二:应用最小二乘法,用Excel列表计算趋势方程的公式元素:46于是得:回归系数β2?nty?tynt2??t)2?16??226.116?3480.8?0.=初始值β1?y?β2t=y?βtn2n226.1136?0.6398529?16=8.6925 = 16从而,鲜蛋销售量倚季度变化的趋势方程为:y?8.85?t(原答案中的两个系数均有误差。)47??8.95?tT上表中,其趋势拟合为直线方程t。根据上表计算的季节比率,按照公式2004年第一季度预测值:???T??SYttt?KL计算可得:??(8.95?17)?1.097301??T??SY?21.2004年第二季度预测值:??(8.95?18)?1..49725??T??SY181822004年第三季度预测值:??(8.95??T??SY?19)?0..009 191932004年第四季度预测值:??(8.95?20)?0..6468??T??SY20204(2)用移动平均法分析其长期趋势。 解:(1)用原始资料法计算的各月季节比率为:48平均法计算季节比率表:季节比率的图形如下:(2)49原时间序列与移动平均的趋势如下图所示:507.运用练习题9.7中国各月工业总产值的数据,作以下分析: (1)分析其长期趋势;(2)剔除长期趋势后分析其季节变动情况,并与练习题9.7的分析结果对比说明有何不同、为什么?(3)分析是否存在循环变动。 解:(1)采用线性趋势方程法:??460.5Tt 剔除其长期趋势。i5152(3)运用分解法可得到循环因素如下图:统计指数――练习题●1. 给出某市场上四种蔬菜的销售资料如下表:⑴ 用拉氏公式编制四种蔬菜的销售量总指数和价格总指数;⑵ 再用帕氏公式编制四种蔬菜的销售量总指数和价格总指数;⑶ 比较两种公式编制出来的销售量总指数和价格总指数的差异。解:设销售量为q,价格为p,则价值量指标、数量指标、质量指标三者关系为:
销售额=销售量×价格qp =
p于是代入相应公式计算得:⑴用拉氏公式编制总指数为:53Lq?四种蔬菜的销售量总指数
qpqp1000?% , .8?107.73%2039.2 Lp四种蔬菜的价格总指数⑵ 用帕氏公式编制总指数: qp?qp10?Pq?四种蔬菜的销售量总指数为
qpqp03.83%
1?107.39%2124
Pp?四种蔬菜的价格总指数为
qpqp11⑶ 比较两种公式编制出来的销售量总指数和价格总指数,可见:拉氏指数>帕氏指数
在经济意义上,拉氏指数将同度量因素固定在基期。销售量总指数说明消费者为保持与基期相同的消费价格,因调整增减的实际购买量而导致实际开支增减的百分比;价格总指数说明消费者为购买与基期相同数量的四种蔬菜,因价格的变化而导致实际开支增减的百分比。帕氏指数将同度量因素固定在计算期。销售量总指数说明消费者在计算期购买的四种蔬菜,因销售量的变化而导致实际开支增减的百分比;价格总指数说明消费者在计算期实际购买的四种蔬菜,因价格的变化而导致实际开支增减的百分比。●2.依据上题的资料,试分别采用埃奇沃斯公式、理想公式和鲍莱公式编制销售量指数;然后,与拉氏指数和帕氏指数的结果进行比较,看看它们之间有什么关系。解:采用埃奇沃斯公式编制销售量指数为:?q1(p0?p1)??q1p0??q1p1Eq?q0(p0?p1)q0p0?q0p15??103.?采用理想公式编制销售量指数为:?Fq???103.994869%采用鲍莱公式编制销售量指数为:1?q1p0?q1p11Bq?(?)?(Lq?Pq)2q0p0q0p12104.16%?103.83%?104.00%2与拉氏销售量指数和帕氏销售量指数的结果进行比较,它们之间的关系是: ?
Lq?Bq?Fq?Eq?Pq即拉氏销售量指数最大,鲍莱销售量指数次大,理想销售量指数居中,埃奇沃斯销售量指数较小,帕氏销售量指数最小。●3.某企业共生产三种不同的产品,有关的产量、成本和销售价格资料如下表所示:54⑴
⑵ 试比较说明:两种产量指数具有何种不同的经济分析意义?解:设产量为q,单位成本为p,销售价格为r,则价值量指标、数量指标、质量指标三者关系为:产值=产量×价格
总成本=产量×单位成本
p⑴*以单位产品成本p为同度量因素,编制该企业的帕氏产量指数Pq:选择已知表格中的单位产品成本和产量数据,标注符号,并利用Excel计算帕氏产量指数的构成元素如下:于是,以单位产品成本为同度量因素,编制该企业的帕氏产量指数为Pqqp?qp111?94500?92.83%101800*以销售价格r为同度量因素,编制该企业的帕氏产量指数Pq再选择已知表格中的价格和产量数据,标注符号,并利用Excel计算帕氏产量指数的构成元素如下:于是,以价格为同度量因素,编制该企业的帕氏产量指数为Pqqr?qr1101?117100?93.27%125550⑵ 比较说明两种产量指数不同的经济分析意义:以单位产品成本为同度量因素编制的该企业的帕氏产量指数说明,按计算期计算的三种产品,因产量的变化而导致总成本增减的百分比。55以销售价格为同度量因素编制的该企业的帕氏产量指数说明,按计算期计算的三种产品,因产量的变化而导致总产值增减的百分比。 ●4.给出某市场上四种蔬菜的销售资料如下表:⑴ 用基期加权的算术平均指数公式编制四种蔬菜的价格总指数; ⑵ 用计算期加权的调和平均指数公式编制四种蔬菜的价格总指数; ⑶ 再用基期加权的几何平均指数公式编制四种蔬菜的价格总指数; ⑷ 比较三种公式编制出来的销售价格总指数的差异。解:设销售量为q,价格为p,则个体价格指数为ip,销售额指标、销售量指标、价格指标三者关系为:销售额=销售量×价格
p⑴ 求用基期加权的算术平均指数公式编制四种蔬菜的价格总指数:Ap?用基期加权的算术平均价格指数为
作ipqpqp00用基期加权的算术平均价格指数为:Ap??ipqpqp00?2196.8?107.73%2039.2;⑵ 用计算期加权的调和平均指数公式编制四种蔬菜的价格总指数Hp?用计算期加权的调和平均价格指数公式为
作Excel?pqpq?ip111156即得用计算期加权的调和平均价格指数为:?p1q12281Hp???107.39%p1q12124?ip⑶ 用基期加权的几何平均指数公式编制四种蔬菜的价格总指数(课本无此内容)p?Gp?107.01%●5.利用第4题的资料和计算结果,试建立适当的指数体系,并就蔬菜销售额的变动进行因素分析。?V?Lq?Pp??V??L??P解:对总量的变动进行因素分析的方案为
?,qp?物值指数=物量拉氏指数?物价帕氏指数??按拉氏指数计算??按帕氏指数计算????物
值?????的因物价变化引?=的因物量变化引???总增量???????????起的物值增量??起的物值增量???亦即, ?q1p1q1p0q1p1?????q0p0?q0p0?q1p0?(qp?qp)?(qp?qp)?(qp?qp)?10?00?11?10 或者为:??11?00根据第4题的资料和计算结果得:qp?qpqpqp1001110?104.16%?107.39%?111.86%?qpqp11(?q1p0??q0p0)?(?q1p1??q1p0)?84.8?157?241.8?(?q1p1??q0p0)上述关系说明:四种蔬菜的销售量增长4.16%,使销售额增加84.8元;价格上涨7.39%,使销售额增加157元。两因素共同作用的影响,使销售额增长11.86%,增加总额为241.8元。 ●6.已知某地区1997年的农副产品收购总额为360亿元,1998年比上年的收购总额增长12%,农副产品收购价格总指数为105% 。试考虑,1998年与1997年对比: ⑴ 农民因交售农副产品共增加多少收入?⑵ 农副产品收购量增加了百分之几?农民因此增加了多少收入? ⑶ 由于农副产品收购价格提高5%,农民又增加了多少收入? ⑷ 验证以上三方面的分析结论能否保持协调一致。?V?Lq?Pp??V??L??P?解:这是因素分析题型,应该应用指数体系,qp题中,农副产品收购总额、收购量与收购价格的关系为:57收购总额=收购量×收购价格qp
p则已知 ?qp00?360,V=1+12%,Pp?105%,⑴求1998年与1997年对比农民因交售农副产品共增加的收入额,亦即收购总额的增量?V??q1p1??q0p0:由已知得
?V??q1p1??q0p0?360?12%?4 3. (亿元2)⑵农副产品收购量增加百分比为Lq:Lq?V1?由指数体系得
P?12%?106.67%p105%,农民因此增加的收入,亦即为农副产品收购量增加导致收购总额增加量?Lq:Lq??q1p0由于
q0p0,得到
?q1p0?Lq??q0p0于是,
?Lq??q1p0??q0p?0Lq??qp0?0?qp0??q0p0?(Lq?1)?360?6.67%?24.0
(亿元)⑶由于农副产品收购价格提高5%,亦即Pp?105%,农民增加的收入?Pp,由于
?P?p?q1p1??qp1?0V??qp0?0Lq??qp0?Lq?Pp??q0p0?Lq??q0p0?Lq?(Pp?1)??q0p0?360?106.67%?5%?19.2
(亿元)⑷验证以上三方面的分析结论:由于
Lq?Pp?106.67?%10?5%11 2而
V?112% ,对比得
V?Lq?Pp又由于
?Lq??Pp?24.0?19.?24 3而
?V?43.2,58对比得?Lq??Pp??V?V?Lq?Pp??V??L??P可见,指数体系?成立,qp说明,以上三方面的分析结论能保持协调一致。7.⑴ 分别编制该商品总平均价格的可变构成指数、固定构成指数和结构变动影响指数; ⑵ 建立指数体系,从相对数的角度进行总平均价格变动的因素分析;⑶ 进一步地,综合分析销售总量变动和平均价格变动对该种商品销售总额的影响。0??2.3816 ,
1??2.6967 ,
假定??2.3483解:⑴ 2..6967??2..%?114.84%?113.23%
⑶120.74%?106.63%?113.23% , 968?309.6?658.68.试运用“标准比值法”计算各企业的工业经济效益综合指数,并按综合效益的好坏对其进行排序。解:依据有关公式列表计算各企业的工业经济效益综合指数如下:599.依据上题的有关资料,试运用“改进的功效系数法”计算各企业的工业经济效益综合指数,并按综合效益的好坏对其进行排序。比较上面两种方法给出的综合评价结果的差异,并就产生这种差异的原因进行深入分析,借以加深对有关综合评价方法的认识。解:依据有关公式列表计算各企业的工业经济效益综合指数如下表:各企业经济效益综合指数一览表(改进的功效系数法)上面两种方法给出的综合评价结果的差异表现在D、E两个企业的综合经济效益排名不同。原因在于两种方法的对比标准不同(以下具体说明)。第11章
统计决策11.1(1)根据最大的最大收益值准则,应该选择方案一。(2)根据最大的最小收益值准则,应该选择方案三。(3)方案一的最大后悔值为250,方案二的最大后悔值为200,方案三的最大后悔值为300,所以根据最小的最大后悔值准则,应选择方案二。(4)当乐观系数为0.7时,可得:方案一的期望值为220,方案二的期望值为104,方案三的期望值为85。根据折中原则,应该选择方案一。(5)假设各种状况出现的概率相同,则三个方案的期望值分别为:116.67、93.33、83.33 按等可能性准则,应选择方案一。11.2 (1)略(2)三个方案的期望值分别为:150万元、140万元和96万元。但方案一的变异系数为1.09,方案二的变异系数为0.80,根据期望值准则结合变异系数准则,应选择方案二。(3)宜采用满意准则。选择方案二。(4) 宜采用满意准则。选择方案三。11.3 钥匙留在车内为 A,汽车被盗为E。P(A/E)=(0.2*0.05)/ (0.02*0.05+0.8*0.01)= 55.56%。11.4 (1)买到传动装置有问题的车的概率是30%。(2)修理工判断车子有问题为B1,,车子真正有问题为A1,60P(A1/B1)=(0.3*0.9)/(0.3*0.9+0.7*0.2)= 66%(3)修理工判断车子没有问题为B2,车子真正有问题为A1P(A1/B2)=(0.3*0.1)/(0.3*0.1 +0.7*0.8)= 5%11.5 决策树图 略。生产该品种的期望收益值为41.5万元大于不生产的期望值,根据现有信息可生产。 自行调查得出受欢迎结论的概率=0.65*0.7+0.35*0.30=0.56,此时,市场真实欢迎的概率=0.65*0.7/(0.65*0.7+0.35*0.30)=0.8125期望收益值=(77*0..+(-3*0.44) =30.25万元委托调查得出受欢迎结论的概率=0.65*0.8 +0.35*0.20=0.59此时,市场真实受欢迎的概率= 0.65*0.8/(0.65*0.8 +0.35*0.20)=0.8814期望收益值=(75*0..+(-5*0.41)=34.50万元根据以上分析结果。由于进一步调查的可靠性不高,并要花费相应的费用,所以没有必要进一步调查。第12章
国民经济统计基础知识12.1 生产法GDP=168760亿元;分配法GDP=168755亿元使用法GDP=154070亿元国内生产净值=149755亿元(按生产法计算)国民总收入=165575亿元(按收入法计算)国民可支配总收入=167495亿元国民可支配净收入=148490亿元消费率=67.95%(按可支配总收入计算)储蓄率=32.05%(按可支配总收入计算)投资率=27.31%(按使用法GDP计算)12.2 国民财富总额为:216765亿元12.3生产法GDP增长速度为8.69%;紧缩价格指数为102.83%。使用法GDP增长速度为8.25%。紧缩价格指数为103.25%。61欢迎您转载分享:
更多精彩:

我要回帖

更多关于 26章反比例函数教案 的文章

 

随机推荐