样本方差为什么除以n1n 应该是6还是18求大神指点!!!

问:1个正数的平方和为3,方差33,求平均数答:告诉你一个公式:有n个数:X1,X2,…,Xn记E(X)=(X1+X2+…+Xn)/n(平均值)E(X^2)=(X1^2+x2^2+…+Xn^2)/n(平方和除以n)方差D(X)它们之间的是:D(X)=E(X^...
问:方差计算为什么有两种,除以N或者除以N-1?方差计算为什么有两种,除以N或者除以N-1?举例说明用途,解析对象?能否通俗...答:有偏估计和无偏估计的别。方差是概率论内容,至少需要以上基础知识。用通俗方法解释,需要“大师”专业人士。
问:什么叫做方差,极差?答:方差,极差,都是统计学中反映一组数据的离散程度一个指标值!方差,=(每个数据与平均值的差)平方后的总和除以(数据个数n)极差,=数据中最大数和最小数的差...
问:方差与样本方差的别?为什么方差是除以N,样本方差是除以N-1...答:1.某随机变量的方差,有无穷多个样本,可以通过抽取一个样本集,以它的方差作为该随机变量方差的估计。当该样本集的样本数N趋于正无穷时,可以证明除以N-1...
问:方差怎么算啊!要有例子答:就是各数与平均值差值的平方的平均数设三个数a,b,c.平均数为x=1/3(a+b+c).则方差为1/3[(x-a)^2+(x-b)^2+(x-c)^2]。
问:样本的方差为什么除以n-1概率论第章答:这个跟的概念容易混。1.某随机变量的方差,有无穷多个样本,可以通过抽取一个样本集,以它的方差作为该随机变量方差的估计。当该样本集的样本数N趋于正...
问:方差和标准差怎么求?答:1)求一组数据的方差一般是先求这组数据的平均数;再求这所有的数与这个平均数的差的“平方和”;用这个平方和除以这组数据的个数即为“方差”。2)标准差即是方...
问:样本方差和总体方差和方差的点估计值哪2个是除以n-1哪2个...答:样本方差和总体方差和方差的点估计值哪2个是除以n-1哪2个是除以n的总体均是除以n,样本是除以n-1.你
问:方差与期望的题甲,乙两台车床生产同一件,一天生产中的次品数分别为X,Y。X,Y的分布律是X=...答:X的期望=*.4+1*.3+2*.2+3*.1=1其方差=(-1)^2*.4+(1-1)^2*.3+(2-1)^2*.2+(3-1)^2*.1=.4+.2+.4=1。Y的期望=*.3+1*.5+2*.2=.其方差=(-.)...
问:方差为什么除以n-1标准差 s=[(xi-x均)2/n-1]开根号为什么要除以n-1,有的除以n答:这个要看样本容量,样本容量比较小,一般认为小于3个时,除以n-1,样本容量大时,除以n
问:数学题:若随机变量N满足期望为-1方差为3则 E[3(N*N-2)爱...若随机变量N满足期望为-1方差为3则 E[3(N*N-2)]?答:由DN=E(N^2)-(EN)^2,解得E(N^2)=4 E[3(N*N-2)]=3*E(N^2)-6=6
问:为什么样本方差要除以n-1而方差要除以N?的方差是(xi-x均值)平方除以总数,这我理解,那为什么样本的方差是除以(n-1)呢...答:楼上很明显是从哪儿过来的啊.可以参考下这里 : edu.ce/topic/ky/bk/sxfx/1.jpg总体的方差肯定是要除以n的,此外,...
问:方差为什么要这么复杂为什么要每个数与平均相减再取平方,取它们的差的绝对值不也可以吗?答:一组数据:.5,.5,1,1,1另一组数据:6,,1,1,1两组数据的平均数显然都是他们与平均数的差的绝对值都为6第一组数据的方差=.5第二组数据的方差=12...
问:方差和标准差有什么别?什么时候除以N?什么时候除以(n-1)...答:标准差是方差的平方根,标准差能反映一个数据集的离散程度。方差反映随机变量和均值之间的偏离程度。除以(n-1)时才是总体方差的无偏估计量,而除以n是总体方差...
08-2708-3108-2307-16
04-0403-1203-2102-25
◇本站云标签查看: 7711|回复: 4
样本方差公式中为什么是(n-1)?
主题帖子积分
王道论坛中级道友, 积分 615, 距离下一级还需 385 积分
王道论坛中级道友, 积分 615, 距离下一级还需 385 积分
报考学校浙大
本科学校东北大学
主题帖子积分
考研年份2010
报考学校SJTU
本科学校HNU
那个一致性之类的玩意儿有关,我忘记具体的了,反正有个统计量的有效性的东西。
你可以证明的
已经归隐,微信加公众号「靖难」或 扫描头像二维码可以找到我.
主题帖子积分
王道论坛中级道友, 积分 615, 距离下一级还需 385 积分
王道论坛中级道友, 积分 615, 距离下一级还需 385 积分
报考学校浙大
本科学校东北大学
本帖最后由 wy 于
15:12 编辑
& &  首先,在估计总体的平均数时,由于样本中的 n 个数都是相互独立的,从其中抽出任何一个数都不影响其他数据,所以其自由度为n。
  在估计总体的方差时,使用的是离差平方和。只要n-1个数的离差平方和确定了,方差也就确定了;因为在均值确定后,如果知道了其中n-1个数的值,第n个数的值也就确定了。这里,均值就相当于一个限制条件,由于加了这个限制条件,估计总体方差的自由度为n-1。例如,有一个有4个数据(n=4)的样本, 其平均值m等于5,即受到m=5的条件限制, 在自由确定4、2、5三个数据后, 第四个数据只能是9, 否则m≠5。因而这里的自由度υ=n-1=4-1=3
主题帖子积分
王道论坛初级道友, 积分 26, 距离下一级还需 174 积分
王道论坛初级道友, 积分 26, 距离下一级还需 174 积分
考研年份2011
报考学校哈工大
本科学校安庆大学
无偏估计量,好像浙版有提到……
主题帖子积分
王道论坛实习道友, 积分 13, 距离下一级还需 7 积分
王道论坛实习道友, 积分 13, 距离下一级还需 7 积分
路过&&帮顶
速度与激情6 bbs.6699.tv/dz/59717/
僵尸世界大战 bbs.6699.tv/kb/39903/
|||王道论坛温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!&&|&&
LOFTER精选
网易考拉推荐
用微信&&“扫一扫”
将文章分享到朋友圈。
用易信&&“扫一扫”
将文章分享到朋友圈。
阅读(37195)|
用微信&&“扫一扫”
将文章分享到朋友圈。
用易信&&“扫一扫”
将文章分享到朋友圈。
历史上的今天
loftPermalink:'',
id:'fks_084066',
blogTitle:'均方根误差与标准差、均方差、标准偏差',
blogAbstract:'
有人经常混用均方根误差(RMSE)与标准差(Standard Deviation),实际上二者并不是一回事。
1.& 均方根误差
均方根误差为了说明样本的离散程度。
均方根误差(root-mean-square error )亦称标准误差,其定义为 ,i=1,2,3,…n。在有限测量次数中,均方根误差常用下式表示:',
blogTag:'',
blogUrl:'blog/static/',
isPublished:1,
istop:false,
modifyTime:7,
publishTime:7,
permalink:'blog/static/',
commentCount:4,
mainCommentCount:4,
recommendCount:0,
bsrk:-100,
publisherId:0,
recomBlogHome:false,
currentRecomBlog:false,
attachmentsFileIds:[],
groupInfo:{},
friendstatus:'none',
followstatus:'unFollow',
pubSucc:'',
visitorProvince:'',
visitorCity:'',
visitorNewUser:false,
postAddInfo:{},
mset:'000',
remindgoodnightblog:false,
isBlackVisitor:false,
isShowYodaoAd:false,
hostIntro:'',
hmcon:'1',
selfRecomBlogCount:'0',
lofter_single:''
{list a as x}
{if x.moveFrom=='wap'}
{elseif x.moveFrom=='iphone'}
{elseif x.moveFrom=='android'}
{elseif x.moveFrom=='mobile'}
${a.selfIntro|escape}{if great260}${suplement}{/if}
{list a as x}
推荐过这篇日志的人:
{list a as x}
{if !!b&&b.length>0}
他们还推荐了:
{list b as y}
转载记录:
{list d as x}
{list a as x}
{list a as x}
{list a as x}
{list a as x}
{if x_index>4}{break}{/if}
${fn2(x.publishTime,'yyyy-MM-dd HH:mm:ss')}
{list a as x}
{if !!(blogDetail.preBlogPermalink)}
{if !!(blogDetail.nextBlogPermalink)}
{list a as x}
{if defined('newslist')&&newslist.length>0}
{list newslist as x}
{if x_index>7}{break}{/if}
{list a as x}
{var first_option =}
{list x.voteDetailList as voteToOption}
{if voteToOption==1}
{if first_option==false},{/if}&&“${b[voteToOption_index]}”&&
{if (x.role!="-1") },“我是${c[x.role]}”&&{/if}
&&&&&&&&${fn1(x.voteTime)}
{if x.userName==''}{/if}
网易公司版权所有&&
{list x.l as y}
{if defined('wl')}
{list wl as x}{/list}关注今日:1 | 主题:192901
微信扫一扫
【求助】动物实验中动物数量不太一致n=6、7、8,这样数据可用吗?
页码直达:
问题已解决悬赏丁当:2
动物实验中由于动物死亡造成动物数量不太一致n=6、7、8,这样数据可用吗?还是都取成n=6?(放在英文论文中)
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
可以,按照不平衡设计来,,当然,检验效能稍微差一点
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
pearzhouq 可以,按照不平衡设计来,,当然,检验效能稍微差一点具体如何做呢?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
水墨云彩 具体如何做呢?。。。你这个话题答的太模糊了。。。。先说说最初的设计吧。。。只要不要方差分析和配对检验,就该怎么分析就怎么分析。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
pearzhouq 。。。你这个话题答的太模糊了。。。。先说说最初的设计吧。。。只要不要方差分析和配对检验,就该怎么分析就怎么分析。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
pearzhouq 。。。你这个话题答的太模糊了。。。。先说说最初的设计吧。。。只要不要方差分析和配对检验,就该怎么分析就怎么分析。谢谢~我的实验本来是要都n=8的,但最后结果是这样的,ABC三组在abcde天,五个取样时间点的样本数分别为n=888,888,776,776,776。这样n不一致就不能做方差分析比较显著性差异了吗?以及配对检验也有其他要求了吗?这些结果肯定要做方法分析的呀
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
水墨云彩 谢谢~我的实验本来是要都n=8的,但最后结果是这样的,ABC三组在abcde天,五个取样时间点的样本数分别为n=888,888,776,776,776。这样n不一致就不能做方差分析比较显著性差异了吗?以及配对检验也有其他要求了吗?这些结果肯定要做方法分析的呀是的,例数不一致就不能做方差分析,。直接按混合线性模型,当然,这个有难度。。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
pearzhouq 是的,例数不一致就不能做方差分析,。直接按混合线性模型,当然,这个有难度。。啊,这样啊,那还不如都取n=6呢。如果是这样,那是做one way ANOVA还是two way ANOVA呢?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
水墨云彩 啊,这样啊,那还不如都取n=6呢。如果是这样,那是做one way ANOVA还是two way ANOVA呢?看具体实验设计的分组了
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
pearzhouq 看具体实验设计的分组了就是上面说的ABC三组在abcde天,五个取样时间点。三组一组阳性对照,一组空白对照,一组药物。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
水墨云彩 就是上面说的ABC三组在abcde天,五个取样时间点。三组一组阳性对照,一组空白对照,一组药物。奇数组,不用看,肯定单因素才行
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
pearzhouq 奇数组,不用看,肯定单因素才行好的。虽然不懂,还是谢谢你啦!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
pearzhouq 是的,例数不一致就不能做方差分析,。直接按混合线性模型,当然,这个有难度。。您好,我想再问一下在DAS 2.0有下面这种方差分析,是可以做多组均数对比的,也就是例数不一致的方差分析(我目前做的方差分析)。这样的分析是否合适呢?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
水墨云彩 您好,我想再问一下在DAS 2.0有下面这种方差分析,是可以做多组均数对比的,也就是例数不一致的方差分析(我目前做的方差分析)。这样的分析是否合适呢?我所知只有方差不齐性的方差分析,倒真没有例数不一致的方差分析,。如上,你贴的t‘检验就是方差不齐性的welch's t检验,具体确实不知道。抱歉。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
pearzhouq 我所知只有方差不齐性的方差分析,倒真没有例数不一致的方差分析,。如上,你贴的t‘检验就是方差不齐性的welch's t检验,具体确实不知道。抱歉。好的,谢谢了!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
为什么不能方差?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
dongmeixue881027 为什么不能方差?楼上说例数不一致
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
水墨云彩 楼上说例数不一致 。说错了,这几天看资料才发现之前弄错了,抱歉,针对单因素分析,方差分析的各组例数可以不一致,但两因素以上就不行,重复测量的更不行。。具体参考:When Unequal Sample Sizes Are and Are NOT a Problem in ANOVAIn your statistics class, your professor made a big deal about unequal sample sizes in one-way Analysis of Variance (ANOVA) for two reasons.1. Because she was making you calculate everything by hand.
Sums of squares require a different formula if sample sizes are unequal, but SPSS (and other statistical software) will automatically use the right formula.2. Nice properties in ANOVA such as the Grand Mean being the intercept in an effect-coded regression model don’t hold when data are unbalanced.
Instead of the grand mean, you need to use a weighted mean.
That’s not a big deal if you’re aware of it.The only practical issue in one-way ANOVA is that very unequal sample sizes can affect the homogeneity of variance assumption.
ANOVA is considered robust to moderate departures from this assumption, but the departure needs to stay smaller when the sample sizes are very different.
According to Keppel (1993), there isn’t a good rule of thumb for the point at which unequal sample sizes make heterogeneity of variance a problem.Real issues with unequal sample sizes do occur in factorial ANOVA, if the sample sizes are confounded in the two (or more) factors.
For example, in a two-way ANOVA, let’s say that your two independent variables (factors) are age (young vs. old) and marital status (married vs. not).
If there are twice as many young people as old and the young group has a much larger percentage of singles than the older group, the effect of marital status cannot be distinguished from the effect of age.Power is based on the smallest sample size, so while it doesn’t hurt power to have more observations in the larger group, it doesn’t help either.地址:/when-unequal-sample-sizes-are-and-are-not-a-problem-in-anova/
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
我这个情况您之前说基数组做单因素,后来说是两个变量,我感觉是分组这一个变量,这个是怎么回事呢?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
。说错了,这几天看资料才发现之前弄错了,抱歉,针对单因素分析,方差分析的各组例数可以不一致,但两因素以上就不行,重复测量的更不行。。具体参考:When Unequal Sample Sizes Are and Are NOT a Problem in ANOVAIn your statistics class, your professor made a big deal about unequal sample sizes in one-way Analysis of Variance (ANOVA) for two reasons.1. Because she was making you calculate everything by hand.
Sums of squares require a different formula if sample sizes are unequal, but SPSS (and other statistical software) will automatically use the right formula.2. Nice properties in ANOVA such as the Grand Mean being the intercept in an effect-coded regression model don’t hold when data are unbalanced.
Instead of the grand mean, you need to use a weighted mean.
That’s not a big deal if you’re aware of it.The only practical issue in one-way ANOVA is that very unequal sample sizes can affect the homogeneity of variance assumption.
ANOVA is considered robust to moderate departures from this assumption, but the departure needs to stay smaller when the sample sizes are very different.
According to Keppel (1993), there isn’t a good rule of thumb for the point at which unequal sample sizes make heterogeneity of variance a problem.Real issues with unequal sample sizes do occur in factorial ANOVA, if the sample sizes are confounded in the two (or more) factors.
For example, in a two-way ANOVA, let’s say that your two independent variables (factors) are age (young vs. old) and marital status (married vs. not).
If there are twice as many young people as old and the young group has a much larger percentage of singles than the older group, the effect of marital status cannot be distinguished from the effect of age.Power is based on the smallest sample size, so while it doesn’t hurt power to have more observations in the larger group, it doesn’t help either.地址:/when-unequal-sample-sizes-are-and-are-not-a-problem-in-anova/我这个情况您之前说基数组做单因素,后来说是两个变量,我感觉是分组这一个变量,这个是怎么回事呢?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
水墨云彩 我这个情况您之前说基数组做单因素,后来说是两个变量,我感觉是分组这一个变量,这个是怎么回事呢?。。没有看明白您说什么。。。。我想说一共有两个因素,一是分组因素ABCDE,另外一个是时间点,
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
pearzhouq 奇数组,不用看,肯定单因素才行就这个
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
水墨云彩 就这个抱歉。。说错了。。。另外真心没有看懂实验设计,想问问为什么不同时间点的样本点会有几百个。。。。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
pearzhouq 。。没有看明白您说什么。。。。我想说一共有两个因素,一是分组因素ABCDE,另外一个是时间点,以及如果是只做一个时间点,才算单因素?但我这个就是比较每单个时间点各组差异性,这样也不可以吗?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
pearzhouq 抱歉。。说错了。。。另外真心没有看懂实验设计,想问问为什么不同时间点的样本点会有几百个。。。。没有几百个。比如拿第10天来说,A组7个样本,B组6个样本,C组6个样本,需要做的是比较这个第十天时,ABC三组数据的差异性。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园当前位置: >>
《医药数理统计方法》学习指导(1-6)n
第一章 数据的描述和整理一、学习目的和要求1. 掌握数据的类型及特性; 2. 掌握定性和定量数据的整理步骤、显示方法; 3. 掌握描述数据分布的集中趋势、离散程度和分布形状的常用统计量; 4. 能理解并熟练掌握样本均值、样本方差的计算; 5. 了解统计图形和统计表的表示及意义; 6. 了解用 Excel 软件进行统计作图、频数分布表与直方图生成、统计量的计
算。二、 内容提要(一) 数据的分类定性数据(品质数据) 数据类型 定类数据 定序数据 定量数据 数值数据 (计量数据) 数值 (+-×÷) 数值变量 (离散变量、连续变量) 计算各种统计量,进行参数估计 和检验、回归分析、方差分析等 参数方法 直方图,折线图,散点图, 茎叶图,箱形图(计数数据) (等级数据) 表现形式 类别 (无序) 定类变量 类别 (有序) 定序变量对应变量主要统计方法计算各组频数, 进行列联表分 析、?2 检验等非参数方法常用统计图形条形图,圆形图(饼图)(二) 常用统计量1、描述集中趋势的统计量1 名 称 均值公 式(原始数据)公 式(分组数据)意 义 反映数据取值的平均水x?x1 ? xi n i ?1nx?1 ? mi fi n i ?1k平, 是描述数据分布集中 趋势的最主要测度值,中位数 Me 众数 Mo当n为奇数 ? x n ?1 , ? ( 2) ? M e ? ?1 ? ( x n ? x n ), 当n为偶数 ( ?1) ?2 (2) 2 ?中位数所在组: 累积频数超过 n/2 的那个最低组 众数所在组: 频数最大的组是典型的位置平均数, 不 受极端值的影响数据中出现次数最多的观察值测度定性数据集中趋势, 对于定量数据意义不大2、描述离散程度的统计量名 称 极差 R 总体方差 ?2公 式(原始数据) R = 最大值-最小值公 式(分组数据) R≈最高组上限值- 最低组下限值?2 ?1 N意 义 反映离散程度的最简单测度值, 不能反映中间数据的离散性?2 ?1 N ? ( xi ? x ) 2 N i ?1? (m ? x )i ?1 ik2fi反映每个总体数据偏离其总体均 值的平均程度,是离散程度的最 重要测度值, 其中标准差具有与总体标准差 ? 样本方差 S2 样本标准差 S 变异系数 CV 样本标准误? ? ?2? 1 N? ? ?22 i?(x ? x )i ?1N?1 N? (m ? x )i ?1 iN2fi观察值数据相同的量纲S2 ?1 n ? ( xi ? x ) 2 n ? 1 i ?1S2 ?1 k 反映每个样本数据偏离其样本均 ? (mi ? x ) 2 f i n ? 1 i ?1 值的平均程度,是离散程度的最S ? S2 ? 1 n ? ( xi ? x ) 2 n ? 1 i ?1S ? S2 ? 1 k ? (mi ? x ) 2 f i n ? 1 i ?1重要测度值, 其中标准差具有与 观察值数据相同的量纲CV=S ? 100% |x|反映数据偏离其均值的相对偏 差,是无量纲的相对变异性测度 反映样本均值偏离总体均值的平SxSx ?S n均程度,在用样本均值估计总体 均值时测度偏差2 3、描述分布形状的统计量名 称 公 式(原始数据) 公 式(分组数据) 意 义 反映数据分布的非对称性 偏度 SkSk ?n? ( xi ? x ) 3 (n ? 1)(n ? 2) S 3Sk ?? (mi ?1ki? x) 3 f iSk=0 时为对称; Sk &0 时为正偏或右偏; Sk &0 时为负偏或左偏nS 3Ku ?峰度 KuKu ?n(n ? 1)? ( xi ? x ) 4 ? 3[? ( xi ? x ) 2 ] 2 (n ? 1) (n ? 1)(n ? 2)(n ? 3) S 4反映数据分布的平峰或尖 峰程度 Ku=0 时为标准正态; Ku>0 时为尖峰分布;(原始数据)? (mi ?1ki? x) 4 f inS 4? 3 (分组数据)Ku<0 时为扁平分布* 在分组数据公式中,mi, fi 分别为各组的组中值和观察值出现的频数。三、综合例题解析例 1.证明:各数据观察值与其均值之差的平方和(称为离差平方和)最小,即 对任意常数 C,有? ( xi ? x )2 ? ? ( xi ? C )2i ?1 i ?1nn证一:设2 f ( C )? ? (ix? C ) i ?1n由函数极值的求法,对上式求导数,得f ?(C ) ? ?2? ( xi ? C ) ? ? 2? xi ? 2nC, f ??(C ) ? 2ni ?1 i ?1nn令 f ?(C)=0,得唯一驻点1 n C ? ? xi =x n i ?1由于 f ??( x ) ? 2n ? 0 ,故当 C ? x 时 f (C)y 有最小值,其最小值为3 f ( x ) ? ? ( xi ? x ) 2 。i ?1n证二:因为对任意常数 C 有? ( xi ? x )2 ? ? ( xi ? C )2 ? ? xi2 ? nx 2 ? (? xi2 ? 2C ? xi ? nC 2 )i ?1 i ?1 i ?1 i ?1 i ?1nnnnn? ?nx 2 ? 2C ? xi ? nC 2 ? ?n( x 2 ? 2Cx ? C 2 )i ?1n? ?n( x ? C ) ? 02故有?( x ? x ) ? ?( x ? C)2 i ?1 i i ?1 inn2。四、习题一解答1.在某药合成过程中,测得的转化率(%)如下: 94.3 92.8 92.7 92.6 93.3 92.9 91.8 92.4 93.4 92.6 92.0 91.8 90.892.2 93.0 92.9 92.2 92.4 92.2 92.8 92.4 93.9 93.5 93.6 93.0 93.0 93.4 94.2 92.8 93.2 92.292.5 93.6 93.9 92.4 91.8 93.8 93.6 92.1 92.0(1)取组距为 0.5,最低组下限为 90.5,试作出频数分布表; (2)作频数直方图和频率折线图; (3)根据频数分布表的分组数据,计算样本均值和样本标准差。 解: (1)所求频数分布表:转化率的频数分布表 转化率分组 90.5~ 91.0~ 91.5~ 92.0~ 92.5~ 频数 1 0 3 11 9 频率 0.025 0.00 0.075 0.275 0.225 累积频率 0.025 0.025 0.10 0.375 0.604 93.0~ 93.5~ 94.0~94.57 7 20.175 0.175 0.050.775 0.95 1.00(2)频数直方图:直方图 12 10 8 6 4 2 0 1 0 转化率 3 2频数11 9 7 790.5- 91.0- 91.5- 92.0- 92.5- 93.0- 93.5- 94.0- 94.5-频率折线图:频率0.3 0.25 0.2 0.15 0.1 0.05 0 90 90.5 91 91.5 92 92.5 93 93.5 94 94.5 95转化率频率折线图转化率(3)由频数分布表可得转化率分组 90.5~ 91.0~ 91.5~ 92.0~ 组中值 mi 90.75 91.25 91.75 92.25 频数 1 0 3 115 92.5~ 93.0~ 93.5~ 94.0~94.592.75 93.25 93.75 94.259 7 7 2则x?S2 ?1 8 90.75?1 ? 91.25? 0 ? ? ? 94.25? 2 3713 ? ? 92.8 2 5 ? mi f i ? n i ?1 40 401 8 ? (mi ? x ) 2 f i n ? 1 i ?11 [(90.75-92.825)2× 1+(91.25-92.825)2× 0+…+(94.25-92.825)2× 2] 39==0.584 或者S2 ?8 1 2 (? mi f i ? nx 2 ) n ? 1 i ?1?1 (90.75 2 ? 1 ? 91.25 2 ? 0 ? ? ? 94.25 2 ? 2 ? 40 ? 92.76 2 ) ? 0.584 39S ? S 2 = 0.584 ≈0.76422.测得 10 名接触某种病毒的工人的白细胞(109/L)如下: 7.1,6.5,7.4,6.35,6.8,7.25,6.6,7.8,6.0,5.95 (1)计算其样本均值、方差、标准差、标准误和变异系数。 (2)求出该组数据对应的标准化值; (3)计算其偏度。 解: (1) ? xi ? 7.1 ? 6.5 ? ? ? 5.95 ? 67.75 ,n=10i ?1 10?xi ?1102 i? 7.12 ? 6.52 ? ? ? 5.952 ? 462.351 n 67.75 ? 6.775 样本均值 x ? ? xi ? n i ?1 106 2 方差 S ?n 1 1 2 (? xi ? nx 2 ) ? (462 .35 ? 10 ? 6.775 2 ) ? 0.371 9 n ? 1 i ?1标准差 S ?S 2 = 0.371 ≈0.609S n 0.609 40标准误 S x ??? 0.193变异系数 CV=0.609 S ? 100 % =8.99%; ?100% = 6.775 |x|(2)对应的标准化值公式为ui ?对应的标准化值为xi ? x xi ? 6.775 ? S 0.6090.534,-0.452,1.026,-0.698,0.041,0.78,-0.287,1.683,-1.273,-1.355; (3) S k ?n? ( xi ? x ) 3 (n ? 1)(n ? 2) S 3=0.204。3. 已知某年某城市居民家庭月人均支出分组数据如下表所示按月人均支出分组(元) 200 以下 200~ 500~ 800~ 1000 以上 合计 家庭户数占总户数的比例(%) 1.5 18.2 46.8 25.3 8.2 100试计算(1)该市平均每户月人均支出的均值和标准差; (2)并指出其月人均支出的中位数与众数所在组。 解: (1)由原分组数据表可得支出分组(元) 组中值 比例(%)7 200 以下 200~ 500~ 800~ 1000 以上100 350 650 900 11001.5 18.2 46.8 25.3 8.2则x?21 5 1 ( ? 3 ? mi f i ? 100 100?1.5 ? 350?18.2 ? ? ? 1 1 0?08.2) 6 8 .7 n i ?15 1 2 S ? (? mi f i ? nx 2 ) n ? 1 i ?11 ( 2 ?1.5 ?
? ? ? 11002 ? 8.2 ? 5 ? 687.32) 100 99 ? 5246839 . ?S ? S 2 ? 5246839 ? 229.06; .(2)由原分组数据表可得支出分组(元) 200 以下 200~ 500~ 800~ 1000 以上 比例(%) 1.5 18.2 46.8 25.3 8.2 累积比例(%) 1.5 19.7 66.5 91.8 100中位数所在组,即累积比例超过 50 的那个最低组,即为 500~组。 众数所在组是频数即比例最大的组,也是 500~组。 4.设 x1, x2, …,xn 和 y1, y2, …,yn 为两组样本观察值,它们有下列关系:yi ? xi ? a bi=1,2,…,n2 2 其中 a、b 为常数且 b≠0,求样本均值 x 与 y 及样本方差 S x 和 S y 之间的关系。8 解: y ?2 Sy ?1 n 1 n x ?a 1 1 n na x ?a yi ? ? ( i ) ? ( ? xi ? )? ? n i ?1 n i ?1 b b n i ?1 n b1 n 1 n x?a x ?a 2 1 n x?x 2 ( yi ? y ) 2 ? ( ? ) ? ? ? ?( ) n ? 1 i ?1 n ? 1 i ?1 b b n ? 1 i ?1 b?1 1 n 1 ? ( xi ? x ) 2 ? b 2 S x2 。 2 b n ? 1 i ?1五、思考与练习(一)填充题1. 统计数据可以分为 据等三类,其中 数据、 数据、 数据、 数据属于定性数据。 、 ; 数据、2. 常用于表示定性数据整理结果的统计图有 而 、 、 、等是专用于表示定量数据的特征和规律的统计图。 3. 4. 用于数据整理和统计分析的常用统计软件有 描述数据集中趋势的常用测度值主要有 等, 其中最重要的是 有 是 、 、 。 、 、 、 等。 和;描述数据离散程度的常用测度值主要 、 等,其中最重要的(二)选择题1. 各样本观察值均加同一常数 c 后( A.样本均值不变,样本标准差改变 C.两者均不变 2.关于样本标准差,以下哪项是错误的( A.反映样本观察值的离散程度 C.反映了均值代表性的好坏 ) B.样本均值改变,样本标准差不变 D. 两者均改变 ) 。B.度量了数据偏离样本均值的大小 D.不会小于样本均值 )3.比较腰围和体重两组数据变异度大小宜采用(9 A.变异系数(CV) C.极差(R)B.方差(S2) D.标准差(S)(三)计算题1. 在某次实验中,用洋地黄溶液分别注入 10 只家鸽内,直至动物死亡。将致死 量折算至原来洋地黄叶粉的重量。其数据记录为(单位:mg/kg) 97.3,91.3,102,129,92.8,98.4,96.3,99.0,89.2,90.1 试计算该组数据的样本均值、方差、标准差、标准误和变异系数。六、思考与练习参考答案(一)填充题1. 定类,定序,数值,定类,定序 2. 条形图、圆形图;直方图、频数折线图、茎叶图、箱形图 3. SAS、SPSS、Excel 4. 均值、众数、中位数,均值,极差、方差、标准差、变异系数,方差、标准差(二)选择题1. B; 2.D;3.A(三)计算题1.均值 98.54、方差 132.27、标准差 11.501、标准误 3.637、变异系数 11.67%。10 第二章 随机事件与概率一、学习目的和要求1. 掌握事件等的基本概念及运算关系; 2. 熟练掌握古典概率及计算; 3. 理解统计概率、主观概率和概率的公理化定义; 4. 熟练掌握概率的加法公式、乘法公式及计算; 5. 理解并掌握条件概率与事件独立性的概念并进行计算; 6. 掌握并应用全概率公式和贝叶斯公式进行计算。二、内容提要(一)基本概念概 念 符 号 概率论的定义 具有以下特征的观测或试验: 随机试验 (试验) E 1.试验在相同的条件下可重复地进行 2.试验的所有结果事先已知,且不止一个 3.每次试验恰好出现其中之一,但试验前 无法预知到底出现哪一个结果。 样本空间 基本事件 (样本点) 随机事件 (事件) 必然事件 不可能事件 A 集合论的含义?试验所有可能结果组成的集合,即所有基 本事件的全体 试验的每个不可再分的可能结果,即样本 空间的元素 试验中可能发生也可能不发生的结果,是 由基本事件组成的样本空间的子集 在试验中一定发生的事件 在试验中一定不发生的事件,不含任何基 本事件全集?元素子集 全集 空集??11 (二)事件间的关系关 系 包含 相等 和(并) 积(交) 差 互不相容 对立 符 号 A?B A=B A+B(A∪B) AB(A∩B) A-B AB=?A概率论的定义 事件 A 的发生必然导致事件 B 的发生 A ? B 而且 B ? A 事件 A 与 B 中至少有一个事件发生 事件 A 与 B 同时发生 事件 A 发生同时 B 不发生 事件 A 与 B 不可能同时发生 事件 A 不发生集合论的含义 A 是 B 的子集 A 与 B 相等 A 与 B 的并 A 与 B 的交 A 与 B 的差 A 与 B 不相交 A 的补集(余集)(三)事件的运算规律运算律 交换律 结合律 分配律 差积转换律 对立律 德?摩根对偶律 公 式A+B=B+A,AB=BA (A+B)+C=A+(B+C),(AB)C=A(BC) (A+B)C=AC+BC,A+(BC)=(A+B)(A+C)A ? B ? AB ? A ? ABA A =?,A+ A =ΩA ? B ? A B , AB ? A ? B(四)概率的定义类 型 古典概率 统计概率 定 义 公 式 P(A)= m ? A所含的基本事件数 n 基本事件总数 P(A) = p (≈ f n ? A? ? n A )n对样本空间中任意事件 A 对应的一个实数 P(A),满足 公理化定义 (基本性质) 公理 1(非负性) :0≤P(A)≤1 公理 2(规范性) :P(?)=1, P(?)=0 公理 3(可加性) :若 A1,A2, …,An,…, 两两互不相容,12 P(A1+A2+…+An+…)= P(A1)+ P(A2)+ … + P(An)+ … 则称 P(A)为随机事件 A 的概率。(五)概率的计算公式名 称 加法公式 对立事件公式 事件之差公式 计算公式 P(A+B)=P(A)+P(B)-P(AB) 若 A、B 互不相容(AB=?) :P(A+B)=P(A)+P(B) P(A)=1-P( A );P( A ) =1-P(A) P(A-B)= P(A)-P(AB) 若 B?A, P(A-B)= P(A)-P(B)条件概率公式P( B | A) ?P( AB) , (P(A)&0) P( A)若 P(A)&0, P(AB)=P(A)P(B|A) 乘法公式 若 P(B)&0, P(AB)=P(B)P(A|B) 当 P(A1A2…An-1)&0 时,有 P(A1A2…An)=P(A1)P(A2|A1)P(A3|A1A2) …P(An|A1A2…An-1) 独立事件公式 A、B 相互独立:P(AB)=P(A)P(B) A1, A2, …, An 相互独立:P(A1A2…An)= P(A1)P(A2)…P(An) 若 A1, A2, ?, An 为完备事件组*,对事件 B 全概率公式P?B ? ? ? P( Ai ) P( B | Ai )i ?1n若 A1, A2, ?, An 为完备事件组*,P(B)&0 逆概率公式 (贝叶斯公式)P( A j | B) ? P( A j ) P( B | A j )? P( A ) P( B | A )i ?1 i in*完备事件组 {A1, A2, ?, An}1. A1, A2, ?, An 互不相容且 P(Ai)&0(i=1, 2, ?, n); 2. A1+A2+?+An= ?13 三、综合例题解析例 1 从某鱼池中取 100 条鱼,做上记号后再放入该鱼池中。现从该池中任意捉 来 50 条鱼,发现其中有两条有记号,问池内大约有多少条鱼? 解:设池内大约有 n 条鱼,令 A={从池中捉到有记号鱼} 则从池中捉到有记号鱼的概率 P(A)=100 n2 ,即 50由统计概率的定义知,它近似于捉到有记号鱼的频率 fn (A) =100 2 ? n 50解之得 n=2500,故池内大约有 2500 条鱼。 例2 口袋里有两个伍分、三个贰分和五个壹分的硬币,从中任取五个,求总值超过一角的概率。 解一:令 A={总值超过一角},现将从 10 个硬币中任取 5 个的每种取法作为每个 基本事件,显然本例属于古典概型问题,可利用组合数来解决。所取 5 个硬币总值超 过一角的情形,其币值由大到小可根据其中有 2 个伍分、有 1 个伍分和没有伍分来考 虑。则2 3 1 1 3 C2 C8 ? C2 C32 C52 ? C2 C3 C52 126 =0.5。 P( A) ? ? 5 252 C10解二:本例也可以先计算其对立事件A ={总值不超过一角}考察 5 个硬币总值不超过一角的情形,其币值由小到大先根据壹分硬币、贰分硬 币的不同个数来计算其有利情形的组合数。则P( A) ? 1 ? P( A ) ? 1 ?5 1 3 1 1 3 C5 ? C54 C5 ? C5 (C32 ? C3 C2 ) ? C52 C3 126 =0.5 ? 1? 5 252 C1014 或5 1 1 3 C8 ? C(C54 ? C3 C5 ) 126 2 =0.5 P( A) ? 1 ? P( A ) ? 1 ? ? 1? 5 252 C10例 3 将 n 个人等可能地分配到 N(n≤N)间房中去,试求下列事件的概率: (1)A={某指定的 n 间房中各有一人}; (2)B={恰有 n 间房,其中各有一人}; (3)C={某指定的房中恰有 m(m≤n)个人}。 解:把 n 个人等可能地分配到 N 间房中去,由于并没有限定每一间房中的人数, 故是一可重复的排列问题,这样的分法共有 Nn 种。 (1)对事件 A,对指定的 n 间房,第一个人可分配到该 n 间房的任一间,有 n 种 分法;第二个人可分配到余下的 n-1 间房中的任一间,有 n-1 种分法,以此类推, 得到 A 共含有 n!个基本事件,故P ( A) ?n! Nn(2)对事件 B,因为 n 间房没有指定,所以可先在 N 间房中任意选出 n 间房(共n n 有 C N 种选法) ,然后对于选出的某 n 间房,按照上面的分析,可知 B 共含有 C N ? n!个基本事件,从而P( B) ?n C N ? n!Nnm (3)对于事件 C,由于 m 个人可从 n 个人中任意选出,故有 C n 种选法,而其余n-m 个人可任意地分配到其余的 N-1 间房中,共有(N-1)n-m 种分配法,故 C 中共含m 有 Cn ? (N-1)n-m 个基本事件,因此P(C ) ?m Cn ( N ? 1) n?mNnm ? Cn (1 m 1 ) (1 ? ) n?m N N注意:可归入上述“分房问题”来处理的古典概型的实际问题非常多,例如: (1)生日问题:n 个人的生日的可能情形,这时 N=365 天(n≤365) ; (2)乘客下车问题:一客车上有 n 名乘客,它在 N 个站上都停,乘客下车的各种 可能情形;15 (3)印刷错误问题:n 个印刷错误在一本有 N 页的书中的一切可能的分布(n 不 超过每一页的字符数) ; (4)放球问题:将 n 个球放入 N 个盒子的可能情形。 值得注意的是,在处理这类问题时,要分清什么是“人” ,什么是“房” ,一般不 能颠倒。 例 4(1994 年考研题)设 A,B 为两事件,且 P(A)=p,P(AB)= P( AB) ,求 P(B)。 解:由于P( AB) ? P( A ? B) ? 1 ? P( A ? B) ? 1 ? [P( A) ? P(B) ? P( AB)],现因为 P(AB)= P( AB) ,则P( AB) ? 1 ? P( A) ? P( B) ? P( AB)又 P(A)=p,故P( B) ? 1 ? P( A) ? 1 ? p 。注意:事件运算的德?摩根律及对立事件公式的恰当应用。 例 5 设某地区位于河流甲、乙的交汇处,而任一何流泛滥时,该地区即被淹没。 已知某时期河流甲、乙泛滥的概率分别为 0.2 和 0.3,又当河流甲泛滥时, “引起”河 流乙泛滥的概率为 0.4,求 (1)当河流乙泛滥时, “引起”河流甲泛滥的概率; (2)该时期内该地区被淹没的概率。 解:令 A={河流甲泛滥},B={河流乙泛滥} 由题意知 P(A)=0.2,P(B)=0.3,P(B|A)=0.4 再由乘法公式 P(AB)=P(A)P(B|A)=0.2×0.4=0.08, 则(1)所求概率为P( A | B) ? P( AB) 0.08 ? ? 0.267 P( B) 0.316 (2)所求概率为 P(A+B)=P(A)+P(B)-P(AB) =0.2+0.3-0.08=0.42。 例 6 设两个相互独立的事件 A 和 B 都不发生的概率为 1/9,A 发生 B 不发生的 概率与 B 发生 A 不发生的概率相等,求 P(A)。 解:由题设可知因为 A 和 B 相互独立,则 P(AB) = P(A)P(B), 再由题设可知P( A B ) ? P( A) P( B) ?P( AB ) ? P( A B)1 , 9又因为P( AB ) ? P( A B) ,即 由事件之差公式得 P(A-B) = P(B-A),P( A) ? P( AB) ? P( B) ? P( AB)则有 P(A) = P(B),从而有P( A) ? P(B)故有1 ( P( A)) 2 ? , 9即P( A) ?1 3P( A) ? 1 ? P( A) ?2 。 3例 7(1988 年考研题) 玻璃杯成箱出售,每箱 20 只,假设各箱含 0,1,2 只残 次品的概率相应为 0,0.8,0.1 和 0.1,一顾客欲购一箱玻璃杯,在购买时,售货员随 意取一箱,而顾客开箱随机地查看 4 只,若无残次品,则买下该箱玻璃杯,否则退回。 试求 (1)顾客买下该箱的概率α ;17 (2)在顾客买下的一箱中,确实没有残次品的概率β 。 解:由于玻璃杯箱总共有三类,分别含 0,1,2 只残次品。而售货员取的那一箱 可以是这三类中的任一箱,顾客是在售货员取的一箱中检查的,顾客是否买下这一箱 是与售货员取的是哪一类的箱子有关系的,这类问题的概率计算一般可用全概率公式 解决,第二问是贝叶斯公式也即条件概率问题。 首先令 A={顾客买下所查看一箱}; B={售货员取的箱中恰好有 i 件残次品},i=0,1,2。 显然,B0,B1,B2 构成一组完备事件组。且P ( B0 ) ? 0.8, P( B1 ) ? 0.1, P( B2 ) ? 0.1, P ( A B0 ) ? 1, P( A B1 ) ?4 C19 4 C 20?C 4 12 4 , P( A B2 ) ? 18 ? . 4 5 C 20 19(1)由全概率公式,有? ? P( A) ? ? P( Bi ) P( A Bi ) ? 0.8 ? 1 ? 0.1? ? 0.1?i ?024 512 ? 0.94 19(2)由逆概率公式,得? ? P( B0 A) ?P( B0 ) P( A B0 ) P( A)?0.8 ? 1 ? 0.85 0.94注意:本题是典型的全概率公式与贝叶斯公式的应用。 例 8. (小概率事件原理)设随机试验中某事件 A 发生的概率为 ε,试证明,不论 ε&0 如何小,只要不断独立重复地做此试验,事件 A 迟早会发生的概率为 1。 证:令 Ai={第 i 次试验中事件 A 发生}, i=1,2,3,?由题意知,事件 A1, A2, …, An, …相互独立且 P(Ai)=?,i=1,2,3,?, 则在 n 次试验中事件 A 发生的概率 P( A1 ? A2 ? ? ? An )=1-P( A1 A2 ? An ) =1- P( A1 )P( A2 )?P( An ) ? 1 ? (1 ? ? ) n 当 n→+∞, 即为事件 A 迟早会发生的概率18 P( A1 ? A2 ? ? ? An ? ? )= lim 1 ? (1 ? ? ) n =1。n ? ??四、习题二解答1.考察随机试验: “掷一枚骰子,观察其出现的点数” 。如果设 i={掷一枚骰子所出现的点数为 i }, i=1,2,?,6试用 i 来表示该试验的基本事件、 样本空间Ω 和事件 A ={出现奇数点}和事件 B={点数 至少是 4}。 解:基本事件:{0},{1},{2},{3},{4},{5},{6}。 样本空间 Ω={ 0,1,2,3,4,5,6}。 事件 A={1,3,5};B={4,5,6}。 2.用事件 A、B、C 表示下列各事件: (1)A 出现,但 B、C 不出现; (2)A、B 出现,但 C 不出现; (3)三个都出现; (4)三个中至少有一个出现; (5)三个中至少有两个出现; (6)三个都不出现; (7)只有一个出现; (8)不多于一个出现; (9)不多于两个出现。 解: (1) ABC (2) ABC (3) ABC (4) AB C ? A BC ? A B C ? ABC ? AB C ? A BC ? ABC 或 A+B+C 或 ? ? A B C (5) ABC ? AB C ? A BC ? ABC (6) ABC 或?-(A+B+C)或 A ? B ? C (7) ABC + ABC + ABC19 (8) ABC + ABC + ABC + ABC (9) A B C ? AB C ? A BC ? A B C ? ABC ? AB C ? A BC 或?-ABC 或 ABC 3.从 52 张扑克牌中,任取 4 张,求这四张花色不同的概率。 解:现将从 52 张扑克牌中任取 4 张的每种取法作为每个基本事件,其结果与顺 序无关,故可用组合数来解决该古典概型问题。P?1 1 1 1 m C13C13C13C13 134 ? ? ? 0.1055。 4 n 52 ? 51? 50 ? 49 / 4! C524.在一本标准英语词典中共有 55 个由两个不同字母组成的单词,现从 26 个英 文字母中任取两个字母排成一个字母对,求它恰是上述字典中单词的概率。 解: 现将从 26 个英文字母中任取两个字母件的每种取法作为每个基本事件,其结 果与顺序有关,故可用排列数来解决该古典概型问题。P? m 55 55 ? 2 ? ? 0.0846。 n A26 26 ? 255.某产品共 20 件,其中有 4 件次品。从中任取 3 件,求下列事件的概率。 (1) 3 件中恰有 2 件次品; (2)3 件中至少有 1 件次品; (3)3 件全是次品; (4)3 件全是 正品。 解: 现将从 20 件产品中任取 3 件的每种取法作为每个基本事件,其结果与顺序无 关,故可用组合数来解决该古典概型问题。2 1 m C 4 C16 (1) P( A) ? ? ? 0.0842; 3 n C 20 3 C16 m ? 1 ? 3 ? 1 ? 0.4912 ? 0.5088 n C20(2) P( B) ? 1 ? P( B ) ? 1 ? 或 P( B) ?1 2 2 1 3 0 m C4 C16 ? C4 C16 ? C4 C16 ? ? 0.5088; 3 n C20 3 m C4 ? 3 ? 0.0035; n C 20(3) P(C ) ?20 3 m C16 (4) P( D) ? ? 3 ? 0.4912。 n C 206.房间里有 10 个人,分别佩戴着 1~10 号的纪念章,现等可能地任选三人,记 录其纪念章号码,试求: (1)最小号码为 5 的概率; (2)最大号码为 5 的概率。 解:设 A={任选三人中最小号码为 5},B={任选三人中最大号码为 5} (1)对事件 A,所选的三人只能从 5~10 中选取,而且 5 号必定被选中。1 2 m C1 C5 1 P( A) ? ? ? ? 0.0833; 3 n 12 C10(2)对事件 B,所选的三人只能从 1~5 中选取,而且 5 号必定被选中。P( B) ?1 2 m C1 C 4 1 ? ? ? 0.05 。 3 n 20 C107.某大学学生中近视眼学生占 22%,色盲学生占 2%,其中既是近视眼又是色盲 的学生占 1%。现从该校学生中随机抽查一人,试求: (1)被抽查的学生是近视眼或色 盲的概率; (2)被抽查的学生既非近视眼又非色盲的概率。 解:设 A={被抽查者是近视眼},B={被抽查者是色盲};由题意知,P(A)=0.22,P(B)= 0.02,P(AB)= 0.01,则 (1)利用加法公式,所求概率为 P(A+B)=P(A)+P(B)-P(AB)=0.22+0.02-0.01=0.23; (2)所求概率为 P( A B )=P( A ? B )=1-P(A+B)=1-0.23 =0.77。 注意:上述计算利用了德?摩根对偶律、对立事件公式和(1)的结果。 8.设 P(A)=0.5,P(B)=0.3 且 P(AB)=0.l。求: (1)P(A+B); (2)P( A +B)。 解: (1)P(A+B)=P(A)+P(B)-P(AB)=0.5+0.3-0.1=0.7; (2)P( A +B)= P( A )+P(B)-P( A B)=[1-P(A)]+P(B)-P(B-A) =1-P(A) +P(B)-[P(B) -P(AB)]= 1-P(A) + P(AB) =1-0.5+0.1=0.6。 注意:上述计算利用了加法公式、差积转换律、对立事件公式和事件之差公式。21 9.假设接受一批药品时,检验其中一半,若不合格品不超过 2%,则接收,否则 拒收。假设该批药品共 100 件,其中有 5 件不合格,试求该批药品被接收的概率。 解:设 A={50 件抽检药品中不合格品不超过 1 件},据题意,仅当事件 A 发生时,该批药品才被接收,故所求概率为P( A) ?50 1 49 m C95 ? C5 C95 ? ? 0.1811。 50 n C10010.设 A,B 为任意两个事件,且 P(A)>0,P(B)>0。证明: (1)若 A 与 B 互不相容,则 A 和 B 不独立; (2)若 P(B|A)=P(B| A ),则 A 和 B 相互独立。 证明: (1)用反证法。假定 A 和 B 独立,因为已知 A 与 B 互不相容,则 AB=?,P(AB)= P(?)=0 故 P(A) P(B)= P(AB)=0但由已知条件 P(A)>0,P(B)>0 得 P(A) P(B)&0,由此导出矛盾,所以若 A 与 B 互不 相容,则 A 和 B 不独立。 (2)由已知 P(B|A)=P(B| A ),又P( B | A) ?P( AB) P( A B) , P( B | A ) ? P( A) P( A )则 即P( AB) P( A B) P( B ? A) P( B) ? P( AB) ? ? ? P( A) P( A ) 1 ? P( A) 1 ? P( A)P(AB)[1-P(A) ]= P(A)[P(B)-P(AB)] P(AB)-P(AB)P(A) = P(A)P(B)-P(A)P(AB)故 这即 A 和 B 相互独立。 (2)又证:由已知P(AB) = P(A)P(B)P(B|A)=P(B| A ) ? 即P( A B) P( B ? A) P( B) ? P( AB) ? ? P( A ) 1 ? P( A) 1 ? P( A)P(B|A)[1-P(A) ]= P(B)-P(AB)22 P(B|A)-P(B|A)P(A) = P(B)-P(AB) P(B|A)-P(AB) = P(B)-P(AB) P(B|A) = P(B) 这即 A 和 B 相互独立。 11.已知 P(A)=0.1,P(B)=0.3,P(A | B)=0.2,求: (1)P(AB); (2)P(A+B); (3) P(B|A); (4)P( AB ); (5)P( A | B )。 解: (1)P(AB)= P(B) P(A | B)=0.3× 0.2=0.06; (2)P(A+B)=P(A)+P(B)-P(AB)=0.1+0.3-0.06=0.34; (3) P( B | A) ?P( AB) 0.06 ? ? 0.6 ; P( A) 0.1(4)P( AB )=P(A-B)=P(A)-P(AB)=0.1-0.06=0.04; (5) P( A | B ) ?P( A B ) P( A ? B) 1 ? P( A ? B) 1 ? 0.34 ? ? ? ? 0.9429。 P( B ) 1 ? P( B ) 1 ? P ( B) 1 ? 0.312.某种动物活到 12 岁的概率为 0.8,活到 20 岁的概率为 0.4,问现年 12 岁的这 种动物活到 20 岁的概率为多少? 解:设 A={该动物活到 12 岁},B={该动物活到 20 岁};由题意知 P(A)=0.8,P(B)=0.4 显然该动物“活到 20 岁”一定要先“活到 12 岁” ,即有 B?A,且 AB=B, 则所求概率是条件概率P( B | A) ?P( AB) P( B) 0.4 ? ? ? 0.5 。 P( A) P( A) 0.813.甲、乙、丙三人各自独立地去破译一密码,他们能译出该密码的概率分别是 1/5,2/3,1/4,求该密码被破译的概率。 解:设 A={甲译出该密码},B={乙译出该密码},C={丙译出该密码}.由题意知,A,B,C 相互独立,而且 P(A)=1/5,P(B)=2/3,P(C)=1/423 则密码被破译的概率为 P(A+B+C)=1- P( A B C ) =1- P( A) P( B ) P(C ) = 1 ? 或4 1 3 ? ? =0.8 5 3 4P(A+B+C)=P(A)+P(B)+ P(C)-P(AB)-P(AC)-P(BC)+P(ABC) =P(A)+P(B)+ P(C)-P(A) P(B)-P(A) P(C)-P(B) P(C) + P(A) P(B) P(C)1 2 1 1 2 1 1 2 1 1 2 1 4 = ? ? ? ? ? ? ? ? ? ? ? ? ? 0.8 。 5 3 4 5 3 5 4 3 4 5 3 4 514.有甲乙两批种籽,发芽率分别为 0.8 和 0.7,在两批种籽中各任意抽取一粒, 求下列事件的概率: (1)两粒种籽都能发芽; (2)至少有一粒种籽能发芽; (3)恰好 有一粒种籽能发芽。 解:设 A={甲种籽能发芽}, B={乙种籽能发芽}则由题意知,A 与 B 相互独立,且有 P(A)=0.8,P(B)=0.7, 则所求概率为 (1)P(AB)=P(A)P(B)=0.8×0.7=0.56; (2)P(A+B) =1-P( A ? B )=1-P( A B )=1- P( A ) P( B ) =1-0.2×0.3=0.96; (3)P( AB ? A B )= P( A)P( B ) ? P( A) P( B) =0.8×0.3+0.2×0.7=0.38。 15.设甲、乙两城的通讯线路间有 n 个相互独立的中继站,每个中继站中断的概 率均为 p,试求: (1)甲、乙两城间通讯中断的概率; (2)若已知 p=0.005,问在甲、 乙两城间至多只能设多少个中继站,才能保证两地间通讯不中断的概率不小于 0.95? 解:设 Ak={第 k 个中继站通讯中断}, k=1,2,?,n,则 A1, A2, ?, An 相互独立,而 且有 P(Ak)=p, k=1,2,?,n。 (1)所求概率为 P(A1+ A2+?+ An)=1-P( A1 ? A2 ? ?? An )=1-P( A1 A2 ? An ) =1- P( A1 ) P( A2 )?P( An ) =1- ( P( A1 ))n ? 1-(1-p)n; (2)设甲、乙两城间至多只能设 n 个中继站,由题意,应满足 P( A1 A2 ? An )=(1-p)n≥0.95,24 即(1-0.005)n≥0.95 0.995n≥0.95 n≤log0.9950.95=ln0.95/ln0.995=10.233故 n=10,即甲、乙两城间至多只能设 10 个中继站。 16.在一定条件下,每发射一发炮弹击中飞机的概率是 0.6,现有若干门这样的 炮独立地同时发射一发炮弹,问欲以 99%的把握击中飞机,至少需要配置多少门这样 的炮? 解:设至少需要配置 n 门炮。再设 Ak={第 k 门炮击中飞机}, k=1,2,?,n, 则 A1, A2, ?, An 相互独立,而且有 P(Ak)=0.6, k=1,2,?,n。 由题意,应有 P(A1+ A2+?+ An)= 1-P( A1 A2 ? An )=1- P( A1 ) P( A2 )?P( An ) =1- ( P( A1 ))n ? 1-0.4 n≥0.99 即 则有 n≥log0.40.01=ln0.01/ln0.4=5.026 故 n=6,因此至少需要配置 6 门炮。 17.甲袋中有 3 只白球,7 只红球,15 只黑球;乙袋中 10 只白球,6 只红球,9 只黑球。现从两袋中各取一球,求两球颜色相同的概率。 解:设以 A1、A2、A3 分别表示从甲袋中任取一球为白球、红球、黑球; 以 B1、B2、B3 分别表示从乙袋中任取一球为白球、红球、黑球。 则所求两球颜色相同的概率为 P(A1B1+ A2B2+ A3 B3)= P(A1)P(B1)+ P( A2)P(B2)+ P(A3)P( B3)? 3 10 7 6 15 9 207 ? ? ? ? ? ? ? 0.3312 。 25 25 25 25 25 25 6250.4 n≤0.01,18.在某地供应的某药品中,甲、乙两厂的药品各占 65%、35%,且甲、乙两厂25 的该药品合格率分别为 90%、80%,现用 A1、A2 分别表示甲、乙两厂的药品,B 表示 合格品,试求:P(A1)、P(A2)、P(B|A1)、P(B|A2)、P(A1B)和 P(B)。 解:由题中已知条件可得 P(A1)=0.65,P(A2)=0.35,P(B|A1)=0.9,P(B|A2)=0.8, P(A1B)= P(A1)P(B|A1)= 0.65× 0.9=0.585, P(B)= P(A1)P(B|A1)+ P(A2)P(B|A2) =0.65× 0.9+0.35× 0.8=0.865。 19. 某地为甲种疾病多发区, 其所辖的三个小区 A1, 2, 3 的人口比例为 9∶ 4, A A 7∶ 据统计资料,甲种疾病在这三个小区的发病率依次为 4‰,2‰,5‰,求该地甲种疾 病的发病率。 解:设以 A1、A2、A3 表示病人分别来自小区 A1、A2、A3,以 B 表示患甲种疾病。 则由题意知 P(A1)=9 7 4 ,P(A2)= ,P(A3)= , 20 20 20P(B|A1)=0.004,P(B|A2)=0.002,P(B|A3)=0.005, 则该地甲种疾病的发病概率为 P(B)= P(A1)P(B|A1)+ P(A2)P(B|A2)+ P(A3)P(B|A3) =9 7 4 ? 0.004 ? ? 0.002 ? ? 0.005 ? 0.‰。 20 20 2020.若某地成年人中肥胖者(A1)占有 10%,中等者(A2)占 82%,瘦小者(A3) 占 8%,又肥胖者、中等者、瘦小者患高血压病的概率分别为 20%,10%,5%。 (1) 求该地成年人患高血压的概率; (2)若知某人患高血压病,他最可能属于哪种体型? 解:设 B={该地成年人患高血压},则由题意知 P(A1)=0.10,P(A2)=0.82,P(A3)=0.08, P(B|A1)=0.20,P(B|A2)=0.10,P(B|A3)=0.05, (1)该地成年人患高血压的概率为 P(B)= P(A1)P(B|A1)+ P(A2)P(B|A2)+ P(A3)P(B|A3) = 0.1 ? 0.2 ? 0.82 ? 0.1 ? 0.08 ? 0.05 =0.106; (2)若已知某人患高血压病,他属于肥胖者(A1) 、中等者(A2) 、瘦小者(A3)26 体型的概率分别为 P(A1|B)= P(A2|B)= P(A3|B)= 因为P( A1 ) P( B | A1 ) 0.1 ? 0.2 ? ? 0.1887 P( B) 0.106P( A2 ) P( B | A2 ) 0.82 ? 0.1 ? ? 0.7736 P( B) 0.106P( A3 ) P( B | A3 ) 0.08? 0.05 ? ? 0.0377 P( B) 0.106P(A2|B)& P(A1|B) &P(A3|B)故若知某人患高血压病,他最可能属于中等体型。 21.三个射手向一敌机射击,射中概率分别为 0.4,0.6 和 0.7。若一人射中,敌 机被击落的概率为 0.2;若两人射中,敌机被击落的概率为 0.6;若三人射中,则敌机 必被击落。 (1)求敌机被击落的概率; (2)已知敌机被击落,求该机是三人击中的概 率。 解:设 A1、A2、A3 分别表示第一个射手、第二个射手、第三个射手射中敌机;B0、 B1、B2、B3 分别表示无人射中、一人射中、两人射中、三人射中敌机;C 表示敌机被 击落。则 A1、A2、A3 相互独立,且由题意可得 P(A1)=0.4,P(A2)=0.6,P(A3)=0.7 P(B0)= P( A1 A2 A3 )=P( A1 ) P( A2 ) P( A3 )= 0.6× 0.4× 0.3=0.072 P(B1)= P( A1 A2 A3 ? A1 A2 A3 ? A1 A2 A3 )= P( A1 A2 A3 ) ? P( A1 A2 A3 ) ? P( A1 A2 A3 ) = P( A1 )P( A2 )P( A3 ) ? P( A1 )P( A2 )P( A3 ) ? P( A1 )P( A2 )P( A3 ) =0.4× 0.4× 0.3+0.6× 0.6× 0.3+0.6× 0.4× 0.7=0.324 P(B2)= P( A1 A2 A3 ? A1 A2 A3 ? A1 A2 A3 )= P( A1 A2 A3 ) ? P( A1 A2 A3 ) ? P( A1 A2 A3 ) = P( A1 )P( A2 )P( A3 ) ? P( A1 )P( A2 )P( A3 ) ? P( A1 )P( A2 )P( A3 ) =0.4× 0.6× 0.3+0.6× 0.6× 0.7+0.4× 0.4× 0.7=0.436 P(B3)= P( A1 A2 A3 )=P(A1) P(A2) P(A3)= 0.4× 0.6× 0.7=0.168 P(C|B0)=0,P(C|B1)=0.2,P(C|B2)=0.6,P(C|B3)=1 (1)敌机被击落的概率为27 P(C)=P(C|B0)P(B0)+P(C|B1)P(B1)+P(C|B2)P(B2)+P(C|B3)P(B3) =0× 0.072+0.2× 0.324+0.6× 0.436+1× 0.168=0.4944; (2)所求概率为 P(B3|C)=P( B3 ) P(C | B3 ) 0.168? 1 ? ? 0.3398。 P(C ) 0.4944五、思考与练习(一)填充题1.若 P(A)=0.3,P(B)=0.6,则 (1)若 A 和 B 独立,则 P(A+B)= (2) A 和 B 互不相容, P(A+B)= 若 则 (3)若 A ? B,则 P(A+B)= ,P(B-A)= , P(B-A)= , -A) = P(B 。 。 ; ;2. 如果 A 与 B 相互独立,且 P(A)= P(B)= 0.7,则 P( A B )= 3.在 4 次独立重复试验中,事件 A 至少出现 1 次的概率为 事件 A 出现的概率是 。65 ,则在每次试验中 81(二)选择题1. 下列说法正确的是( ) B. 不可能事件的概率不一定为 0 D. 以上均不对。 )A. 任一事件的概率总在(0,1)之内 C. 必然事件的概率一定为 12. A 表示事件“甲种药品畅销, 以 乙种药品滞销”, 则其 A 的对立事件为 ( A. 甲,乙两种药品均畅销 C. 甲种药品滞销” B. 甲种药品滞销,乙种药品畅销 D. 甲种药品滞销或乙种药品畅销3. 有 100 张从 1 到 100 号的卡片,从中任取一张,取到卡号是 7 的倍数的概率为 ( )28 A.7 507 48B.7 100 15 100)C.D.4. 设 A 和 B 互不相容,且 P(A)&0,P(B)&0,则下列结论正确的是( A. P(B|A)&0 C. P(A|B)=0 B. P(A)=P(A|B)D. P(AB)=P(A)P(B)(三)计算题1.设 Ω={1,2,3,4,5,6,7},A={2,3,4},B={3,4,5}。试求下列事件: (1) A B ; (2) A +B。 2.某城市的电话号话由 0,1,2,?,9 这 10 个数字中任意 8 个数字组成,试求 下列电话号码出现的概率: (1)数字各不相同的电话号码(事件 A) ; (2)不含 2 和 7 的电话号码(事件 B) ; (3)5 恰好出现两次的电话号码(事件 C) 。 3.一部五卷的文集,按任意次序放到书架上去,试求下列事件的概率: (1)第一卷出现在两边; (2)第一卷及第五卷出现在两边; (3)第一卷或第五卷出现在两边; (4)第三卷正好在正中。 4.电路由电池 A 与两个并联的电池 B、C 串联而成,设电池 A、B、C 是否损坏 相互独立,且它们损坏的概率依次为 0.3,0.2,0.2,求电路发生间断的概率。 5. 设一医院药房中的某种药品是由三个不同的药厂生产的,其中一厂、二厂、三 厂生产的药品分别占 1/4、1/4、1/2。已知一厂、二厂、三厂生产药品的次品率分别是 7%,5%,4%。现从中任取一药品,试求 (1)该药品是次品的概率;29 (2)若已知任取的药品是次品,求该次品是由三厂生产的概率。 6.盒中放有 12 个乒乓球,其中有 9 个球是新球。第一次比赛从盘中任取 3 个来 用,比赛后仍放回盒中;第二次比赛时又从盒中任取 3 个。 (1)求第二次取出的球都 是新球的概率; (2)若已知第二次取出的球都是新球,求第一次取到的都是新球的概 率。六、思考与练习参考答案(一)填充题1. (1)0.72,0.42; (2)0.9,0.6; (3)0.6,0.3 2. 0.09 3.1 3(二)选择题1. C; 2. D; 3. A; 4 .C(三)计算题1.A ={1, 5,6, 7}, B ={1, 2,6, 7},则(1) A B ={1, 6, 7}; (2) A +B={1,3,4,5,6,7} 2. (1) P? A? ?8 10 ? 9 ? 8 ? 7 ? 6 ? 5 ? 4 ? 3 A10 ? 8 ? 0.8 (2) P?B ? ? 8 8 ? 0.167810(3) P?C ? ?C82 ? 9 6 108? 0.14882 3 1 4 A2 A3 C2 A4 2 1 3. (1) P ? (2) P ? ? =0.4; ? =0.1; 5 5 5 10 A5 A51 4 2 3 3 2C2 A4 ? A2 A3 A32 A3 7 7 (3) P ? ? =0.7;或 P ? 1 ? ? =0.7; 5 5 10 10 A5 A530 1 1 3 2 3 2C2 C3 A3 ? A2 A3 7 或P ? ? =0.7 5 10 A54 A4 1 (4) P ? 5 ? =0.2 A5 54.已知P( A )=0.3,P( B )=0.2,P( C )=0.2 且 A、B、C 相互独立则所求概率 P( A ? B C )=P( A )+P( B C )-P( A B C ) = P( A )+P( B )P( C )-P( A )P( B )P( C ) =0.3+0.2×0.2-0.3×0.2×0.2=0.328 5. 令 A={该药品是次品};Bk={药品是由 k 厂生产的},k=1,2,3。 由题意知 P(B1)=0.25, P(B2)=0.25,P(B3)=0.5, P(A|B1)=0.07,P(A|B2)=0.05,P(A|B3)=0.04, (1)P(A)=P(A|B1)P(B1)+P(A|P2)P(B2)+P(A|B3)P(B3) =0.07×0.25+0.05×0.25+0.04×0.50=0.05 (2)P( B3 | A) ? ? P? A | B3 ?P( B3 ) P( A | B1 ) P( B1 ) ? P( A | B2 ) P( B2 ) ? P( A | B3 ) P( B3 )0.04? 0.5 0.02 ? ? 0.40 0.07 ? 0.25 ? 0.05 ? 0.25 ? 0.04 ? 0.5 0.056.令 Ak={第一次比赛任取 3 球中有 k 个新球},k=0,1,2,3; B={第二次取出的球都是新球}。 由题意得3P(Ak)=3 C3 ? k C k C 3? 9 , P(B|Ak)= 93 k ,k=0,1,2,3。 3 C12 C123 3 C3 ? k C k C9? k 9 ? 3 ? 0.146 3 C12 C12 k ?0 3(1) P?B ? ? ? P( Ak ) P( B | Ak ) ? ?k ?03 3 (2) P( A | B) ? P( A3 ) P( B | A3 ) ? P( A3 ) P( B | A3 ) ? C 9 ? C 6 0.146 =0.238 3 3 3 3? P( A ) P( B | A )i ?0 i iP( B)C12 C1231 第三章 随机变量及其分布一、 学习目的和要求1. 理解随机变量及其分布函数的概念; 2. 熟练掌握离散型、连续型随机变量的分布及性质; 3. 熟练掌握常用数字特征:数学期望 E(X)和方差 D(X)及其性质; 4. 熟练掌握二项分布、泊松分布、正态分布等的性质及概率计算; 5. 了解随机变量函数的分布; 6. 了解随机向量及分布函数的概念、性质; 7. 掌握离散型随机向量和连续型随机向量及其分布; 8. 掌握二维随机向量的数字特征; 9. 了解契比晓雪夫不等式和大数定律及其意义; 10. 掌握中心极限定理及其应用; 11. 了解用 Excel 计算二项分布、泊松分布、正态分布等常用分布的概率。二、内容提要(一)随机变量及常用分布1. 离散型随机变量及常用分布名 称 分布律 定 义 1. 2. 性质或背景 pk ≥0,k=1,2,… 备 注P{X=xk}=pk,k=1,2,? 或 X P x1 p1 x2 … xk … pk … p2 …?pk ?1?k?10-1 分布P{X=1}=p, P{X=0}=q,或 X P 0 q 1 p二项分布 n=1 的特例: B(1,p)( 一重贝努里试验)EX=p D(X)=pq二项分布 B(n,p)k P{X= k}= Cn p k q n?k ,X 为 n 重贝努里试验中 A 事件发生的次数EX=np D(X)=npqk=0,1,… ,n32 泊松分布 P(?)P{X=k}= ? e ? ? ,k二项分布泊松近似公式k C n p k q n?k ?EX=? D(X)= ?k!?kk!k=0,1,2,… , ?&0 是常数e ?? (? ≈ np)(n 很大,p 较小) 超几何 分布 P{X=k}=k n C M C N?kM ? n CN无放回产品抽样试验 当 N→+∞时,M ? p 时,Nk n C N C N?kM k ? ? Cn p k q n ?k n N ??? CNEX= nMND( X ) ? nM ( N ? n)(N ? M ) N 2 ( N ? 1)k=1,2,…,min(M,n)lim2. 连续型随机变量及常用分布名 称 定 对任意 a&b 有 密度函数 f(x) P{a&X≤b}= 义 性质或背景 1. f(x)≥0b a备 注 等价定义: 对 X 的分布函数有 F(x)= ?x ???f ( x)dx2.?????f ( x)dx ? 13. 对任意常数 a,有 P{X= a}=0f ( t )dt ,∞<x<+∞ E(X)=?a??正态分布 N (?, ? )2f (x) =? 1 e 2? ?( x? ? )2 2? 2P{a&X≤b}=?( b??∞&x&+∞?) ? ?(?)D(X)= ?2标准正态分布 N (0, 1) 指数分布 E(?) 均匀分布 U[a,b]?(x) =? 1 e 2 2?x21. ?(x)=1-?(x) 2. ?(x)可查表计算 其中?(x)是分布函数 常用作“寿命”分布 ?&0 为常数 直线上几何概率模型 的分布描述 若 X 服从对数正态分E(X)=0 D(X)= 1∞&x&+∞??e ? ?x , x ? 0 f ( x) ? ? x?0 ?0,? 1 , ? f ( x) ? ? b ? a ?0, ? a? x?b 其它,E(X)=1/? D(X)=1/ ?2 E(X)= (a+b)/2 D(X)=(b-a)2/12?? ?222f(x) = 对数正态分布 LN( ??,? ? )2(ln x ? ? ) ? 1 ? 2 e 2? ,x ? 0 ? ? 2? ?x ? x?0 ?0 ,2布 LN( ? , ? ),2E( X ) ? eD( X ) ? (e? ? 1)e2? ??2则 lnX~N( ? , ? 2 )33 f(x)= 韦布尔分布 W(m, ?, ?)( x ?? ) ?m ? ? ( x-? ) m-1 e ? , x ? ? ?? ? x ?? ?0 ,mm =1 且?=0 时为指数 分布;m =3.5 时近似 于正态分布分布函数为 F(x)= 1 ? e? ( x ?? ) m?,(x&?)3. 随机变量的分布函数类 型 通用定义 定 义 性 质 1. 0≤F(x)≤1; 2. F(∞)=0 , F(+∞)=1 3. 4. F(x)对 x 单调不减 F(x)为右连续 备 注 P{a&X≤b}=F(b)-F(a)F(x)=P{X≤x}, ∞<x<+∞离散型 X 连续型 XF(x)=xi ?x?pxi,pk ? P{X ? x k } ? F ( xk ) ? F ( xk ? 0)f(x)=F?(x) P{a&X≤b}= ? f ( x )dxa b∞<x<+∞ F(x)= ???f ( t )dt ,∞<x<+∞(二)随机变量的数字特征类 型 定 离散型 E(X)= 数学期望 E(X) 连续型 E(X)= ? xf ?x ?dx?? ??义性 质备 注?xk ?1??kpk1. E(C)=C(C 为常数) 2. E(CX)=C? E(X) 3. E(X±Y)=E(X)±E(Y) 4. 若 X、Y 相互独立,则 E(X? Y)=E(X)? E(Y) 描述随机变量 所有可能取值 的平均水平方差 D(X) 标准差D(X) =E[(X-E(X))2]1. D(C)=0(C 为常数) 2. D(CX)=C2? D(X) 3. 若 X、Y 相互独立,则 D(X±Y)=D(X)+D(Y) 4. D(X) = E(X2)-(EX)2 1. Cov(aX,bY)= abCov(X, Y) 2. Cov(X1+X2,Y)描述随机变量 取值相对于均 值的平均离散 程度 描述 X 与 Y 的 偏差的关联程? ? X ? ? D? X ?? E[( X ? EX ) 2 ]Cov(X,Y) =E[(X-E(X))(Y-E(Y))]?(X)协方差 cov(X, Y)34 =E(XY)-E(X)? E(Y)=Cov(X1,Y) +Cov(X2,Y) 3. X 与 Y 独立? Cov(X, Y)=0 4. D(X±Y) =D(X)+D(Y)±2Cov(X, Y) 1. |?XY|≤1;度描述 X 与 Y 间 线性相关程度; ?XY =0, X 与 称 Y 不相关;相关系数 ?XY? XY ?Cov? X , Y ? D? X ? D?Y ?2. |?XY|=1?存在常数 a、b 使得 P{Y=aX+b}=1; 3. X 与 Y 独立?X 与 Y 不相关, 反之不一定成立。(三)随机变量函数的分布类 型 X 的分布 X 的分布律 离散型 X k=1,2,? P{X=xk}=pk, Y 的分布律为 P{Y=g(xk)} =pk,k=1,2,?。 若有某些 g(xi)相等,则对其作适当的并项,即 对应概率相加 分布函数法: FY(y)=P{Y≤y}=P{g(X)≤y} ? ? Y=g(X)的密度:fY(y)=F′Y(y) 连续型 X X 的密度为 fX (x) 定理公式法: 若 y=g(x)在 fX (x)非零区间上严格单调,h(y)是 y=g(x)的反函数E (Y ) ? E[ g ( X )] ? ? g ( x) f ( x)dx.?? ??函数 Y=g(X)的分布数学期望公式E (Y ) ? E[ g ( X )] ? ? g ( xk ) p kk ?1 ??{ x:g ( x )? y}f X ( x)dx? f X [h( y)]? | h' ( y) |, ? ? y ? ? f Y ( y) ? ? 其它, ?0,(四)二维随机向量及分布1. 二维离散型随机向量名 称 定 义 性质或试验背景 备 注35 联合 分布律P?X ? xi , Y ? y j ?? pij , i, j ? 1,2, ?P?X ? xi ? ? ? pij ? pi .,j ?1 ??1.pij≥0,i,j=1,2,?,?? ??联合分布律的列表结构 (概率分布表)2. ? ? pij ? 1t ?1 j ?1X的 边缘分布 Y的 边缘分布 独立性随机变量 X 的分布律由联合分布律 “行值相加”i ? 1,2,?P? ? y j ? ? ? pij ? p. j , Y?? i ?1j ? 1,2,?.X 与 Y 相互独立?pij ? pi ? p? j , i, j ? 1,2,?.随机变量 Y 的分布律 X、Y 的边缘分布完全 确定其联合分布律由联合分布律 “列值相加” 按定义验证独立性, 实用中由试验独立性得2. 二维连续型随机向量名称 联合密度 f(x, y) 定 义 对平面上的区域 DP (( X , Y ) ? D ) ?性质或试验背景 1. f(x,y)≥0 2.备注P?x1 ? X ? x2 , y1 ? Y ? y2 ? ? ? x12 ? y12 f ( x, y )dxdy x y?? f ( x, y )dxdyD? ?? ? ?? f ( x, y)dxdy ? 1 ?? ??fX(x)=FX?(x) fY(y)= FY?(y) 按定义验证独立性; 实用中由试验独立性得 X 与 Y 相互独立? ?=0; ?是 X 与 Y 的相关系数X 的边缘密度 Y 的边缘密度 独立性f X ( x) ? ? ?? f ( x, y)dy 随机变量 X 的密度 ??fY ( x) ? ? ?? f ( x, y)dx ??X 与 Y 相互独立?f ( x, y) ? f X ( x) f Y ( y)随机变量 Y 的密度 X、 的边缘分布完全确 Y 定其联合分布律 X~N( ?1 , ? 12 ) Y~N( ? 2 , ? 2 )2二维 正态分布(X, Y)~2 N(μ 1,μ 2, ? 12 , ? 2 , ? )3. 二维随机向量的分布函数名 称 联合分布 函数定义 离散型 定 义 F(x, y)=P{X≤x,Y≤y} ∞<x, y<+∞F ( x, y ) ? ? ? pijxi ? x y j ? y性质或试验背景 1. 0≤F(x, y)≤1; 2. F(-∞, y)= 0, F(x,-∞)=0, F(-∞,-∞)=0, F(+∞, +∞)=1;备注F(x,y) 可 以 描 述 任 意 类型(X,Y)的分布36 (X,Y) 连续型 (X,Y) X 的边缘 分布函数 Y 的边缘 分布函数∞<x, y<+∞x y F ( x, y) ? ? ?? ? ?? f (u, v)dudv3. F(x, y)对 x, y 均为右连续; 4. F(x, y)对 x 和 y 单调不减;f ( x, y) ?? 2 F ( x, y) ?x?y∞<x, y<+∞FX ( x) ? lim F ( x, y )y ? ??FX(x)为 X 的分布函数由 F(x,y)可确定 FX(x) 与 FY(y),反之未必? F ( x,??)FY ( x) ? lim F ( x, y )x ???FY(y)为 Y 的分布函数? F (??, y )(五)大数定律和中心极限定理名 称 条 件 X 的 E(X)、D(X) 契贝晓夫 不等式 均存在有限 结 论 对任意?>0,有P? X ? E ( X ) ? ? ? ? D( X ) 或备 注 在已知 X 的均值和方差 时,估计 X 与其均值 E(X)的偏差大(小)于?的 概率n 当 n 足够大时, 1 ? X k?2P? X ? E ( X ) ? ? ? ? 1 ?D? X ??2设 {Xk} 为 相 互 独 立且服从同一分 切比雪夫 大数定律 布的随机变量序 列 , 又 E(Xk)=?, D(Xk)=?2(k=1,2, ?)均存在有限 设?n~B(n,p); 贝努里 大数定律 (或?n 为 n 重贝 努里试验中事件 A 发生的次数, P(A)=p) 勒维-林德贝格 中心极限定理 (独立同分布中 心极限定理) 设 {Xk} 为 相 互 独 立且服从同一分 布的随机变量序 列 , 又 E(Xk)=?, D(Xk)=?2(k=1,2,对任意?>0,有?1 n ? lim P? ? X k ? ? ? ? ? ? 0 n??? n k ?1 ? ?n k ?1将依概率收敛于其均值 μ即P 1 n ? Xk ?? n k ?1对任意ε >0,有n??以严格数学形式描述 “频率的稳定性” 。 在试验次数很大时,用 事件 A 的频率作为其概 率的近似值 n 足够大时,? X k 近似k ?1 n?? ? lim P? n ? p ? ? ? ? 0 。 n ? ?即 A 发生的频率?nn?pP令 Yn ?k ?1? X k ? n? n?n,则n??lim P?Yn ? x? ? ? ( x)服从 N(n?, n? 2)即 n 很大时, n~N(0, 1)(近似) Y37 ?)均存在有限 德莫佛-拉普拉 斯中心极限定理 (贝努里情形中 心极限定理) 设?n~B(n,p); (或?n 为 n 重贝 努里试验中事件 A 发生的次数, P(A)=p) 令 Yn ??n ? npnpq,则当 n 很大(n&30)时,有P?a ? ? n ? b? ? ?( b ? np a ? np ) ? ?( ). npq npqn??lim P?Yn ? x? ? ? ( x)即 n 很大时, n~N(0,1)(近似), Y 或?n~N(np , npq) (近似)三、综合例题解析例1 (1991 年考研题) 一汽车沿一街道行驶, 需要通过三个均设有红绿灯的路口。 每个信号灯为红或绿与其他信号灯为红或绿相互独立,且红绿两种信号显示的时间相 等。以 X 表示该汽车首次遇到红灯前已通过的路口个数,求 X 的概率分布。 解:首先,由题设可知,X 的可能值为 0,1,2,3。现设 Ai = {汽车在第 i 个路口首次遇到红灯},i=1,2,3, 则事件 A1,A2,A3 相互独立,且P ( Ai ) ? P ( A i ) ? 1 2(i = 1,2,3) ,故有P{X = 0} = P(A1) = 1 ,2P{ X ? 1} ? P( A1 ) P( A2 ) ?1 221 23P{ X ? 2} ? P( A1 A2 A3 ) ? P( A1 ) P( A2 ) P( A3 ) ?P{ X ? 3} ? P( A1 A2 A3 ) ? P( A1 ) P( A2 ) P( A3 ) ?1 23所以,X 的分布律为X P 01 211 2221 2331 2338 注意:利用性质: ? pi ? 1 ,可检查离散型概率分布律的正确与否。同时,若 Xi的某个取值 x0 的概率较难计算,而其他所有取值的概率已算出时,则也可以利用上述 性质得到:P{ X ? x0 } ? 1 ?i:xi ? x0? pi 。比如本例中:P{ X ? 3} ? 1 ? P{ X ? 0} ? P{ X ? 1} ? P{ X ? 2} ? 1 。 23例 2 设连续型随机变量 X 的分布函数为x ? ? ? A ? Be 2 , x ? 0 F ( x) ? ? ?0, x?0 ?求: (1)常数 A、B; (2)概率密度函数 f(x)。 解: (1)由分布函数的性质 F(+∞)=1 得 F(+∞)= lim ( A ? Be 2 ) ? A ? 1 ,x ??? ? x再由分布函数的连续性知其右极限 F(0+0)= F(0),即 F(0+0)= lim ( A ? Be ) ? A ? B ? 0x ?0 ? 0 ? x 2联立上述两式,解之得:A =1, 则分布函数为B =1。x ? ? ?1 ? e 2 , x ? 0 F ( x) ? ? ?0, x?0 ?(2)所求密度函数为x ?1 ?2 ? e , x?0 。 f ( x) ? F ?( x) ? ? 2 ?0, x?0 ?39 例 3(1989 年考研题)设随机变量?在区间[1,6]上服从均匀分布,求方程 x2 +? x + 1 = 0 有实根的概率。 解:易知方程 x2 +? x + 1 = 0 有实根当且仅当Δ =?2-4≥0,即|?|≥2。故所求问题 转化为:已知?~U[1,6],求 P{|?|≥2}。 现因?在[1,6]上服从均匀分布,则?的概率密度为?1 ? , 1 ? x ? 6, f ( x) ? ? 5 ?0, 其他. ?方程 x2 +ξ x + 1 = 0 有实根的充要条件是Δ =?2-4≥0,即|?|≥2,故P{? ? 2} ? 1 ? P{? ? 2} ? 1 ? P{?2 ? ? ? 2}? 1 ? ? f ( x)dx ? 1 ? ( ? 0dx ? ??2 ?221211 1 4 dx) ? 1 ? ? 。 5 5 5例 4 已知 X~N(2, ?2),P{2<X<4}=0.3,求 P{X<0}。 解:由于 X~N(2, ?2),故P{2 ? X ? 4} ? ?( 4?2 2?2 2 ) ? ?( ) ? ?( ) ? ?(0) ? 0.3 σ σ σ由于 ?(0) ?1 ,可知 2 2 ? ( ) ? ? (0) ? 0.3 ? 0.8 ,?故P{ X ? 0} ? ?(0?2?2 2 ) ? ?(? ) ? 1 ? ?( ) ? 1 ? 0.8 ? 0.2 。??注意:在正态分布的概率计算中,首先要将它标准化,转化为利用标准正态分布 的公式求解即可。 例 5(1989 年考研题)设随机变量 X 和 Y 独立,且 X 服从均值为 1,标准差为 2 的正态分布,而 Y 服从标准正态分布,试求随机变量 Z = 2X-Y + 3 的概率密度函数。 解:由于 X 和 Y 相互独立且都服从正态分布,所以 Z 作为 X,Y 的线性组合也服 从正态分布,故只需求 E(Z)和 D(Z)就可确定 Z 的概率密度函数了。 由题设知,X~N(1,2) ,Y~N(0,1) 。则由期望和方差的性质得40 E(Z) = E(2X-Y + 3)=2E(X)-E(Y) +3 = 5, D(Z) = D(2X-Y + 3) = 22D(X) +D(Y) = 9. 又因 X,Y 是相互独立的正态随机变量,Z 是 X,Y 的线性函数,故 Z 也为正态随 机变量,即 Z~N (?, ?2),且 ?= E(Z)=5, ?2= D(Z)=9。 则 Z 的概率密度为f Z ( z) ?1 3 2?e?( z ?5) 2 2?9, ? ? ? z ? ?? 。注意:本题主要考察的性质是:一是独立正态分布的线性组合仍为正态分布;二 是正态分布 N (?, ?2)完全由其期望?和方差?2 决定。 例 6 已知随机变量 X 的概率分布律为 P{X=k}=1/2k,k=1,2,?, 试求 Y ? sin( X ) 的概率分布律。2?解: 对随机变量 Y ? sin( X ) , X 取 1, 2, ?, n, ?时, 的取值为 1, 0,1, 0, ?, 当 Y?2即X 1 2 3 4 0 5 1 6 0 7 -1 ? ?Y ? sin( X ) 2P?10 -11 1 2 221 231 241 251 261 ? 27则 Y ? sin( X ) 只以1,0,1 为其取值,其取值概率为 2 P{Y=1}=P{X=3}+P{X=7}+P{X=11}+???1 1 1 1 1 2 ? 7 ? 11 ? ? ? ? ? ; 3 2 2 2 8 1 ? 1 15 1641 P{Y=0}= P{X=2}+P{X=4}+P{X=6}+?? 1 1 1 1 1 1 ? 4 ? 6 ?? ? ? ? ; 2 2 2 2 4 1? 1 3 4P{Y=1}=P{X=1}+P{X=5}+P{X=9}+??1 1 1 1 1 8 ? 5 ? 9 ?? ? ? ? 2 2 2 2 1 ? 1 15 16(或 P{Y=1}=1-P{X=1}-P{X=0}= 1 ? 故 Y 的分布律为Y P -12 152 1 8 ? ? ) 15 3 1501 318 15例 7 设(X,Y)的联合分布律为Y X 1 2 -1 1/4 1/6 0 1/4 a3 1 3 1 求: (1)常数 a; (2)联合分布函数在点( , )处的值 F( , ) 。 2 2 2 2解: (1)由联合分布律的性质?? pij ? 1i j知1??? pij ? 4 ? 4 ? 6 ? a,1 1 1i j求得 a ?1 。 342 3 1 (2) (X,Y)的联合分布函数 F(x, y)在点( , )处的值应为 2 23 1 3 1 1 1 1 F ( , ) ? P{ X ? , Y ? } ? P{ X ? 1, Y ? ?1} ? P{ X ? 1, Y ? 0} ? ? ? 。 2 2 2 2 4 4 2注:求联合分布函数 F(x,y)的值时,只需把取值满足 xi≤x,yj≤y 的点(xi,yj) 的概率 pij 找出来,然后求和就可以了。2 2 例 8 设 ( X , Y ) ~ N (?1 , ? 2 , ? 1 , ? 2 , ? ) , X 与 Y 相互独立的充分必要条件是 ? =0。 则证: (充分性)由于 ( X , Y ) ~ N (?1 , ? 2 , ? 1 , ? 2 , ? ) ,则其 X 与 Y 的边缘密度分别为2 2f X ( x) ?? 1 e 2? ? 1( x ? ?1 ) 22 2? 1, ? ? ? x ? ??fY ( y) ?当 ? =0 时,有1 2? ? 2?( x ? ?2 )22 2? 2e,? ? ? y ? ??,f ( x, y ) ? ?? 1 ? x ? ?1 2 y ? ?2 2 ?? exp?? ?( ) ?( ) ?? 2?? 1? 2 ?2 ?? ? 2 ? ?1 1( x ? ?1 ) 22 2? 1? 1 e 2? ? 1?1 2? ? 2?( y ? ?2 )22 2? 2e? f X ( x) ? f Y ( y ),故 X 与 Y 相互独立。 (必要性)若已知 X 与 Y 相互独立,则对任意 x,y,有f ( x, y) ? f X ( x) ? fY ( y),特别地,取 x ? ?1 , y ? ? 2 ,上式变为1 2?? 1? 2 1 ? ? 2从而有 ? =0。?1 2?? 1? 2,例 9(2001 年考研题) 一生产线生产的产品成箱包装,每箱的重量是随机的。假 设每箱平均重 50 千克,标准差为 5 千克。若用最大载重量为 5 吨的汽车承运,试利用43 中心极限定理说明每辆车最多可以装多少箱,才能保障不超载的概率大于 0.977。 (?(2)=0.977,其中?(x)是标准正态分布函数) 。 解: Xi 是汽车装运的第 i 箱的重量 设 (千克) n 为最多可以装的箱数, X1, X2,?, , 则 Xn 可视为 n 个相互独立而且服从同分布的随机变量,再设 X 为 n 箱的总重量,则有X ? ? X i ,且i ?1 n? ? E ( X i ) ? 50, ? = D( X i ) ? 5,而由列维-林德贝格中心极限定理,X 近似服从正态分布 N(n?, n?2)。 则所求箱数 n 决定于条件5000 ? 50n ? X ? n? 5000 ? n? ? P ? X ? 5000? ? P ? ? ) ? 0.977 ? ? ?( n? ? 5 n ? n?因?(2)=0.977,则有1000? 10n ?2 n解之得 n&98.02 , 即最多可以装 98 箱。 例 10 设在 n 重伯努利试验中,每次试验事件 A 发生的概率都是 0.7。 (1) X 表示 1000 次独立试验中事件 A 发生的次数, 设 用中心极限定理计算 P{650 <X≤750}; (2)要使在 n 次试验中,A 发生的频率在 0.68 与 0.72 之间的概率至少为 0.9,问 至少要做的试验次数 n 为多少? 解(1)因 X~B(),由德莫佛-拉普拉斯中心极限定理得? 650 ? np X ? np 750 ? np ? ? ? P{650 ? X ? 750} ? P ? ? ? ? npq npq ? ? npq ? ? 750 ? 700 650 ? 700 50 ? ?( ) ? ?( ) ? 2? ( ) ? 1 ? 2? (3.5) ? 1 210 210 210 ? 2 ? 0.99977 ? 1 ? 0.99954.(2)X 为 n 次独立试验中事件 A 发生的次数,因此,n 次试验中,A 发生的频率 为X ,其中 X~B(n,0.7),E(X) = 0.7n,D(X) = 0.21n,依题意,n 应使 n44 ? 0.72n ? 0.7n ? ? 0.68n ? 0.7n ? X ? ? P ?0.68 ? ? 0.72? ? P{0.68n ? X ? 0.72n} ? ?? ? ? ?? ? ? ? ? ? n 0.21n ? 0.21n ? ? ? ? ? ? 0.02n ? ? 2?? ? ? 1 ? 0.9, ? ? ? 0.21n ?即? 0.02n ? 1.9 ?? ?? ? 0.95. ? ? 0.21n ? 2 ?由于?(1.65) = 0.95,所以,n 应使0.02n 0.21n ? 1.65 ,即 因此,至少要做 1430 次试验。n?5717.25 ? 注意:运用德莫弗-拉普拉斯定理计算概率近似值时,其关键是: “标准化”和“正 态近似” 越大所得的近似值越精确。 ,n 注: (1)若 X~B(n, p),则 X ? ? X i ,其中 Xi 相互独立且都服从参数为 p 的 0-1i ?1 n分布; (2)二项分布概率的计算,可总结为下述三种方法; 方法一:X~B(n, p),且不太大(n≤20)时,直接计算。k P{X ? k} ? Cn pk qn ?k,k ? 0,1,?, n。q ? 1 ? p). (方法二:当 n 较大,且 p 较小(n≥20,p<0.1)时,由泊松定理,可近似计算:P{ X ? k} ?? k ?? e , ? ? np. k!方法三:当 n 较大,而 p 不太小时,用中心极限定理作正态近似计算 例 11 一复杂系统由 n 个相互独立起作用的部件所组面,每个部件的可靠性(即 部件正常工作的概率) 0.9, 为 且必须至少有 80%的部件工作才能使整个系统工作。 问: (1)n 至少为多大时,才能使系统的可靠性不低于 0.95?(2)若该系统由 85 个部件 组成,则该系统的可靠性是多少?45 解:令 X={ n 个部件中正常工作的部件数},则 X~B(n,0.9)。 (1) 由题意应求出 n,使得? X ? np 0.8n ? np ? 0.8n ? 0.9n ? ? P?X ? 0.8n? ? 1 ? P ? ? ) ? ? 1 ? ?( npq ? 0.9 ? 0.1n ? npq ? ? ? 1 ? ?(? 0.1n 0.09n ) ? ?( n ) ? 0.95 3则n ? 1.64 ,n≥24.206。故 n 至少为 25 时,才能使系统的可靠性不低于 0.95。 3(2)所求可靠性为? ? 85 ? X ? np 0.8 ? 85 ? np ? P?X ? 0.8 ? 85? ? 1 ? P ? ? ) ? ?(3.073) ? 0.9989。 ? ? ?( 3 npq ? ? npq ? ?四、习题三解答1. 下面两表是否可作为离散型随机变量的分布列?为什么?X P 1 0 2 X P 0 0.6 1 0.1 2 0.150.5 0.9 0.6解:对表 1,因为 P{X=1}=0.5 &0, 所以不可作为离散型随机变量的分布列。 对表 2,因为?pk ?13k? 0.6 ? 0.1 ? 0.15 ? 0.85 ? 1,所以不可作为离散型随机变量的分布列。 2.一盒中有五枚纪念章,编号为 1,2,3,4,5,从中任取 3 枚,用 X 表示取 出的纪念章的最大号码,求 X 的分布律。 解:由题意知:X 的取值为 3,4,5,46 P{X=3}=1 5 ? ? 0.1 , 3 C 5 102 C3 3 ? ? 0.3 , 3 C5 10P{X=4}=2 P{X=5}= C4 ? 6 ? 0.6 3C510故 X 的分布律为X P 0 0.1 1 0.3 2 0.6或 X 的分布律为1 C1 Ck2?1 P{X=k}= , 3 C5k=3,4,5。3.进行某种试验,成功的概率为 3/4,失败的概率为 1/4,以 X 表示直到试验成 功所需试验的次数, (1)试写出 X 的概率分布; (2)求 X 取偶数的概率。 解: (1)X 的概率分布律为1 3 3 P{ X ? k} ? ( ) k ?1 ? k ,k=1,2,? 4 4 4(2)X 取偶数的概率 P{X=偶数}= P{ X=2}+ P{ X=4}+?+ P{ X=2k}+?3 2 3 3 3 3 3 ? 2 ? 4 ? ? ? 2k ? ? ? 4 ? 2 ? ? 0.2 1 4 4 4 4 ? 1 15 1? 2 44.设随机变量 X 的分布列为:X P 0 0.4 1 0.2 2 p3 3 0.1求: (l)p3; (2)P{0&X&3}; (3)分布函数 F(x)。 解: (1)由 pk 的性质知47 ?pk ?14k? 0.4 ? 0.2 ? p3 ? 0.1 ? 1 ,故p3=1-0.7=0.3。 (2)P{0&X&3}= P{ X=1}+ P{ X=2}=0.2+0.3=0.5。 (3)则当 x&0 时,F(x) = P{X≤x} = 0; 当 0≤x&1 时,F(x)=P{X≤x}= P{X=0}=0.4; 当 1≤x&2 时,F(x)= P{X≤x}= P{X=0} + P{X=1}=0.4+0.2=0.6; 当 2≤x&3 时,F(x)= P{X≤x}= P{X=0} + P{X=1}+ P{X=2}=0.4+0.2+0.3=0.9; 当 x≥3 时,F(x)= P{X≤x}= P{X=0} + P{X=1} + P{X=2}+ P{X=3} =1。 故 X 的分布函数为?0, ?0.4, ? ? F ( x) ? ?0.6, ?0.9, ? ?1, ? x?0 0 ? x ?1 1? x ? 2 2?x?3 x?35.设随机变量 X 的分布列为X P -2 0.4 0 0.3 2 0.3试求:E(X),E(X2),E(3X+5),D(X),D(3X+5)。 解:E(X)= ? xk pk ? ?2 ? 0.4 ? 0 ? 0.3 ? 2 ? 0.3 ? ?0.2 ;k ?1 3E(X )=2?xk ?132 k2 pk ? ? 2) ? 0.4 ? 0 2 ? 0.3 ? 2 2 ? 0.3 ? 2.8 ; (E(3X+5)= 3 E(X)+5=3× (0.2)+5=4.4; D(X)=E(X2)-[E(X)]2=2.8-(0.2)2=2.8-0.04=2.76; D(3X+5)=9 D(X)=9× 2.76=24.84。 6.甲、乙两批原料,过筛后得知颗粒分布如下:48 粒度百分比(%) 甲 5 15 60 15 5 乙 20 20 20 20 20180 200 220 240 260平均说来,哪一批颗粒较粗?哪一批颗粒均匀性较差? 解:令 X、Y 分别为甲、乙两批原料的颗粒粒度,则 E(X)= ? xk pk ? 180? 0.05 ? 200? 0.15 ? 220? 0.6 ? 240? 0.15 ? 260? 0.05 ? 220k ?1 5 5E(Y)= ? y k pk ? 180? 0.2 ? 200? 0.2 ? 220? 0.2 ? 240? 0.2 ? 260? 0.2 ? 220k ?1因为 E(X)= E(Y),故甲、乙两批原料的颗粒一样粗。D? X ? ? ? ? x k ? E ( X ) ? p k2 k ?1 5( ) ( ) ( ) = 180 ? 220 2 ? 0.05 ? 200 ? 220 2 ? 0.15 ? 220 ? 220 2 ? 0.6? 240? 220 2 ? 0.15 ? 260? 220 2 ? 0.05 =280 ( ) ( )D?Y ? ? ? ? y k ? E (Y ) ? p k2 k ?1 5( ) ( ) ( ) = 180? 220 2 ? 0.2 ? 200? 220 2 ? 0.2 ? 220? 220 2 ? 0.2? 240 ? 220 2 ? 0.2 ? 260 ? 220 2 ? 0.2 =800 ( ) ( )因为 D(X)& D(Y),故乙批原料的颗粒均匀性较差。 7.设随机变量 X 的概率分布 P(X=k) = 试确定常数 a,共计算 E(X)及 D(X)。 解:因a , Nk=1, 2,? ,N?pk ?1Nk?a a a a ? ??? ? N ? a ? 1 , N N N N49 故 a=1。 E(X)= ? xk pk ? ? kk ?1 k ?12 E(X2)= ? xk pk ? ? k 2 k ?1 k ?1 N NNN1 1 N 1 N ( N ? 1) N ? 1 ? ?k ? ? ; N N k ?1 N 2 21 1 N 1 N ( N ? 1)(2 N ? 1) ( N ? 1)(2 N ? 1) ? ?k 2 ? ? N N k ?1 N 6 62( N ? 1)(2 N ? 1) N ? 1 2 N 2 ? 1 ?( ) ? D(X)=E(X )-[E(X)] = 6 2 1228.设 X 服从的概率分布为: P{X=k}=pqk-1, (k=1,2,…), 其中 0&p&1, q=1?p 是常数,则称 X 服从参数为 p 的几何分布 g(p)。试求 E(X)。k ?1 k ?1 2 解一: E(X)= ? xk pk ? ? k pq ? p? kq ? p(1 ? 2q ? 3q ? ?) ,(0&q&1) k ?1 k ?1 k ?1 ?? ?? ??又 则 故q E(X)= p(q ? 2q 2 ? 3q 3 ? ?) E(X)-q E(X)=p(1+q+q2+?)=p lim E(X)=??1 1? qn =p =1; n ??? 1 ? q 1? q1 1 =

我要回帖

更多关于 方差 n 1 的文章

 

随机推荐