二维对数正态分布布有哪些重要性质

 下载
 收藏
该文档贡献者很忙,什么也没留下。
 下载此文档
正在努力加载中...
正态分布习题
下载积分:30
内容提示:
文档格式:PDF|
浏览次数:643|
上传日期: 14:37:07|
文档星级:
该用户还上传了这些文档
正态分布习题.PDF
官方公共微信求助,二维正态分布有条性质看全书看迷糊了。_考研吧_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:938,409贴子:
求助,二维正态分布有条性质看全书看迷糊了。收藏
全书上原话:即便X和Y都服从正态分布,甚至X和Y的相关系数等于0,X和Y的联合分布也未必是二维正态分布。后面又说若X和Y都服从正态分布并且相互独立,则X和Y的联合分布一定是二维正态分布。两句话有矛盾吧,还是我理解有误,望高手指点
1楼 14:16&|来自
相关的贴子4912815838相关的图贴
相关系数等于零和相互独立等价吗?
2楼 14:40&|来自
对于联合二维正态分布来说,独立和不相关等价。也是全书上的原话
3楼 14:51&|来自
全书 565 正在迷糊中!!!
4楼 19:53&|来自
5楼 19:54&|来自
登录百度帐号
内&&容:使用签名档&&
为兴趣而生,贴吧更懂你。&或热门排序 |
感谢邀请。&br&&br&最大熵的连续分布:&br&已知区间==&均匀分布&br&已知均值==&指数分布&br&已知均值和标准差(方差)==&正态分布&br&&br&即在均值和标准差已知的情况下,正态分布是最大熵分布。
感谢邀请。最大熵的连续分布:已知区间==&均匀分布已知均值==&指数分布已知均值和标准差(方差)==&正态分布即在均值和标准差已知的情况下,正态分布是最大熵分布。
參見:&a href=&/%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83%E7%9A%84%E5%89%8D%E4%B8%96%E4%BB%8A%E7%94%9F%E5%9B%9B& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&正态分布的前世今生(四)&i class=&icon-external&&&/i&&/a&,簡單說一下,有空來補充。&br&&br&平時因爲我們測量時候最容易得到的數據也就是關於均值和協方差(關聯)的有關信息,與這些有關的約束加上最大熵要求,不考慮更高階的關聯,一般都是得到正態分佈。但是如果涉及到高階矩,或者約束條件有些奇怪,則不能得到正態分佈。
參見:,簡單說一下,有空來補充。平時因爲我們測量時候最容易得到的數據也就是關於均值和協方差(關聯)的有關信息,與這些有關的約束加上最大熵要求,不考慮更高階的關聯,一般都是得到正態分佈。但是如果涉及到高階矩,或者約束條…
确定均值和方差下,高斯函数是熵最大的函数&br&也就是说,确定均值和方差下,正态分布也就是熵最大,最混乱,最无序的分布
确定均值和方差下,高斯函数是熵最大的函数也就是说,确定均值和方差下,正态分布也就是熵最大,最混乱,最无序的分布
不是正态分布是肯定的。&br&&br&假设你发挥异常稳定,每一个关卡成功通过的概率都是 p,那么得分应该是一个几何分布。&br&&br&&img src=&/equation?tex=P%28n%29%3Dp%5En%281-p%29& alt=&P(n)=p^n(1-p)& eeimg=&1&&, n 代表得分&br&&br&概率分布图大致如下:&br&&img src=&/c1f62a20af96a71209b34_b.jpg& data-rawwidth=&356& data-rawheight=&220& class=&content_image& width=&356&&&br&所以得分低的很多是显然的。&br&&br&至于得分高的比较多的原因,可能的答案:&br&1. 你心理素质好,分越高状态也越好,后期 p 大幅上升。&br&2. 相比于低分,高得分给你留下的心理印象更深,因此误以为次数也较多。&br&&br&补充:&br&(如果)0分1分比较多,可能是因为只有第一个关卡是从较远处飞过去,需要调整手感,后面每个关卡间的过渡都是一样的。&br&至于20分以上比较多的话,大概可以理解为“玩顺手了”之类的意思吧。实际上几何分布是“无记忆性”的,也就是(p不变的情况下)0分开始玩到10分的难度和10分开始玩到20分的难度一样。因此如果后期玩顺了,p增加之后,同样拿10分会更轻松。
不是正态分布是肯定的。假设你发挥异常稳定,每一个关卡成功通过的概率都是 p,那么得分应该是一个几何分布。P(n)=p^n(1-p), n 代表得分概率分布图大致如下:所以得分低的很多是显然的。至于得分高的比较多的原因,可能的答案:1. 你心理素质好,分越高状态…
果壳死理性派:&a href=&/article/437988/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Flappy Bird到底有多难?&i class=&icon-external&&&/i&&/a&(&a href=&/article/437988/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&手机党入口&i class=&icon-external&&&/i&&/a&)&br&----------------------- ----------------------- ----------------------- -----------------------&br&&br&并附自己的150次频数统计:&br&&img src=&/babacb747a67be2a3adbc9e_b.jpg& data-rawwidth=&511& data-rawheight=&306& class=&origin_image zh-lightbox-thumb& width=&511& data-original=&/babacb747a67be2a3adbc9e_r.jpg&&
果壳死理性派:()----------------------- ----------------------- ----------------------- -----------------------并附自己的150次频数统计:
&img src=&/bf8b925afc350bae735ca_b.jpg& data-rawwidth=&657& data-rawheight=&409& class=&origin_image zh-lightbox-thumb& width=&657& data-original=&/bf8b925afc350bae735ca_r.jpg&&Beta-Geomatric 分布&br&beta几何分布,即几何分布中每次的p不是固定的,没过一个柱子,你通过的概率在浮动,服从一个比较广泛意义的beta分布。&br&求条件积分,得到beta-Geomatric distribution
Beta-Geomatric 分布beta几何分布,即几何分布中每次的p不是固定的,没过一个柱子,你通过的概率在浮动,服从一个比较广泛意义的beta分布。求条件积分,得到beta-Geomatric distribution
1. 令&img src=&/equation?tex=X& alt=&X& eeimg=&1&&和&img src=&/equation?tex=Y& alt=&Y& eeimg=&1&&为两个独立的一维正态r.v.s,那么&img src=&/equation?tex=X%2BY& alt=&X+Y& eeimg=&1&&确实仍然是正态分布。&br&&br&2. &img src=&/equation?tex=X%2BY& alt=&X+Y& eeimg=&1&&的pdf&b&&u&不是&/u&&/b&&img src=&/equation?tex=0.5p_X%28%5Ccdot%29%2B0.5p_Y%28%5Ccdot%29& alt=&0.5p_X(\cdot)+0.5p_Y(\cdot)& eeimg=&1&&——后者是“&img src=&/equation?tex=X& alt=&X& eeimg=&1&&和&img src=&/equation?tex=Y& alt=&Y& eeimg=&1&&等概率的mixture”的pdf,即&img src=&/equation?tex=%5Cpi+X+%2B+%281-%5Cpi%29+Y& alt=&\pi X + (1-\pi) Y& eeimg=&1&&的pdf,其中&img src=&/equation?tex=%5Cpi& alt=&\pi& eeimg=&1&&是一个与&img src=&/equation?tex=%28X%2C+Y%29& alt=&(X, Y)& eeimg=&1&&独立的Bernoulli r.v.,参数为0.5。这里不要犯“pdf直接求和”的低级错误,起码一个合法的pdf必须积分为1.&br&&br&3. 再次澄清一下一个(不可思议地常见的)错误:“根据中心极限定理,样本量足够大时样本分布趋于正态”。中心极限定理说的是,一定条件下样本均值的分布趋于正态,绝不是样本分布趋于正态。这着实令我怀疑国内很多大学教概率论课根本就没强调这一点。&br&&br&参考:&a href=&https://en.wikipedia.org/wiki/Mixture_distribution& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Mixture distribution&i class=&icon-external&&&/i&&/a&
1. 令X和Y为两个独立的一维正态r.v.s,那么X+Y确实仍然是正态分布。2. X+Y的pdf不是0.5p_X(\cdot)+0.5p_Y(\cdot)——后者是“X和Y等概率的mixture”的pdf,即\pi X + (1-\pi) Y的pdf,其中\pi是一个与(X, Y)独立的Bernoulli r.v.,参数为0.5。这里不要犯“p…
应该是计算卷积,而不是直接做和
应该是计算卷积,而不是直接做和
如果&img src=&/equation?tex=X%5Csim+N%28%5Cmu_%7BX%7D+%2C%5Csigma_%7BX%7D%5E%7B2%7D%29& alt=&X\sim N(\mu_{X} ,\sigma_{X}^{2})& eeimg=&1&& 与&img src=&/equation?tex=Y%5Csim+N%28%5Cmu_%7BY%7D+%2C%5Csigma_%7BY%7D%5E%7B2%7D%29& alt=&Y\sim N(\mu_{Y} ,\sigma_{Y}^{2})& eeimg=&1&& 是统计独立的常态随机变量,那么:&br&它们的和也满足正态分布&img src=&/equation?tex=U%3DX%2BY%5Csim+X%5Csim+N%28%5Cmu_%7BX%7D%2B%5Cmu_%7BY%7D+%2C%5Csigma_%7BX%7D%5E%7B2%7D%2B%5Csigma_%7BY%7D%5E%7B2%7D%29& alt=&U=X+Y\sim X\sim N(\mu_{X}+\mu_{Y} ,\sigma_{X}^{2}+\sigma_{Y}^{2})& eeimg=&1&&。&br&&br&我想你问的应该是这个性质吧?证明过程见维基百科 &a href=&http://en.wikipedia.org/wiki/Sum_of_normally_distributed_random_variables& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Sum of normally distributed random variables&i class=&icon-external&&&/i&&/a&。
如果X\sim N(\mu_{X} ,\sigma_{X}^{2}) 与Y\sim N(\mu_{Y} ,\sigma_{Y}^{2}) 是统计独立的常态随机变量,那么:它们的和也满足正态分布U=X+Y\sim X\sim N(\mu_{X}+\mu_{Y} ,\sigma_{X}^{2}+\sigma_{Y}^{2})。我想你问的应该是这个性质吧?证明过程见维基百科
设若&img src=&/equation?tex=X+%5Csim+N%28%5Cmu_X%2C+%5Csigma_X%5E2%29& alt=&X \sim N(\mu_X, \sigma_X^2)& eeimg=&1&&且&img src=&/equation?tex=Y+%5Csim+N%28%5Cmu_Y%2C+%5Csigma_Y%5E2%29& alt=&Y \sim N(\mu_Y, \sigma_Y^2)& eeimg=&1&&, 则其比值&img src=&/equation?tex=X%2FY& alt=&X/Y& eeimg=&1&&的分度密度由下式给出:&br&&br&&img src=&/equation?tex=f%28t%29+%3D+%5Cfrac%7Bb_td_t%7D%7Ba%5E3_t%7D%5Cfrac%7B1%7D%7B%5Csqrt%7B2+%5Cpi%7D%5Csigma_X+%5Csigma_Y%7D+%5CBig%28+%5CPhi%28b_t+%2F+a_t%29+-+%5CPhi%28-b_t+%2F+a_t%29+%5CBig%29+%2B+%5Cfrac%7B1%7D%7Ba%5E2_t+%5Cpi+%5Csigma_X+%5Csigma_Y%7De%5E%7B-c%2F2%7D& alt=&f(t) = \frac{b_td_t}{a^3_t}\frac{1}{\sqrt{2 \pi}\sigma_X \sigma_Y} \Big( \Phi(b_t / a_t) - \Phi(-b_t / a_t) \Big) + \frac{1}{a^2_t \pi \sigma_X \sigma_Y}e^{-c/2}& eeimg=&1&&,&br&&br&其中&br&&br&&img src=&/equation?tex=a_t%3D+%5Csqrt%7Bt%5E2+%2F+%5Csigma%5E2_X+%2B+1%2F+%5Csigma%5E2_Y%7D& alt=&a_t= \sqrt{t^2 / \sigma^2_X + 1/ \sigma^2_Y}& eeimg=&1&&,&br&&img src=&/equation?tex=b_t+%3D+t+%5Cmu_+X+%2F+%5Csigma_X%5E2+%2B+%5Cmu_Y+%2F+%5Csigma%5E2_Y& alt=&b_t = t \mu_ X / \sigma_X^2 + \mu_Y / \sigma^2_Y& eeimg=&1&&,&br&&img src=&/equation?tex=c+%3D+%5Cmu_X%5E2+%2F+%5Csigma%5E2_X++%2B+%5Cmu_Y%5E2+%2F+%5Csigma%5E2_Y& alt=&c = \mu_X^2 / \sigma^2_X
+ \mu_Y^2 / \sigma^2_Y& eeimg=&1&&,&br&&img src=&/equation?tex=d_t+%3D+%5Cexp+%5CBig%5C%7B+%5Cfrac%7Bb%5E2_t-ca_t%5E2%7D%7B2a%5E2_t%7D+%5CBig%5C%7D& alt=&d_t = \exp \Big\{ \frac{b^2_t-ca_t^2}{2a^2_t} \Big\}& eeimg=&1&&,&br&&img src=&/equation?tex=%5CPhi%28%5Ccdot%29& alt=&\Phi(\cdot)& eeimg=&1&&是标准正态分布的累积分布函数。&br&&br&特别的,如果&img src=&/equation?tex=%5Cmu_X+%3D+%5Cmu_Y+%3D+0& alt=&\mu_X = \mu_Y = 0& eeimg=&1&&, 并且&img src=&/equation?tex=%5Csigma_X+%3D+%5Csigma_Y%3D+1& alt=&\sigma_X = \sigma_Y= 1& eeimg=&1&&,即&img src=&/equation?tex=X%2CY& alt=&X,Y& eeimg=&1&&是独立的标准正态分布, 则上述&img src=&/equation?tex=f%28t%29& alt=&f(t)& eeimg=&1&&化简为&br&&br&&img src=&/equation?tex=f%28t%29+%3D+%5Cfrac%7B1%7D%7B%5Cpi%7D+%5Cfrac%7B1%7D%7B1+%2B+t%5E2%7D& alt=&f(t) = \frac{1}{\pi} \frac{1}{1 + t^2}& eeimg=&1&&,&br&&br&是中心在原点的Cauchy分布。其实是个好问题,是我一开始疏忽了。惭愧~
设若X \sim N(\mu_X, \sigma_X^2)且Y \sim N(\mu_Y, \sigma_Y^2), 则其比值X/Y的分度密度由下式给出:f(t) = \frac{b_td_t}{a^3_t}\frac{1}{\sqrt{2 \pi}\sigma_X \sigma_Y} \Big( \Phi(b_t / a_t) - \Phi(-b_t / a_t) \Big) + \frac{1}{a^2_t \pi \sigma_X…
这道题目不是解分布的问题,其实就是一个全微分啦&br&&img src=&/equation?tex=r+%3D+%5Cfrac%7B%5Crho_A%7D%7B%5Crho_M%7D& alt=&r = \frac{\rho_A}{\rho_M}& eeimg=&1&&,则&img src=&/equation?tex=d_r+%3D+%5Cfrac%7B%5Cpartial+r%7D%7B%5Cpartial+%5Crho_A%7D+d_%7B%5Crho_A%7D+%2B%5Cfrac%7B%5Cpartial+r%7D%7B%5Cpartial+%5Crho_M%7D+d_%7B%5Crho_M%7D+%3D+%5Cfrac%7Bd_%7B%5Crho_A%7D%5Crho_M-d_%7B%5Crho_M%7D%7D%7B%5Crho%5E2_M%7D& alt=&d_r = \frac{\partial r}{\partial \rho_A} d_{\rho_A} +\frac{\partial r}{\partial \rho_M} d_{\rho_M} = \frac{d_{\rho_A}\rho_M-d_{\rho_M}}{\rho^2_M}& eeimg=&1&&&br&均值显然。然后你把浓度,误差带进去就求得比率的不确定度了。
这道题目不是解分布的问题,其实就是一个全微分啦r = \frac{\rho_A}{\rho_M},则d_r = \frac{\partial r}{\partial \rho_A} d_{\rho_A} +\frac{\partial r}{\partial \rho_M} d_{\rho_M} = \frac{d_{\rho_A}\rho_M-d_{\rho_M}}{\rho^2_M}均值显然。然后你把…
让Z = X1 / X2. Z 的密度函数则是&img src=&/equation?tex=%5Cint+%7Cx_2%7Cf_%7BX_1%7D%28zx_2%29+f_%7BX_2%7D%28x_2%29+dx_2%0A& alt=&\int |x_2|f_{X_1}(zx_2) f_{X_2}(x_2) dx_2
& eeimg=&1&&。&br&&br&把这个问题的两个密度函数带入x_1, x_2。目测积分无法求出显式表达(会包含关于a的函数“正态分布大于a的部分的期望”),自己动手算吧。
让Z = X1 / X2. Z 的密度函数则是\int |x_2|f_{X_1}(zx_2) f_{X_2}(x_2) dx_2
。把这个问题的两个密度函数带入x_1, x_2。目测积分无法求出显式表达(会包含关于a的函数“正态分布大于a的部分的期望”),自己动手算吧。
经常用类似的题目来面试我们部门的应聘者。这个问题其实没有那么复杂,可以直接积分求解。&br& 设&img src=&/equation?tex=N%28x%29& alt=&N(x)& eeimg=&1&& 和 &img src=&/equation?tex=n%28x%29& alt=&n(x)& eeimg=&1&& 分别为正态分布的累积分布函数和密度分布函数。&br&要求的是&br&&img src=&/equation?tex=E%5Cleft%5B+X+%7C+X+%3C+N%5E%7B-1%7D+%28%5Calpha%29+%5Cright%5D+& alt=&E\left[ X | X & N^{-1} (\alpha) \right] & eeimg=&1&&&br&利用 &img src=&/equation?tex=x+n%28x%29+dx+%3D+-d+n%28x%29+& alt=&x n(x) dx = -d n(x) & eeimg=&1&&
(这个很容易验证),可以得到&br&&img src=&/equation?tex=E%5Cleft%5B+X+%7C+X+%3C+N%5E%7B-1%7D+%28%5Calpha%29+%5Cright%5D+%3D%5Cfrac%7B1%7D%7B%5Calpha%7D+%5Cint_%7B-%5Cinfty+%7D%5E%7BN%5E%7B-1%7D%28%5Calpha%29%7D+x+n%28x%29+dx+%3D+-%5Cfrac%7B1%7D%7B%5Calpha%7D+%5Cint_%7B-%5Cinfty+%7D%5E%7BN%5E%7B-1%7D%28%5Calpha%29%7D++d+n%28x%29%3D-%5Cfrac%7B1%7D%7B%5Calpha%7D+n%5Cleft%28N%5E%7B-1%7D%28%5Calpha%29%5Cright%29& alt=&E\left[ X | X & N^{-1} (\alpha) \right] =\frac{1}{\alpha} \int_{-\infty }^{N^{-1}(\alpha)} x n(x) dx = -\frac{1}{\alpha} \int_{-\infty }^{N^{-1}(\alpha)}
d n(x)=-\frac{1}{\alpha} n\left(N^{-1}(\alpha)\right)& eeimg=&1&&&br&这就是答案。通过这个公式可以可容易的对不同的&img src=&/equation?tex=%5Calpha& alt=&\alpha& eeimg=&1&&通过Excel等计算出数值。&br&比如当&img src=&/equation?tex=%5Calpha%3D0.0258& alt=&\alpha=0.0258& eeimg=&1&&时, 可求得&img src=&/equation?tex=E%5Cleft%5B+X+%7C+X+%3C+N%5E%7B-1%7D+%28%5Calpha%29+%5Cright%5D+%3D-2.326& alt=&E\left[ X | X & N^{-1} (\alpha) \right] =-2.326& eeimg=&1&&, 很接近&img src=&/equation?tex=N%280.01%29& alt=&N(0.01)& eeimg=&1&&的数值。这个结论在金融风险分析中很常用到。因为这说明当风险分布接近正态时可以用2.58%的tail average去计算1%的value at risk. 这在观测数据量不足的时候非常有用,因为比起直接求percentile, 尾部期望更有效的利用了数据, 估值更稳定。风险管理中常用的一个近似是从264天(一年的交易天数)的历史观测值取最小的7个值求平均计算1%VaR就是利用了这个性质。
经常用类似的题目来面试我们部门的应聘者。这个问题其实没有那么复杂,可以直接积分求解。 设N(x) 和 n(x) 分别为正态分布的累积分布函数和密度分布函数。要求的是E\left[ X | X & N^{-1} (\alpha) \right] 利用 x n(x) dx = -d n(x) (这个很容易验证),可…
占坑&br&&br&直接用Monte Carlo方差会很大,需要用Girsanov theorem来做importance sampling&br&&br&F^-1(x)有可以用多项式近似出来,不过在远端尾部也不太准。
占坑直接用Monte Carlo方差会很大,需要用Girsanov theorem来做importance samplingF^-1(x)有可以用多项式近似出来,不过在远端尾部也不太准。
&p&可以用蒙特卡洛法&/p&
可以用蒙特卡洛法  一群变量值可能用平均数描述集中的位置,用变异指标描述离散情况,而频数表则把变量值的分布描绘得更具体。为了直观还可把频数表画成直方图。如第四章中曾将7岁男童坐高的频数分布绘成图4.1。从图中可看出数据集中均数周围,左右基本对称,离均数愈近数据愈多,离均数愈远数据愈少的特点。医学科研中如健康人的红细胞数、血红蛋白量、血清总胆固醇,同年龄同性别儿童的身高、体重等,虽然数据各异,但画出的直方图图形是类似的。可以设想,这种类型的资料,如果调查例数无限增多,所用组距又无限的小,那么直方顶端就连成了一条光滑的曲线。这条曲线,典型地反映了这类资料的分布情况,数学上称为正态曲线,其方程为
  式中n为总频数,X为变量值,μ为均数,σ为标准差,Y为纵高,e=2.71828……,π=3.14158……。在一个总体中n、μ、σ、e、π都是常数,只有X在变,所以Y=f(x)。
  式(5.1)亦可写成:
  由上式可看出曲线的性质:
  1.曲线左右对称。X-μ无论是正或负,只要绝对值就相等,Y值就相等。所以只要X与μ的距离相等,Y就相等。Y值以X=μ为对称轴。
  2.中位数、均数、众数重合。正态曲线在横轴上方。当X=μ时,e0=1,Y为极大,所以均数与众数密合。由于曲线左右对称,所以均数亦即中位数。e的指数愈大,Y愈小,但不会得负值,所以Y&0,曲线在横轴上方。
  3.随着(X-μ/σ)的绝对值的增加,曲线由平均数所在点向左右两方迅速下降。
  4.离平均数左右1σ处为曲线拐点。在μ±σ以内曲线向下弯曲,以外则向上弯曲。
  这种类型的资料,数据值虽各不相同,但都有其均数与标准差,如果横轴上各以其均数为原点,标准差为单位,并令x=X-μ,那么(X-μ)/σ可写成x/σ,称为正态离差u,
  再令总频数为1。这时曲线以μ为原点,以σ为单位,称为标准正态曲线,其公式为
  以μ为均数,σ2为方差的正态分布可记为N(μ,σ2),因此标准正态分布可记为N(0,1)。
图5.2 标准正态曲线
(责任编辑:littleman)
)不惟一,请检查页面html!');
| 胡小龙:从超续航电池、POCT到移动医疗的创
| 未见抓手空谈事,终端反馈遥无期--移动医疗
| 许晓椿:干细胞产业发展 好戏还在后面
旗下网站:
Copyright & 2001- 版权所有 不得转载.版权所有&佛山市数苑科技信息有限公司数苑网 粤ICP备号

我要回帖

更多关于 二维正态分布 的文章

 

随机推荐