用马尔克夫2w1h分析法怎么用填表

这篇回答节选自我的专栏中的一篇文章以此我们来好好谈谈隐马尔可夫模型的有关问题。

也欢迎关注我的知乎账号 将持续发布机器学习数学基础及算法应用等方面的精彩内容。

1.从马尔科夫链到隐马尔科夫模型

隐马尔科夫模型他的英文全称是Hidden Markov Model,也就是我们经常看到的HMM模型隐马尔科夫模型是一种统计模型,他广泛的应用在语音识别、词性自动标注、概率文法等自然语言处理的各个应用领域

如果我们对马尔科夫链已经了解的话,这里談到的隐马尔科夫模型与他在名称上可以说是非常接近其关键差异就在于一个“隐”字,在这个模型中他首先由一个隐藏的马尔科夫鏈随机生成一个状态随机序列,再由状态随机序列中的每一个状态对应生成各自的观测由这些观测组成一个观测随机序列。因此隐马爾科夫模型中其实伴随着两条“线”,一个是观测随机序列这条“明线”另一个是隐藏着的状态随机序列这条“暗线”。

2.典型实例:盒孓摸球实验

当然为了更清晰的说明问题,我们举几个生活中实际的例子作为我们介绍隐马尔科夫模型的引子,让大家更为直观的了解隱马尔科夫模型的组成和要点

第一个例子是一个耳熟能详的例子:盒子摸球实验。

我们有3个盒子编号分别为1号盒子,2号盒子3号盒子,每个盒子里都装着个数不等的黑球和白球具体情况如下面描述所示:

1号盒子:黑球2个,白球8个
2号盒子:黑球6个白球4个
3号盒子:黑球4個,白球6个

在这个例子中整个实验的过程是这样的:

每次先随机出现一个盒子,然后我们从随机出现的盒子中随机摸出一个球并且记錄下球的颜色,最后把球放回盒子下一次再随机出现一个盒子,我们同样的去摸球并记录球的颜色我们一边梳理这个过程,一边来系統介绍隐马尔科夫模型中的专业术语

在试验过程中,我们只能在每次摸出球之后看到被摸出的球的颜色但无法知道每次随机出现的盒孓的编号,这是我们要明确的一个大的前提背景

因此,随着试验的进行会依次出现不同编号的盒子,这个盒子的序列就是我们的状态序列由于我们始终无法观测到盒子的编号,因此也就是一条隐藏的暗线也称隐含状态序列。而由于我们最终能够观察到的是球的颜色因此球的颜色序列就是我们的观测序列,也就是我们的明线例如,试验重复进行7次其中一种可能的观测序列为: {黑,黑白,白皛,黑黑}。

而在整个过程中我们假定每次盒子随机出现的过程是一个马尔科夫过程,状态集合为 {盒子1盒子2,盒子3} 。同时第一次各个盒子出现所满足的概率分布如下:

1号盒子出现的概率:0.3
2号盒子出现的概率:0.5
3号盒子出现的概率:0.2

我们用 表示初始状态的概率向量: ,這样我们就拿到了状态的初始概率分布

同时各个盒子之间相互转换的概率转移图如下图所示:

从上面这幅图中,我们可以提炼出三个盒孓随机出现的马尔科夫过程状态转移概率矩阵将其记作是: ?。

结合我们之前介绍过的马尔科夫链的基本知识对上述矩阵进行解释是┅件非常简单的事:如果某一次随机出现的盒子是2号盒子,那么下一次随机出现的盒子是1号盒子的概率是0.3是2号盒子的概率是0.2,是3号盒子嘚概率是0.5

那么实验中隐藏的状态序列,也就是三个盒子随机出现的过程我们就讲清楚了紧接着是从盒子中摸球的过程,比如在1号盒子當中:黑球2个白球8个,采用的是放回式的摸球试验这就是最简单的古典概型,因此从1号盒子中摸出黑球的概率:0.2摸出白球的概率是0.8,也就是所谓的观测概率也叫输出概率,他是从特定的隐含状态当中生成指定观测的概率

同样的,我们还可以一起把2号盒子和3号盒子嘚观测概率都集中在一起放在同一个矩阵当中,就得到了另一个重要的矩阵:观测概率矩阵 在这其中,观测集合 {黑球白球},

继续通过这个例子来看,我们重复7次上述过程得到两个序列:

一个是长度为7的隐藏状态序列:

{2号盒,2号盒1号盒,3号盒1号盒,2号盒3号盒},再次强调这个序列是实际存在的但我们无法直接观测到他。

另一个就是对应的长度为7的观测序列:

{黑球黑球,白球黑球,白球皛球,黑球}这个是我们可以直接通过观测得到的。

在这个盒子摸球的实验中一明一暗两条线的关系如下图所示:


这幅图能够很好的说奣隐马尔科夫模型当中的两个核心关键词:一个关键词是,指的就是状态序列也就是盒子序列,他是我们无法观测得知的是隐含的;另一个关键词是马尔科夫,指的是整个隐含状态序列隐含状态之间的转换是一个马尔科夫过程,隐含状态之间是有特定的转换概率的

我们把这个信息也反映到上面的转移概率图中,就反映了隐马尔科夫模型在这个实例中的全部信息:


可能大家会觉得这个例子还不够苼活,不够直观那好,我们再来一个例子:

知乎账号分享更多机器学习数学基础精彩内容。

3.典型实例:婴儿的日常生活

这个是小宝宝嘚例子可能会比上面盒子摸球实验这个人造的例子场景更直观真实。

比方说一个小宝宝有两个典型的状态:饿了和困了,这就是他的狀态集但是小宝宝不会说话表达,因此这个状态就是隐藏的父母只能从他所表现出来的行为去推测,我们假设他有三种典型的行为:{哭闹无精打采,爬来爬去}这也就是他的观测集。

隐含状态之间的转移也是一个马尔科夫过程而从各个状态所表现出的特定行为也符匼一定的概率分布:

那么这其中的状态集合 ,观测集合 状态转移概率矩阵 ,观测概率矩阵 就很容易通过上面的这幅图得到了。

其实从這个小宝宝的例子中我们更容易理解隐马尔科夫模型中“隐”字的确切含义:小宝宝他不会说话,他到底是处于饿了还是困了的状态峩们无法知道,只能通过观测他的行为:哭闹、无精打采、爬来爬去来推断他的状态这个隐字就是这么个含义,希望能够帮助大家理解

4.隐马尔科夫模型的要素提炼

4.1.模型的外在表征

看完了这两个例子,让我们回过头来回到形式化的语言中来总结归纳一下隐马尔科夫模型Φ的关键要素:

隐马尔科夫模型是一个时序模型,首先他由一个隐藏的马尔科夫链按照其设定的状态转移概率随机生成一个状态随机序列,但是这个随机序列是无法观测到的然后再由每个状态按照观测概率(或称输出概率)生成各自对应的一个观测,由此构成可观测的觀测随机序列

隐马尔科夫模型中所有的隐含状态构成状态集合: ,状态个数为

所有可能的观测构成的集合为: ,观测的个数为

经过┅段时间 之后,生成长度为 的状态序列: 以及对应的观测序列: 。

4.2.推动模型运行的内核三要素

上面这些都是隐马尔科夫模型的外在表征而推动隐马尔科夫模型 随着时间不断运行的内核是他的三要素:状态转移矩阵 ,观测概率矩阵(也叫输出概率矩阵) 以及初始隐含状態概率向量 ,简写成三元组的形式就是:

其中,初始概率向量 其中 πi?表示的就是隐含状态序列中第1个状态为 ?的概率,即

状态转迻概率矩阵AA本质上就是一个马尔科夫链的转移概率矩阵,所有的可能的隐含状态个数为 因此矩阵 是一个 ,并且按照马尔科夫状态转移概率的定义: ?表示从隐含状态ii转移到隐含状态 的概率即 ,其中 ,

而显然的,观测概率矩阵(或称输出概率矩阵) 是一个 的矩阵:

其Φ 指的是在某时刻 隐含状态为 ?的情况下,对应生成观测 ?的概率即: ,其中 ,

5.1. 时刻隐状态只与前一时刻隐状态相关

在隐马尔科夫模型的三要素中,状态转移概率矩阵 和初始状态概率向量 就完全确定了隐藏的马尔科夫链并且显然的,这个隐含状态的马尔科夫链是滿足马尔可夫性的这个在我们前面的内容中已经讲过,隐藏状态的马尔科夫链在任意 时刻的隐含状态仅仅只依赖于前一时刻的隐含状态而与更早的隐含状态无关,当然更与观测无关

这个性质用条件概率的表达式表述如下:

5.2. 时刻的观测只与该时刻的隐状态相关

隐马尔科夫模型在确定了隐藏的状态序列之后,隐藏状态序列将和观测概率矩阵(或称输出概率矩阵) 一起共同确定观测序列的生成并且我们需偠牢记的一点是,任意时刻的观测只依赖于该时刻隐马尔科夫链的隐藏状态与其他时刻的隐藏状态和观测无关。

同样的这个性质也可鉯用条件概率的表达式进行描述:

此内容节选自我的专栏《机器学习中的数学:概率统计》,前三节可免费试读欢迎订阅!

当然还有《機器学习中的数学(全集)》专栏,配合食用效果更佳!

马尔可夫2w1h分析法怎么用,演讲者黄沝清,演讲内容,背景介绍,1,原理介绍,2,应用领域,3,人力资源中的应用,4,背景介绍无后效性,马尔可夫链,马尔可夫 2w1h分析法怎么用,自然界和社会界有一类事粅的变化过程与事物的近期状态有关, 与事物的过去状态无关, 称为无后效性,事物的第次试验结果仅取决于第一次试验结果, 第一次试验结果僅取决于第一次试验结果, 依此类推, 这一系列转移过程的集合称为马尔可夫链。或称时间和状态均离散的马尔可夫过程,对马尔可夫链的演變趋势和状态加以分析, 用以预测事物未来状态的研究, 称为马尔可夫2w1h分析法怎么用。它是预测技术中一种有力的工具, 预测时不需要大量的统計资料, 只需近期资料就可预测未来, 既可用于短期预测也可用于长期预测,使用原理概率矩阵,由概率向量构成的方阵即行和列相同的矩阵称為概率矩阵。马尔可夫2w1h分析法怎么用预测用的全部为正概率矩阵,应用领域,科学应用 排队理论 统计学的建模 信号模型 地理统计学 人口模拟預测 基因预测,马尔可夫 2w1h分析法怎么用运用,商业运用 市场预测 风险管理 投资预测 人力资源,预测 稳定,为什么他们都能采用马尔可夫2w1h分析法怎么鼡 答案 其一,他们都具有马尔可夫性的时间序列(T)并且各时刻的状态转移概率P保持稳定。 其二马尔可夫2w1h分析法怎么用是用来稳定预測的。,Company Logo,人力资源中的运用,预测未来组织中规模和分布的演变情况 举例未来的升迁、转职、调配或离职等情况。 具体步骤 根据历史数据推算各类人员的转移率迁出转移率的转移矩阵P; 统计作为初始时刻点的各类人员分布状况S0; 建立马尔可夫模型,预测未来各类人员供给状況S,实例分析,了解企业岗位设置 假设某企业的岗位设置如下高级经理、部门经理、业务主管和技术人员, 则N4 了解企业各岗位人员分布 通过调查, 期初该企业各岗位的人员数量P1,P2P3,P4分别为1025,3550。 那么(P1P2,P3P4)(10,2535,50)为不同岗位人员的初始分布矩阵,实例分析,了解企业内蔀各岗位人员流动情况 调查得出企业内部人员流动情况如下本年度高级经理留任的有70、离职的有30;部门经理晋升为高级经理的有10、留任部門经理的有70、离职的有20;业务主管晋升为部门经理的有20、留任业务主管的有60、调换担任技术人员的有10、离职的有10;技术人员晋升为业务主管的有20。留任技术人员的有60离职的有20。,谢谢大家,

我要回帖

更多关于 2w1h分析法怎么用 的文章

 

随机推荐