这个例子,妙!

引言

坊间有流传过这么一段《胡适留学日记》:

7月4日: 新开这本日记,也为了督促自己下个学期多下些苦功。先要读完手边的莎士比亚的《亨利八世》。 7月13日: 打牌。 7月14日: 打牌。 7月15日: 打牌。 7月16日: 胡适之啊胡适之!你怎么能如此堕落!先前订下的学习计划你都忘了吗?子曰:“吾日三省吾身。”不能再这样下去了! 7月17日: 打牌。 7月18日: 打牌。

且不论真假,突然觉得倒是很合适用来作为 Hidden Markov Model (HMM) 的例子来讲的,因为和书上课上讲的例子,天气呀遛狗啊还是马克杯啊什么的,果然还是这个比较好玩一点啊。

例子

假设小明有很严重的拖延症,在每一天他会处于没有拖延症的正常状态 Normal、以及不同程度的拖延症 Light、Heavy 和 Critical 状态中的一种。每天的状态会随着前一天所处的状态不同而发生改变,转移方式如图 (fig: 1) 所示。

简单来说:小明一开始会处于正常状态,不过由于他拖延症非常严重,第二天毫无悬念地会进入轻度拖延症状态。在轻度拖延症状态中有很大的概率 (0.7) 会进入重度拖延症状态或者以 0.3 的概率维持在轻度拖延症状态中。一旦进入到重度拖延症状态,他会以 0.8 的概率一直保留在那个状态,或者有比较小的几率 (0.2) 进入“致命拖延”状态。在“致命拖延”状态中度过一天之后小明会幡然醒悟,下定决心重新做人,并在第二天成功回复正常状态。然后……周而复始、世袭罔替……

图 1 小明的拖延症状态转移图

不过,小明的拖延症状态是“隐藏”在他大脑里的(这也是 HMM 中 Hidden 的由来),他自己也搞不清楚。但是我们知道他在不同的状态下会做什么样的事情。

状态

打牌的概率

不打牌的概率

Normal

0

1

Light

0.3

0.7

Heavy

0.8

0.2

Critical

1

0

3 件事

虽然我们没法把小明的脑袋打开看看里面的寄存器是什么状态,但是我们可以偷看小明的日记观察小明的日常生活。通过这些历史数据,我们可以做这样一些事情:

给定小明某一段时间的日记(打牌、不打牌),计算该日记所记录的日常生活是来自于小明的拖延症模型的概率。

给定小明某一段时间的日记,推断出每一天小明最有可能处在什么状态。

另外,如果我们并不事先知道小明的拖延症模型(状态转移和不同状态下的行为),如果有足够多的历史数据(日记),我们还可以做的第三件事情:估计小明的拖延症模型参数。

这三件事正好对应了 HMM 中的三个任务,分别是 Scoring、Matching (或者 Decoding)、Traing (或者 Learning)。

对应这三个任务分别有三个算法:

  1. Scoring: Forward-Backward 算法,是 Graphical Model 里的 Sum-Product 算法的特例。
  2. Matching: Viterbi 算法,是 Graphical Model 里的 Max-Product 算法的特例。
  3. Training: Baum-Welch 算法,是 EM 算法的特例。

相关链接

[1] http://freemind.pluskid.org/machine-learning/hmm-definition/

点击以下标题查看相关内容:

  • 深度学习|大师之作,必是精品
  • 免费送6本精选的算法,机器学习,深度学习的书
  • 机器学习、深度学习干货分享
  • 自然语言处理|语言模型介绍
  • 自然语言处理之词To词向量
  • 一文了解自然语言处理的每个范畴用到的核心技术,难点和热点(1)
  • NLP入门:CNN,RNN应用文本分类,个性化搜索,苹果和乔布斯关系抽取(2)
  • 下一代信息服务新风口:以自然语言为基本输入方式的问答系统综述(附两篇论文)
  • 一文梳理NLP之机器翻译和自动摘要的发展现状
  • 斯坦福大学NLP课程笔记系列1:深度学习应用于NLP介绍
  • TensorFlow 实战 3层网络求解嵌入词向量,附代码详解
  • 1个例子解释 隐马尔科夫模型(HMM) 的 5 个基本要素
  • 这是 隐马尔科夫模型(HMM) 的 2 个基本假设

原文发布于微信公众号 - Python与机器学习算法频道(alg-channel)

原文发表时间:2018-04-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏深度学习与数据挖掘实战

【AI头条&优质资源】时间序列预测模型:使用深度神经网络RNN+Attention机制

放arxiv那天看了一下,整篇paper思路读下来还是非常清晰的,实验效果也很不错。

2862
来自专栏机器学习人工学weekly

机器学习人工学weekly-2018/7/15

Capture the Flag: the emergence of complex cooperative agents

1383
来自专栏AI科技大本营的专栏

葵花宝典之机器学习:全网最重要的AI资源都在这里了(大牛,研究机构,视频,博客,书籍,Quora......)

翻译 | AI科技大本营(rgznai100) 参与 | Joe,焦燕 2000年早期,Robbie Allen在写一本关于网络和编程的书的时候,深有感触。他发...

4214
来自专栏量子位

一样的打游戏,不一样的酷

夏乙 问耕 假装发自 凹非寺 量子位 出品 | 公众号 QbitAI ? 假期模式已经开启了~ 学生党已经赋闲在家,工业党不少也已带着橘子返乡。 阖家欢乐,面对...

3707
来自专栏IT派

推荐|Kaggle机器学习之模型融合(stacking)心得

此文道出了本人学习Stacking入门级应用的心路历程。 在经过了几天漫长的查询资料和整理,脑子不好,理解顿悟花了不少时间。在学习过程中感谢@贝尔塔的模型融合...

4545
来自专栏AI科技大本营的专栏

AI 技术讲座精选:条件概率和贝叶斯定理简介

前 言 数据科学专家必须了解概率方面的知识。通常情况下,解决许多数据科学难题的办法与概率的本质息息相关。因此,更好地理解概率能够帮助你更有效率地理解并实现与之相...

3455
来自专栏机器学习人工学weekly

机器学习人工学weekly-2018/3/4

1. RL相关 1.1 inverse RL教程,第一部分就是讲Andrew Ng 20年前的奠基论文(我没读原论文,但是惊讶的发现居然全部是用的LP解的)。这...

4698
来自专栏大数据杂谈

【Excel系列】Excel数据分析:参数估计

一、描述统计 在数据分析的时候,一般首先要对数据进行描述性统计分析(Descriptive Analysis),以发现其内在的规律,再选择进一步分析的方法。描述...

2546
来自专栏AI科技大本营的专栏

快讯 | 玩游戏玩出一篇论文,清华大学团队获信息检索顶会 SIGIR 最佳学生论文奖

作者|周翔 最近几个月,以《王者荣耀》为代表的游戏受到了各方的攻击,其中以家长和老师的反应最为激烈。不过,玩物真的就一定会丧志吗?清华大学的几位学霸告诉你,玩游...

3337
来自专栏AI派

教你用一行Python代码识别裸体图片

有一种职业叫做:鉴黄师,这是一个令很多人羡慕嫉妒恨的职业,直白来说就是判断图片是不是色情图片。今天我们交给大家如何使用 Python 来做识别裸体图片。

1792

扫码关注云+社区