这个例子,妙!

引言

坊间有流传过这么一段《胡适留学日记》:

7月4日: 新开这本日记,也为了督促自己下个学期多下些苦功。先要读完手边的莎士比亚的《亨利八世》。 7月13日: 打牌。 7月14日: 打牌。 7月15日: 打牌。 7月16日: 胡适之啊胡适之!你怎么能如此堕落!先前订下的学习计划你都忘了吗?子曰:“吾日三省吾身。”不能再这样下去了! 7月17日: 打牌。 7月18日: 打牌。

且不论真假,突然觉得倒是很合适用来作为 Hidden Markov Model (HMM) 的例子来讲的,因为和书上课上讲的例子,天气呀遛狗啊还是马克杯啊什么的,果然还是这个比较好玩一点啊。

例子

假设小明有很严重的拖延症,在每一天他会处于没有拖延症的正常状态 Normal、以及不同程度的拖延症 Light、Heavy 和 Critical 状态中的一种。每天的状态会随着前一天所处的状态不同而发生改变,转移方式如图 (fig: 1) 所示。

简单来说:小明一开始会处于正常状态,不过由于他拖延症非常严重,第二天毫无悬念地会进入轻度拖延症状态。在轻度拖延症状态中有很大的概率 (0.7) 会进入重度拖延症状态或者以 0.3 的概率维持在轻度拖延症状态中。一旦进入到重度拖延症状态,他会以 0.8 的概率一直保留在那个状态,或者有比较小的几率 (0.2) 进入“致命拖延”状态。在“致命拖延”状态中度过一天之后小明会幡然醒悟,下定决心重新做人,并在第二天成功回复正常状态。然后……周而复始、世袭罔替……

图 1 小明的拖延症状态转移图

不过,小明的拖延症状态是“隐藏”在他大脑里的(这也是 HMM 中 Hidden 的由来),他自己也搞不清楚。但是我们知道他在不同的状态下会做什么样的事情。

状态

打牌的概率

不打牌的概率

Normal

0

1

Light

0.3

0.7

Heavy

0.8

0.2

Critical

1

0

3 件事

虽然我们没法把小明的脑袋打开看看里面的寄存器是什么状态,但是我们可以偷看小明的日记观察小明的日常生活。通过这些历史数据,我们可以做这样一些事情:

给定小明某一段时间的日记(打牌、不打牌),计算该日记所记录的日常生活是来自于小明的拖延症模型的概率。

给定小明某一段时间的日记,推断出每一天小明最有可能处在什么状态。

另外,如果我们并不事先知道小明的拖延症模型(状态转移和不同状态下的行为),如果有足够多的历史数据(日记),我们还可以做的第三件事情:估计小明的拖延症模型参数。

这三件事正好对应了 HMM 中的三个任务,分别是 Scoring、Matching (或者 Decoding)、Traing (或者 Learning)。

对应这三个任务分别有三个算法:

  1. Scoring: Forward-Backward 算法,是 Graphical Model 里的 Sum-Product 算法的特例。
  2. Matching: Viterbi 算法,是 Graphical Model 里的 Max-Product 算法的特例。
  3. Training: Baum-Welch 算法,是 EM 算法的特例。

相关链接

[1] http://freemind.pluskid.org/machine-learning/hmm-definition/

点击以下标题查看相关内容:

  • 深度学习|大师之作,必是精品
  • 免费送6本精选的算法,机器学习,深度学习的书
  • 机器学习、深度学习干货分享
  • 自然语言处理|语言模型介绍
  • 自然语言处理之词To词向量
  • 一文了解自然语言处理的每个范畴用到的核心技术,难点和热点(1)
  • NLP入门:CNN,RNN应用文本分类,个性化搜索,苹果和乔布斯关系抽取(2)
  • 下一代信息服务新风口:以自然语言为基本输入方式的问答系统综述(附两篇论文)
  • 一文梳理NLP之机器翻译和自动摘要的发展现状
  • 斯坦福大学NLP课程笔记系列1:深度学习应用于NLP介绍
  • TensorFlow 实战 3层网络求解嵌入词向量,附代码详解
  • 1个例子解释 隐马尔科夫模型(HMM) 的 5 个基本要素
  • 这是 隐马尔科夫模型(HMM) 的 2 个基本假设

原文发布于微信公众号 - Python与机器学习算法频道(alg-channel)

原文发表时间:2018-04-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器学习人工学weekly

机器学习人工学weekly-2018/3/25

18380
来自专栏机器学习人工学weekly

机器学习人工学weekly-2018/3/4

1. RL相关 1.1 inverse RL教程,第一部分就是讲Andrew Ng 20年前的奠基论文(我没读原论文,但是惊讶的发现居然全部是用的LP解的)。这...

50480
来自专栏机器学习人工学weekly

机器学习人工学weekly-2018/7/15

Capture the Flag: the emergence of complex cooperative agents

15130
来自专栏生信技能树

TCGA的28篇教程-数据挖掘三板斧之ceRNA

Motivation: 目前一些计算方法都是基于2011年的那个ceRNAs假设,研究lncRNAs和miRNA靶mRNAs之间的竞争关系。但是,当mRNAs脱...

52220
来自专栏深度学习与数据挖掘实战

【AI头条&优质资源】时间序列预测模型:使用深度神经网络RNN+Attention机制

放arxiv那天看了一下,整篇paper思路读下来还是非常清晰的,实验效果也很不错。

51520
来自专栏听雨堂

地图校正方法心得

如果想校正两张比例,坐标系,时间都不同的电子地图,简直太难了,大概辛苦了一周时间,才有点心得: 1、选择公共点时,河流、公路、高程、等高线均不能选,大的固定...

22050
来自专栏AI科技大本营的专栏

AI 技术讲座精选:条件概率和贝叶斯定理简介

前 言 数据科学专家必须了解概率方面的知识。通常情况下,解决许多数据科学难题的办法与概率的本质息息相关。因此,更好地理解概率能够帮助你更有效率地理解并实现与之相...

36050
来自专栏AI科技大本营的专栏

葵花宝典之机器学习:全网最重要的AI资源都在这里了(大牛,研究机构,视频,博客,书籍,Quora......)

翻译 | AI科技大本营(rgznai100) 参与 | Joe,焦燕 2000年早期,Robbie Allen在写一本关于网络和编程的书的时候,深有感触。他发...

43840
来自专栏机器学习算法与Python学习

资源 | 这是一份非常全面的开源数据集,你真的不想要吗?

1.1K20
来自专栏量子位

一样的打游戏,不一样的酷

夏乙 问耕 假装发自 凹非寺 量子位 出品 | 公众号 QbitAI ? 假期模式已经开启了~ 学生党已经赋闲在家,工业党不少也已带着橘子返乡。 阖家欢乐,面对...

38870

扫码关注云+社区

领取腾讯云代金券