结巴分词的过程:
jieba分词的python 代码
结巴分词的准备工作
开发者首先根据大量的人民日报训练了得到了字典库、和Hmm中的转移概率矩阵和混淆矩阵。
(2) 用动态规划查找最大概率路径问题理解
从上图可以看出切词之后,有多条路径,也就是说有歧义。这里采用动态规划的最优化搜索。
动态规划问题:
1 将原问题分解为若干个相互重叠的子问题
2分析问题是否满足最优性原理,找出动态规划函数的递推式;
3利用递推式自低向上计算,实现动态规划过程。
本文分享自 作者个人站点/博客 前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!