我已经成功地从NLTK HMM标签库中实现了隐马尔可夫模型,现在我想知道在标签过程中使用的每个单词,标签的每个概率。根据我所读取的,有转移概率、发射概率、初始开始概率和标签的概率。如何获得这些概率?
我在网上找过了,但没有找到。我想用自己的计算来验证标注结果,但由于我的语料库规模很大,如果逐个统计每个单词和标签概率,结果就太多了。
发布于 2018-07-13 02:24:29
我假设您使用的是NLTK3.3中的HiddenMarkovModelTagger
类。
您可以看到源here。
使用它,我们可以看到对象中有以下字段:
def __init__(self, symbols, states, transitions, outputs, priors, transform=_identity):
self._symbols = unique_list(symbols)
self._states = unique_list(states)
self._transitions = transitions
self._outputs = outputs
self._priors = priors
self._cache = None
self._transform = transform
这可能是你的问题的解决方案。
https://stackoverflow.com/questions/51213768
复制相似问题