文章/答案/技术大牛

发布

社区首页 >问答首页 >在一元语言模型中计算的概率是多少？

问在一元语言模型中计算的概率是多少？
EN

Stack Overflow用户

提问于 2016-05-01 21:46:23

回答 1查看 1.8K关注 0票数 1

我创建了一个用于句子补全实现的unigram语言模型。我有所有单词和它们的出现次数。

我对如何从这里比较它们感到困惑。我认为我必须计算每一种情况的概率，并取最大的一种。

因此，如果我有3个单词可以使用，我比较每个单词的出现次数，并取最高的？这是正确的实现吗？

或者我将每个单词的出现次数除以所有单词的出现次数(distinct?)训练集的单词？

谢谢。

python

nlp

n-gram

sentence

sentence-similarity

回答 1

Stack Overflow用户

发布于 2016-05-01 22:07:11

如果你不想使用任何平滑(Turing，Kneser-Ney等)，取每个单词(表单)的原始计数，并将它们除以语料库(文本)的总字数。这将为您提供每个单词的概率。现在，您并不总是选择概率最高的文本，因为您生成的文本将如下所示：

'the the the the the the the ...'

取而代之的是，你必须根据它们的概率来选择单词(查看here以获得解释)。

顺便说一句，如果你想要改进它的建议，你必须发布代码。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/36967388

复制

相似问题

问在一元语言模型中计算的概率是多少？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在一元语言模型中计算的概率是多少？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在一元语言模型中计算的概率是多少？
EN