首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >什么是“熵和信息增益”?

什么是“熵和信息增益”?
EN

Stack Overflow用户
提问于 2009-12-07 19:54:33
回答 6查看 214.5K关注 0票数 349

我正在读这本书(NLTK),它令人困惑。Entropy is defined as

熵是每个标注的概率乘以同一标注的对数概率之和

如何将熵和最大熵应用于文本挖掘?谁能给我一个简单的例子(视觉)?

EN

Stack Overflow用户

发布于 2018-08-02 01:26:59

非正式的

下一词熵预测( entropy )是指信息或知识的可用性,缺乏信息将导致对未来预测的困难,即高熵(文本挖掘中的下一词预测),而信息/知识的可用性将帮助我们对未来进行更现实的预测(低熵)。

任何类型的相关信息都会减少熵,并帮助我们预测更现实的未来,即信息可以是“肉”字出现在句子中,也可以是“肉”字不存在。这称为信息增益

正式

缺乏可预测性的阶数

票数 6
EN
查看全部 6 条回答
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1859554

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档