最大熵算法matlab_最大熵算法matlab编程_最大熵算法matlab编程实现 - 腾讯云开发者社区

、、、、

我有一个包含4个分类特征(胆固醇、收缩压、舒张压和吸烟率)的数据集。我使用决策树分类器来找出中风的概率。我正在尝试验证我对Python Sklearn所做的拆分过程的理解。由于它是二叉树，因此有三种可能的方法来拆分第一个特征，即将类别{0和1分组到一个叶子，将2分组到另一个叶子}，或者{0和2，1}，或者{0，1和2}。我所知道的(请在这里纠正我)是所选择的分割是具有最小信息增益的分割(基尼杂质)。我已经计算了三种分组方案中每一种情况的信息增益： {0 + 1 , 2} --> 0.17 {0 + 2 , 1} --> 0.18 {1 + 2 , 0} --> 0.

浏览 3提问于2019-12-24得票数 0

2回答

哈希编码的字符串之间有熵区别吗？

、

当然，如果我将(例如) SHA-2应用于base64编码的字符串，它将给我一个与原始数据不同的结果，但是从熵的角度来看，这有什么区别吗？有一个固定的输入(在一个位级别上，比如在base64: MSB总是0，或者字节:比如说，附加一堆0's)会降低它的强度吗？

浏览 0提问于2015-11-07得票数 7

1回答

是什么创建了‘`maxent_treebank_pos_tagger/english.泡菜’？

、、、

nltk包的内置语音标记似乎没有针对我的用例()进行优化。显示它使用了一个名为maxent_treebank_pos_tagger的保存的、经过预先训练的分类器。是什么创造了maxent_treebank_pos_tagger/english.pickle？我猜外面有一个标记语料库，用来训练这个标记者，所以我想我正在寻找(a)标记语料库和(b)基于标记语料库训练标记者的确切代码。除了大量的googling之外，到目前为止，我试图直接查看.pickle对象，以找到它内部的任何线索，从下面开始 from nltk.data import load x = load("nltk_data

浏览 0提问于2015-07-13得票数 10

1回答

J48与马尔可夫链的区别

、、、

我试图用C#和F#领域中的不同算法的相对速率来评估WekaSharp，而我感兴趣的算法之一是马尔可夫链。我知道Weka有一个HMM应用程序，但是我无法将它实现到WekaSharp中，我想知道是否有一种方法可以修改J48算法以适应这个目的。我知道J48和一阶马尔可夫链之间有一些相似之处，但我试图确定需要修改什么，以及这是否是一件合理的事情。下面是在殷朱的J48中实现的WekaSharp： type J48() = static member DefaultPara = "-C 0.25 -M 2" static member MakePara(?binarySp

浏览 3提问于2013-11-27得票数 5

回答已采纳

1回答

用散列秘密播撒GPG密钥源

、、

可能重复: 用于公钥加密的工具，其中密码是私钥？我想知道你们是否可以告诉我使用散列密码作为GPG密钥生成器种子的潜在问题。至于为什么有人会想这样做，我可以看到两个好处：使用令人难忘的密码可以消除将密钥存储在磁盘上的需要，从而在发生数据盗窃时保护您免受身份盗用。由于用户的内存包含重新生成密钥所需的所有内容，因此不需要担心电子数据丢失。痴呆症仍然适用。正如Stephen指出的那样，原因1很弱，因为密码保护的RSA密钥也有这个好处。RAM仍然是脆弱的，但这也很难获得访问，对吗？但是，假设人们对备份(他们不是)和理由2是有效的，那么使用散列作为RNG种子是否存在潜在的系统性问题？

浏览 0提问于2012-10-20得票数 2

回答已采纳

1回答

添加AUC作为keras的损失函数

、

有没有人幸运地用Theano为Keras写了一个自定义的AUC损失函数？文档在这里：示例代码在这里：我看到在pylearn2中有一个实现(它实际上是sklearn的包装器)，但无法将其移植到Keras中使用所以我想我的问题是，有没有人能写出这个函数？你愿意和我分享一下吗？

浏览 1提问于2015-09-11得票数 6

1回答

熵与最小熵的关系

我知道熵是可以编码一组消息的位数。然而，我不明白最小熵是什么，它与熵有什么关系。让我们描述一个简单的密码情况:如果密码是100随机位，那么最小熵也是100吗？

浏览 0提问于2018-11-08得票数 12

3回答

检测图像中的小细节

、、

我想检测出图像中包含较多小细节的区域，但同样地，我需要忽略强边缘。例如，我想(大约)识别位于建筑物上的海报上的小文本区域，但我也想忽略建筑物本身的强大边缘。我想我可能在寻找特定的频带，所以我想到的方法包括:手动调优卷积核，直到我达到我所需要的，使用特定的DCT系数，在方向滤波器响应上应用直方图。但也许我漏掉了更明显的东西？为了回答以下评论中的一个问题，我正在Matlab中开发我愿意接受任何关于如何实现这一目标的建议--谢谢！

浏览 9提问于2015-02-09得票数 1

回答已采纳

2回答

ID3上的最佳分割

、、

我正在尝试使用决策树(更准确地说是ID3算法)实现一个分类器。我的训练数据包含属性age，它是一个连续值。我正在尝试实现BestSplit()方法，在这个方法中，我需要将数据分割成k个分区，其中k=每个特性的可能值的数量！我被困住了，因为我知道在考虑到不同年龄的所有这些可能性的情况下，不可能对数据进行分割。这就是为什么我需要创建团队年龄！我怎么知道如何从所有这些可能的群集合中作出决定呢？

浏览 3提问于2014-03-07得票数 1

回答已采纳

2回答

决策树是试图最大化信息获取还是熵？

、、、

据我所知，决策树试图将高熵的分类器放在决策树上。然而，信息的获取是如何发挥作用的呢？信息增益被定义为： InformationGain = EntropyBefore - EntropyAfter 决策树是否试图将信息增益较低的分类器放置在树的顶部？那么，熵总是最大化，信息增益总是最小化吗？对不起，我只是有点糊涂。谢谢!

浏览 1提问于2013-12-19得票数 6

1回答

如何计算单个像素的熵？

、、

如何计算单个像素的entropy？matlab的函数熵计算图像的熵。我要计算每个像素的熵

浏览 2提问于2013-08-31得票数 1

1回答

在Matlab中使用trainbr函数进行分类

、、、、

我正在用Matlab训练一个神经网络进行分类，我不明白是否可以使用trainbr训练函数(贝叶斯正则化反向传播)。它使用MSE性能度量，但我想使用交叉熵。如果将交叉熵设为性能函数，则算法将其设置为MSE。另一方面，我不能在这种培训中使用验证集，也找不到如何更改它。守则是： x = A'; t = y'; % Choose a Training Function % For a list of all training functions type: help nntrain % 'trainlm' is usually fastest. % 'tr

浏览 0提问于2016-11-20得票数 1

回答已采纳

1回答

脚本执行时间是伪随机数字生成的适当来源吗？

这是一个用于生成密码的PHP脚本。当然，在生成密码之前还需要计算其他内容。但是，我认为脚本初始化和队列所需的时间会使它成为一个很好的伪随机。是否有关于脚本执行时间作为pseurandom数字产生源的研究？如果没有，有什么关于如何对此进行密码分析的建议？

浏览 0提问于2014-02-21得票数 1

回答已采纳

1回答

Math.random产生多少熵？

、、

我想要生成一个很大的随机数。我不需要这个号码来保证密码的安全。因此，我不使用。目前，我正在按以下方式生成随机数： const random = length => Math.floor(length * Math.random()); const padding = (length, character, string) => (new Array(length + 1).join(character) + string).slice(string.length); const randomBits = bits => padding(bits

浏览 9提问于2016-11-12得票数 7

回答已采纳

1回答

熵函数的用法

、、

我试图在MATLAB中找到某个概率分布的熵。对于p，我试着去做 E = -sum(p .* log2(p)) 和Echeck = entropy(p) E和Echeck不应该是一样的吗？ matlab关于熵的帮助说明熵被定义为-sum(p.*log2(p))，其中p包含从imhist.But返回的直方图计数，并且熵将用于直方图计数计算的逻辑以外的任何类转换为uint8，因为它实际上试图计算灰度图像的熵，因此希望像素值是离散的。所以我猜使用这个函数来达到我的目的是不正确的？有没有好的替代方案？

浏览 0提问于2012-01-26得票数 3

回答已采纳

1回答

什么使二进制交叉熵比其他损失函数更好地选择二进制分类？

、、

我正在阅读这个帖子，在这里我看到了这句话：“交叉熵是用于二进制分类问题的默认损失函数。” 但是它如何使它成为二进制分类的默认且可能最好的损失函数呢？

浏览 0提问于2019-06-07得票数 7

1回答

如何让ndimage.filters.maximum_filter像MATLAB的imregionalmax函数一样工作？

、、、、

在阅读this post，并使用SciKit-image之后，我发现Python语言与MATLAB的imregionalmax函数有不同之处。我有以下几行代码： from skimage.feature import peak_local_max manos = np.ones([5,5]) manos[2,2] = 0. manos[2,4] = 2. giannis = peak_local_max(manos,min_distance=1, indices=False, exclude_border=False) giorgos = ndimage.filters.maximu

浏览 77提问于2019-05-14得票数 3

回答已采纳

4回答

熵与无损压缩速率的关系

、

从中我们知道，压缩字符串的熵被原始字符串的熵所限制，如下所示： H(X) <= L < H(X) + 1/N 其中H(X)是源字符串的熵，N是源字符串的长度，L是压缩字符串的期望长度。这必然意味着无损压缩是有限度的。我想知道的是：我们能直接把熵与某些预期的压缩比联系起来吗？我们能用熵找到压缩比的上界吗？

浏览 3提问于2009-02-26得票数 5

回答已采纳

1回答

如何计算图像在两个方向(水平和垂直)的熵？

、、、

我需要计算图像在两个方向(水平和垂直)的熵？如何在matlab上实现？

浏览 2提问于2020-10-26得票数 1

回答已采纳

1回答

密码熵估计

、、

如何计算所述所选密码的熵？从2000个单词的列表中随机选择4个不同的单词。单词可以包含特殊的字符替换。例如，可以使用下列替换： Sub = {a; 0; i; e; /a; 8} Letter a -> @; Letter o -> 0; Letter i -> {1; !} Letter e -> 9; Letter a -> 6; Letter 8 -> & 假定以统一方式选择替代品： ex: i is mapped to {i; 1; !} with the same probability. 假设90%的单词在Sub中有一个字母，50

浏览 0提问于2016-10-13得票数 0

1回答

为什么熵函数在MATLAB中不起作用？

、

为了求图像的熵，我首先使用了matlab代码 PIC = imread('c.bmp'); I = imhist(PIC); C = I./sum(I); bar(I) E = entropy(C) 它给了我错误的结果，然后我用 E = -sum(C.*log2(C)) 它给了我正确的结果，谁能解释一下我在第一种情况下做错了什么吗？我是图像处理方面的新手。

浏览 1提问于2015-05-24得票数 0

回答已采纳

1回答

如何利用香农熵产生的信息区分低熵和高熵

、、、

我计算了一天内用户行为的熵水平，计算了其可能出现的状态(H:=Home、w:=Work或E:=Elsewhere)。假设用户A以{H，W，E，E，H，H}表示一天中每小时的可能状态 P(H)=13/24=0.54 P(W)=9/24=0.38 P(E)=2/24=0.08 使用shannon的熵，我想计算一个用户的熵级别，以了解用户的可预测性。 H(A)=(-P(H)*log2 2(H))+(-P(W)*log2 2(W))+(-P(E)*log2 2(E)) =0.48 + 0.53 + 0.29 =1.3 如何区分比特中的低熵和高熵信息？

浏览 3提问于2014-03-10得票数 1

回答已采纳

1回答

matlab:不同数据类型的同一图像的不同熵值

、、、、

在matlab中给出uint8型图像I entropy(I) 给了我一个完全不同的结果 entropy(im2double(I)) (例如，6.98在第一种情况下，0.51在第二种情况)为什么数据类型改变这个值？

浏览 3提问于2017-11-20得票数 1

回答已采纳

2回答

在matlab中查找自定义函数的(局部)最大值

我有以下功能： function res = score(probability) 其中，例如probability = [.7 .4 .8 .1]和res = 0.8512 / 我的目标是找到最大化score？的概率向量( 0.01个跳跃)。有没有一种matlab方法可以解决这个问题？或者我应该在上面的每个概率中循环x次junping，每次0.01次？

浏览 0提问于2016-07-13得票数 0

1回答

利用交叉熵建立决策树分类器

、

熵和交叉熵是否与基本定义相同？如果有不同之处：决策树分解取熵或基尼指数，可以用交叉熵来分割决策树吗？或者，在运行决策树算法之后，我应该使用它作为评估指标吗？此外，决策树算法是否假定有任何分布？如果是，那么我们如何使用KL发散度呢？我只是想把几个概念从更广泛的角度联系起来。以下是我对多类决策树的关注。

浏览 0提问于2020-01-16得票数 2

1回答

matlab运行所有linprog算法(有matlab算法列表吗？)

、、

Matlab提供了多种求解线性规划的算法。例如，Matlab线提供了：‘活动集’，‘信任-区域-反射’，‘内点’，‘内点-凸’，'levenberg-marquardt'，‘信任-区域-狗腿’，‘lm- R2012b -搜索’，或'sqp‘。但是其他版本的Matlab支持不同的算法。我想在用户的Matlab版本支持的所有算法上运行一个循环。我希望它们按照Matlab的推荐顺序排序。我想实现这样的东西： i=1; x=[]; while (isempty(x)) options=optimset(options,'Algorithm',Her

浏览 2提问于2017-06-05得票数 1

2回答

什么是随机数的安全强度？

、、

使用Hash_DRBG时，随机数的安全强度是什么意思？(我指的是一些NIST文档)。 Hash_DRBG的文档说：“请求的安全强度= 80请求的散列算法= SHA-1” 我已经编辑了标题。我想我的问题现在更准确了。文档是格式的(大约11MB) 相关部分为 ############################################################## Hash_DRBG Requested Security Strength = 80 Requested Hash Algorithm = SHA-1 prediction_resistance_flag =

浏览 6提问于2012-02-02得票数 1

回答已采纳

2回答

Matlab中矢量的谱熵和谱能量

、、、、

我将使用光谱能量和光谱熵作为基于窗口的时间序列数据的特征。然而，我对在线使用的公式有点困惑，特别是对于特殊的熵。我使用了Matlab中的熵，但这不适用于时间序列数据。它给我的一切都是零。此版本的测试窗口熵结果=0 然后我用了这个版本。此版本的测试窗口熵结果= 4.3219 在将imhist应用到数据窗口(p= imhist(aw1(:));)之后，我还尝试了aw1(p.*log2 2(P))。这是从网上帮助得到的。此版本的测试窗口熵结果= 0.0369 他们都报告了不同的价值。对于频谱能量，我使用fft系数的平方和。和(abs(fft(数据窗口)).^2) 有谁能给我任何建议，哪个是正确

浏览 11提问于2014-01-17得票数 3

回答已采纳

1回答

预测整个密码数据库的熵

假设在某个特定组合规则"C“下创建的密码将进行安全性测试。其中一种方法可以是对x个人进行调查，并测量他们创建的密码的平均熵。X的最小值应该是多少，这样才能预测60亿用户在同一组合规则"C“下创建的密码数据库的近似熵？假设我可以收集基于调查的密码数据，我想要评估哪些组合规则创建了更安全的密码。

浏览 0提问于2014-09-18得票数 0

1回答

OpenCV中的entropyfilt

、、

我正在做一个图像处理项目，我必须使用 (来自matlab)。我研究并发现一些信息来做这件事，但还不够。我可以计算图像的熵值，但我不知道如何写熵滤波器。网站上有一个，但我也不明白。有人能帮我理解熵滤波吗？

浏览 1提问于2014-02-20得票数 0

回答已采纳

2回答

使用密码生成唯一的助记符(仅)

、、、、

我试图创造一个外逃像钱包，在那里第一次用户只需要输入密码，以注册钱包。我想的方法是，在密码上使用空盐运行PBKDF2，并将其作为来自bip39的entropyToMnemonic()的熵，我在bip39中找到了这里。但是这种方法的问题是，当两个用户拥有相同的密码时，助记符就会是相同的。如何利用这种方法获得唯一性。就像元请求是如何管理钱包的。

浏览 0提问于2019-02-21得票数 2

1回答

绘制进化算法的搜索空间

、、、、

我正在研究离散优化问题，我想绘制搜索空间。实际上，我希望在搜索空间中看到变异和交叉操作。我对此一无所知！有人能告诉我如何在MATLAB中绘制遗传算法离散优化问题的搜索空间吗？我不使用任何工具箱。这样一个优化问题的一个例子是旅行商。

浏览 1提问于2013-12-15得票数 0

回答已采纳

1回答

什么是排列熵？

、

我想知道什么是置换熵(PE)。然后，我了解了这论文，它描述了体育。现在，假设我们有一个由熵源产生的伪随机排列，我们使用了一个统一的洗牌算法(比如Fisher-Yates洗牌算法)。另外，假设我们使用256位熵来洗牌\{0,1\}^8\rightarrow\{0,1\}^8.那么，输出排列可以具有最大256位熵的事实是真的吗？对于熵的每一个值，我们将得到一个唯一的对应排列。

浏览 0提问于2020-11-10得票数 0

2回答

最大双值(浮点数)在MATLAB中(64位)

、、、

我知道double是MATLAB中默认的数据类型. 当你比较两个没有浮动部分的双数字时，MATLAB在我的测试中是精确到第17位的。 a=12345678901234567 ; b=12345678901234567; isequal(a,b) --> TRUE a=123456789012345671; b=123456789012345672; isequal(a,b) --> printed as TRUE 我发现保守的估计是使用数字(非浮动的)直到只有13位数的，因为其他函数在它之后可能变得不可靠(例如ismember，或者MEX函数ismembc等等)

浏览 8提问于2014-12-12得票数 0

回答已采纳

1回答

信息增益vs最小化熵

、、、

在什么情况下，信息增益最大化不等同于熵最小化？更广泛的问题是，为什么我们需要信息增益的概念？仅仅使用熵来决定决策树的下一个最优属性还不够吗？

浏览 10提问于2015-11-21得票数 2

2回答

.dll文件的熵值为6.46

我的问题是关于熵的，我读了尼牙孜发布的几次描述。我可能还没有完全掌握这个概念，所以我会问我的问题。我有一个.dll文件，我在上面运行了几次测试，其中一个结果是熵值为6.46 (未打包)。我很难弄清楚这到底是什么意思，我理解没有包装的部分，但我不理解6.46的值，因为我没有看到熵的值的任何尺度。我可能没有正确地考虑这一点，我非常感谢任何帮助。谢谢..。

浏览 0提问于2013-05-07得票数 0

1回答

熵与信息关系

、、

在压缩和信息论中，源的熵是源符号所能传递的平均信息量(以位为单位)。非正式地说，如果我们确定一个事件的结果，那么熵就会变小。 J. Principe, D. Xu, and J. Fisher, “Information theoretic learning,” in Unsupervised Adaptive Filtering, S. Haykin, Ed. New York: Wiley, 2000, vol. I, pp. 265–319. 熵(Shannon和Renyis)作为目标函数而不是均方误差，被应用于学习中。我的问题是最小误差熵的基本原理是什么？当熵最大时，我们能对信

浏览 6提问于2014-07-26得票数 2

回答已采纳

1回答

我们能估计生成RSA密钥所需的熵量吗？

、

作为默认的GPG主键的4096位。我几乎可以在Ubuntu上管理第一个左右。当再生成几个RSA密钥时，它就耗尽了熵，我被GPG逼到鼠标摆动和键盘粉碎。显然，在这些情况下，需要的熵比/dev/random中可用的要多。对于制造一个4096位RSA密钥所需的熵位总数，是否有某种度量？接近但不完全是用于随机数生成的熵量的检测。也不是如何生成1024位RSA密钥，因为它只计算最终密钥对中的位。可能需要某种形式的组合来考虑首要性测试。

浏览 0提问于2019-07-02得票数 1

回答已采纳

1回答

图像拼接中正确的图像大小

、、、、

我用SURF.the问题在Matlab中实现了图像拼接 outputView = imref2d(size(img1)*2); Ir = imwarp(img2,tform,'OutputView',outputView); 它产生我想要这样的如果我改变了 outputView = imref2d(size(img1)*2); 至 outputView = imref2d(size(img1)); matlab对第二幅图像进行编码，使其在变换后能适应第一幅图像的大小。

浏览 3提问于2016-10-07得票数 2

回答已采纳

2回答

如何在opennlp中查看.bin文件的内容

、

我正在尝试在我正在工作的项目中使用OpenNLP，而且我对它非常陌生。我尝试将命名实体识别与上提供的训练数据一起使用，但是我希望看到已经使用的训练数据。即实际打开.bin文件并查看其英文内容。谁能给我指个方向吗？我曾尝试使用UltraISO读取.bin文件，但没有成功。请帮帮我！谢谢:)

浏览 0提问于2014-10-01得票数 0

3回答

什么是最大熵？

、、

谁能给我一个清晰而简单的最大熵分类的定义？如果有人能提供一个清晰的类比，那将是非常有帮助的，因为我正在努力理解。

浏览 2提问于2016-05-14得票数 7

1回答

Guid盐- string vs bytes[]

、

最近我进入了密码哈希(SHA256、HMAC 1、PBKDF2等)。还有一个“声明”，我一遍又一遍地读着，在我的脑海中，我找不到一个令人满意的答案。当我们在上面说“Guid”时，我们指的是“代表Guid的16字节数组”，而不是“Guid string form”。来自(http://securitydriven.net/) 使用GUID作为salt作为16字节数组(.NET)和将GUID以字符串格式( UTF8为36字节)连接到纯文本密码并随后初始化散列过程，有什么区别呢？为什么第一个提到的被认为更安全？

浏览 0提问于2015-07-20得票数 4

回答已采纳

2回答

R中的优化函数，可以接受目标，梯度和赫斯？

、、

我有一个复杂的目标函数，我正在寻找优化。优化问题需要相当长的时间来优化。幸运的是，我确实有可用的函数的梯度和hessian。在R中有没有一个优化包可以接受所有这三个输入？类'optim‘不接受黑森语。我已经扫描了，没有弹出任何东西。无论如何，我可以在MATLAB中使用带有'GradObj‘和'Hessian’参数的'‘来执行优化。

浏览 2提问于2011-11-11得票数 10

回答已采纳

1回答

MATLAB警告- Davies-Bouldin无法收敛

、、

我目前正在尝试使用MATLAB的R2014a版本的内置函数在数据集上运行Davies Bouldin评估。当对较大的数据样本运行该函数时，我不断收到类似以下的警告： "Warning: Failed to converge in 100 iterations during replicate 5. > In kmeans>loopBody at 397 In smartForReduce at 128 In kmeans at 299 In ClusterCriterion>@(X,NC)(kmeans(X,NC,'EmptyAction'

浏览 2提问于2014-07-17得票数 0

2回答

Matlab的fminimax应用Pareto最优性吗？

、、

我在Matlab中进行多目标优化，并在优化工具箱中使用fiminimax。我想知道fminimax是否应用Pareto优化，如果没有，为什么？另外，你能建议一个在Matlab或Python中使用Pareto的多目标优化包吗？

浏览 5提问于2013-11-04得票数 1

回答已采纳

2回答

新安装后CentOS 5上的低熵

、、、、

最近，我挂载了一个新分区，并将/home和/var/lib/mysql移动到新驱动器，并向它们做了一个符号链接。现在我注意到熵(使用munin)已经从3000左右下降到100-200左右。数据的装入和移动会导致这种情况吗？我使用它作为apache well服务器来托管一个面向公共用户的站点，并且我也注意到负载的增加(低熵会导致这种情况吗？) 如果这是个大问题，我想找出解决低熵问题的方法。我读到，我可以通过使用rng工具和切换到使用urandom来增加熵。人们说，对于安全意识强的系统来说，这不是一个好方法。但是对于一个网络应用程序来说，这还行吗？这会使我的web应用程序(我们使用加密(散列

浏览 0提问于2011-08-08得票数 2

回答已采纳

2回答

MATLAB中黑箱函数的参数优化

、

我需要一个优雅、简单的系统来找出给定一个或多个参数的确定性函数返回的最高值是什么。我知道在MATLAB中有一个很好的遗传算法的实现，但实际上，在我的例子中，这是一个过头。我需要更简单的东西。有什么想法吗？

浏览 2提问于2014-09-29得票数 0

回答已采纳

3回答

在良好熵的基础上加入坏熵，使系统不安全吗？

例如, 如果我需要生成一个随机数。我使用一个很好的熵源来生成r。然后，我添加由坏熵生成的值a、b和c，从而使new entropy = r + a + b + c 整体熵会是怎样的呢？加号意味着添加而不是连接。我相信，如果我们连接，那么这将导致一个整体的坏熵，因为如果我们假设每个a,b,c,r每个贡献64位到256位熵。实际上，我们只有64位来自r的良好熵。这是我的直觉和连接。

浏览 0提问于2019-05-03得票数 2

2回答

数据挖掘中信息增益所隐含的实际意义是什么？

、、、

Information Gain= (Information before split)-(Information after split) 信息增益可以通过上面的方程求出。但我不明白的是，这种信息增益的确切含义是什么？这是否意味着通过根据给定的属性或类似的东西进行拆分，可以获得或减少多少信息？链接到答案：

浏览 17提问于2015-03-28得票数 0

1回答

有人能帮我分析这些赫夫曼频率散点图吗？

、、、、

我编写了一个实现Huffman编码的程序，并在3种不同类型的文件上进行了测试，然后在Matlab的散点图上绘制了它们的频率。3种不同类型的文件是文本文件(.txt)：I能够将文件大小从65 KB减少到37 KB，即几乎压缩43%。音频文件(.mp3)：I能够将文件大小从99 KB减小到98 KB，即几乎相当于1%的压缩(LOL)。压缩文件(.rar)：I能够将文件大小从16.1 KB减少到16.2 KB，即几乎相当于-1%的压缩(Big)。现在，我获取了每个文件在压缩前出现的字符的频率，并在Matlab中绘制了散点图。例如，在本文中，m出现3次，我出现2次，所以我在

浏览 4提问于2016-05-01得票数 0

回答已采纳