kl散度 js散度 - 腾讯云开发者社区

文章/答案/技术大牛

发布

3回答

R中的Jensen - Shannon散度

我是R的新手，正在尝试寻找一个函数来计算R中的JS散度。我可以看到R有用于计算KL散度的KLdiv，但是有什么可用于JS散度的吗？

浏览 3提问于2012-06-27得票数 6

1回答

VAE中的KL散度

、

如果我正确理解，KL-散度是两个分布的相对熵。要计算两个分布的KL散度，需要两个随机变量向量。我不明白的是，如何计算VAE (潜空间向量和N(0,1) )中的KL散度，正如许多教程中所述。我的问题是，如何正确地将潜在空间向量创建为随机变量向量，这样最终就可以计算出KL散度。

浏览 0提问于2018-12-10得票数 0

回答已采纳

1回答

在神经网络中，两个高斯分布之间的KL散度作为损失函数的影响是什么？

、、

在许多深层神经网络中，特别是基于VAE结构的神经网络中，在损失函数的基础上加入了KL散度项。计算了估计的高斯分布和先验分布之间的散度。对于高斯分布，KL散度有一个封闭形式的解。通过最小化KL散度，使估计分布更接近先验分布。我的问题是，既然高斯分布完全由均值和协方差来描述，我们为什么不直接在估计的参数和先前的参数之间进行MSE呢？均值和协方差之间的最小均方误差也使这两个分布更加接近.取KL<

浏览 0提问于2019-12-23得票数 2

回答已采纳

2回答

我在理解KL-散度以及如何使用它进行特征选择时有点困难。因此，假设我有一组观察值(例如，0和1)，并为每个观察值生成2个特征。我现在的问题是:为什么特性是“最好的”？我知道我可以使用KL-散度(由$$D_{KL} =log(I)\ \sum_i \frac{ p(i) }{q(I)}$$给出)，但是什么是P，什么是Q？我的直觉告诉我，P是特征1，Q是真正的分布(所以是0和1的集合)，但我的理解也是，一个好的特征可以最大化KL散

浏览 4提问于2016-06-04得票数 0

1回答

为什么我在计算两个OneHotCategorical发行版之间的KL散度时会得到一个NaN？

、

我尝试使用以下代码计算两个OneHotCategorical分布之间的KL散度： posterior = tfd.OneHotCategorical(probs=[0., 0., 0., 0., 0.结果是： print(posterior.kl_divergence(prior)) tf.Tensor(nan, shape=(), dtype=float32) 这是一个bug，还是想要的结果？我测试了一下，错误指的是KL散度的计算，其中0的问题。值发生(对数和除法)。

浏览 15提问于2020-01-14得票数 1

1回答

TF层中的kl_use_exact参数

、、

我的问题是，当我们将参数kl_use_exact设置为False时，我们没有考虑到先前的函数。我试着查看DenseVariational类的源代码(_make_kl_divergence_penalty函数)，比以前更加困惑，我没有使用kl_use_exact。

浏览 19提问于2022-06-22得票数 0

回答已采纳

1回答

变分自编码器KL散度损失爆发及模型返回nan

、、、

nn.functional.binary_cross_entropy(x_hat.view(-1, 128 ** 2), x.view(-1, 128 ** 2),reduction='sum')KL_loss = -0.5 * torch.sum(1 + logvar - mu.pow(2) - logvar.exp())

浏览 4提问于2021-06-08得票数 1

1回答

如何度量具有相同特性的两个数据集之间的相似性？

、、、、

我有多个具有相同功能的数据集，一些数字数据集和一些分类数据集。唯一的区别是它们是不同国家的市场行为。我想知道是否有一种方法来测量两个或多个数据集之间的相似性，并提供一定的相似性。例如，美国和英国的市场行为90%是相似的。这样做的目的是找出类似的市场，然后用它们来计算因果影响。请告诉我什么是最好的方法。

浏览 0提问于2022-06-20得票数 0

3回答

为什么scipy.stats.entropy(a，b)返回inf，而scipy.stats.entropy(b，a)不返回inf？

、

In [15]: a = np.array([0.5, 0.5, 0, 0, 0]) Out[17]: inf Out[18]: 0.6931471805599453

浏览 2提问于2019-07-29得票数 2

回答已采纳

1回答

在Keras中实现KL发散的意义是什么？

、、、

我有点困惑KL发散是如何应用的，特别是在Keras中，但我认为这个问题对于深度学习应用来说是一个普遍的问题。我可以对来自y_true和y_pred的任意一对行进行KL散度计算，并得到预期的结果。这些KL散度的平均值与训练历史中Keras报告的损失相匹配。但是，这种聚合--在每一行上运行KL散度并取平均值--在损失函数中不会发生。我还没有在KL发散的在线处理中真正看到这个方面(通过数据集的样本聚合)；

浏览 0提问于2017-06-05得票数 7

回答已采纳

2回答

两个torch.distribution.Distribution对象的KL散度

、

我试图确定如何计算两个torch.distribution.Distribution对象的KL散度。到目前为止，我还没有找到一个函数来完成这个任务。以下是我尝试过的：from torch import distributions as tdist

浏览 54提问于2022-06-23得票数 3

回答已采纳

1回答

Kullback Liebler发散已经在TensorFlow中实现了吗？

、、

交叉熵作为我的损失函数：cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(pred, y)) 现在，我想我应该使用KL散度损失函数。但是，我没有在tensorflow中找到它，有没有人可以帮助我使用KL散度损失函数而不是Softmax损失？

浏览 6提问于2016-04-12得票数 1

1回答

解释KL发散值

、

因此，我使用枕库的rel_entr模块来计算KL散度。我已经读过一些文章，其中提到KL散度输出为0表示这两个分布基本上是相同的。另外，我读到KL散度是无界的。因此，KL值介于0和无穷大之间。因此，考虑到这些知识，我在我的研究中没有遇到的一点是，是否存在与KL值有关的“阈值”。我的意思是，在什么价值(由KL发散给)，我看这个值，并得出'P和q是巨大不同的‘？

浏览 7提问于2022-04-12得票数 0

1回答

理解pdist与mdscale的结合使用

、、、

我正在解决一个杂务问题。在对观测数据进行聚类之前，我首先计算了观测值之间的pdist，然后使用MATLAB中的mdscale函数返回到三维。我使用transformed_observation作为k均值聚类算法的输入，与使用原始观测值相比，获得了更好的聚类结果(即，聚类与标签匹配)。任何人都能解释我为什么？我刚试过..。% select the dimensions of my features % gener

浏览 1提问于2016-01-26得票数 0

回答已采纳

1回答

3个计算相对熵的函数。有什么关系呢？

、、、

python中的Scipy提供了以下函数，这些函数似乎计算相同的信息论度量，Kullback散度，也称为相对熵：可以切换到计算KL-散度的scipy.stats.entropy，，如果是qk=Nonescipy.special.rel_entrscipy.special.kl_div

浏览 8提问于2020-08-12得票数 2

回答已采纳

1回答

如何衡量两个变量分布的切线关系，梳理与否？

、

有没有统计方法来评估2个分布的切线关系？if distributed like comb, result is smaller. plt.show()

浏览 3提问于2014-01-17得票数 1

1回答

矩阵的INT8量化

、、、

受到“Transformer神经机器语言翻译模型的高效8位量化”的启发，我决定遵循这篇论文的警告。然而，我对在量化过程中设置偏移量变量感到困惑。 INPUT : A (tensor of FP32, [1, 4, 1024, 256]) offset = torch.empty(A.shape)scale = 255 / (torch.max(A) - torch.min(A)) # Probability Distributio

浏览 12提问于2021-10-23得票数 0

1回答

t实现: Kullback-Leibler发散

、

像在1中一样，the的工作原理是逐步减少Kullback (KL)散度，直到满足一定的条件为止。The的创建者建议使用KL差异作为可视化的性能标准：用我自己计算<em

浏览 0提问于2014-07-17得票数 11

回答已采纳

1回答

python中离散点的极限密度(LDDP)

、、

信息论中的香农熵衡量了离散随机变量经验分布中的不确定性或无序性，而微分熵衡量的是连续随机变量的经验分布。然而，微分熵的经典定义是错误的，并用离散点的极限密度(LDDP)进行了修正。scipy或其他计算LDDP吗？如何在python中估计LDDP？

浏览 70提问于2020-08-05得票数 1

点击加载更多

R中的Jensen - Shannon散度

VAE中的KL散度

在神经网络中，两个高斯分布之间的KL散度作为损失函数的影响是什么？

关于KL-散度和特征选择的直觉

为什么我在计算两个OneHotCategorical发行版之间的KL散度时会得到一个NaN？

TF层中的kl_use_exact参数

变分自编码器KL散度损失爆发及模型返回nan

如何度量具有相同特性的两个数据集之间的相似性？

为什么scipy.stats.entropy(a，b)返回inf，而scipy.stats.entropy(b，a)不返回inf？

在Keras中实现KL发散的意义是什么？

两个torch.distribution.Distribution对象的KL散度

Kullback Liebler发散已经在TensorFlow中实现了吗？

解释KL发散值

理解pdist与mdscale的结合使用

3个计算相对熵的函数。有什么关系呢？

如何衡量两个变量分布的切线关系，梳理与否？

矩阵的INT8量化

t实现: Kullback-Leibler发散

python中离散点的极限密度(LDDP)

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐