最大熵 python_最大熵算法原理_最大熵算法公式 - 腾讯云开发者社区

、、

我需要对每个提取的实体有信心(不是打印它，而是获取它)，但是，我找不到一个返回信任的方法。首先，我尝试在Java上使用斯坦福命名实体识别器库，这个解决方案：但是它不起作用(我想getCliqueTree方法是不可用的)。我也尝试过在Python和Stanford模型中使用NLTK来提取实体，但是仍然找不到获得信任的方法。我知道如何在Spacy上这么做但正如作者所言，它效率低下。那么，请您告诉我，如何得到每个提取的实体的概率？

浏览 0提问于2018-08-27得票数 2

1回答

决策树分割策略

、、、、

我有一个包含4个分类特征(胆固醇、收缩压、舒张压和吸烟率)的数据集。我使用决策树分类器来找出中风的概率。我正在尝试验证我对Python Sklearn所做的拆分过程的理解。由于它是二叉树，因此有三种可能的方法来拆分第一个特征，即将类别{0和1分组到一个叶子，将2分组到另一个叶子}，或者{0和2，1}，或者{0，1和2}。我所知道的(请在这里纠正我)是所选择的分割是具有最小信息增益的分割(基尼杂质)。我已经计算了三种分组方案中每一种情况的信息增益： {0 + 1 , 2} --> 0.17 {0 + 2 , 1} --> 0.18 {1 + 2 , 0} --> 0.

浏览 3提问于2019-12-24得票数 0

1回答

如何利用香农熵产生的信息区分低熵和高熵

、、、

我计算了一天内用户行为的熵水平，计算了其可能出现的状态(H:=Home、w:=Work或E:=Elsewhere)。假设用户A以{H，W，E，E，H，H}表示一天中每小时的可能状态 P(H)=13/24=0.54 P(W)=9/24=0.38 P(E)=2/24=0.08 使用shannon的熵，我想计算一个用户的熵级别，以了解用户的可预测性。 H(A)=(-P(H)*log2 2(H))+(-P(W)*log2 2(W))+(-P(E)*log2 2(E)) =0.48 + 0.53 + 0.29 =1.3 如何区分比特中的低熵和高熵信息？

浏览 3提问于2014-03-10得票数 1

回答已采纳

2回答

熵和加密文件

、

我有个问题需要帮助。通常，在加密文件中，文件大小大于未加密文件。熵在这些时候会减少吗？我知道在python中，熵是这样计算的： print('myfile.text'.format) with open(r"C:\Users\Parisa\Desktop\myfile.txt", 'rb') as f: byteArr = list(f.read()) fileSize = len(byteArr) print print('File size in bytes: {:,d}'.format(fileSize)) # calcul

浏览 8提问于2021-01-14得票数 0

回答已采纳

2回答

哈希编码的字符串之间有熵区别吗？

、

当然，如果我将(例如) SHA-2应用于base64编码的字符串，它将给我一个与原始数据不同的结果，但是从熵的角度来看，这有什么区别吗？有一个固定的输入(在一个位级别上，比如在base64: MSB总是0，或者字节:比如说，附加一堆0's)会降低它的强度吗？

浏览 0提问于2015-11-07得票数 7

1回答

信息增益vs最小化熵

、、、

在什么情况下，信息增益最大化不等同于熵最小化？更广泛的问题是，为什么我们需要信息增益的概念？仅仅使用熵来决定决策树的下一个最优属性还不够吗？

浏览 10提问于2015-11-21得票数 2

2回答

当分割被完全分类时，在ID3算法中计算属性的熵

、、

我最近读到了ID3算法，它说选择最好的属性进行分割应该导致最大的信息增益，这可以在熵的帮助下计算。我已经写了一个简单的python程序来计算熵。如下图所示： def _E(p, n): x = (p/(p+n)) y = (n/(p+n)) return(-1* (x*math.log2(x)) -1* (y*math.log2(y))) 但是，假设我们有一个由10个元素组成的表，如下所示： X= 1，0，1，0，0，0，0，0，0 Y= 1，1，1，0，1，0，1，0，1，0 其中x是属性，y是类。这里P(0) = 0.8，P(1) = 0.2。熵将如下：熵(X)

浏览 0提问于2016-09-30得票数 3

3回答

在良好熵的基础上加入坏熵，使系统不安全吗？

例如, 如果我需要生成一个随机数。我使用一个很好的熵源来生成r。然后，我添加由坏熵生成的值a、b和c，从而使new entropy = r + a + b + c 整体熵会是怎样的呢？加号意味着添加而不是连接。我相信，如果我们连接，那么这将导致一个整体的坏熵，因为如果我们假设每个a,b,c,r每个贡献64位到256位熵。实际上，我们只有64位来自r的良好熵。这是我的直觉和连接。

浏览 0提问于2019-05-03得票数 2

1回答

如何在两步决策中计算信息熵？

我有一个问题，我认为这个问题涉及到信息论领域的“条件熵”。我正在努力想办法解决这个问题，但我需要一些帮助。考虑一个例子，其中我们有四个房子。第一个房子有八个人，第二个房子住四个人，第三个房子住两个人，第四个房子住两个人。所以，四栋房子和十六个人。如果我只是随机地从这些人中选择一个，那么这个选择就是从16个人中选择一个人，为这个选择产生4位的信息熵。但现在考虑一个两步选择，首先我随机选择一所房子，然后在选定的房子中选择一个人。因此，第一步，即从四所可用房屋中挑选一所房子，生成两位信息熵。但现在，在我挑选第一所房子的25%的时间里，第二步在从第一所房子的八个人中选择一个人的过程中又增加了三个比特

浏览 2提问于2010-02-24得票数 1

回答已采纳

2回答

数据挖掘中信息增益所隐含的实际意义是什么？

、、、

Information Gain= (Information before split)-(Information after split) 信息增益可以通过上面的方程求出。但我不明白的是，这种信息增益的确切含义是什么？这是否意味着通过根据给定的属性或类似的东西进行拆分，可以获得或减少多少信息？链接到答案：

浏览 17提问于2015-03-28得票数 0

1回答

这会增加生成数的随机性吗？

、、

我是python编程的新手，我写了这段代码作为实验。我的问题是，这是增加了生成数字的随机性，还是只是浪费了代码？ import random def random_number_generator(): """ Returns a randomized random number """ # initialize 10 variable that will have random integers from range 1-10 r1 = random.randint(1, 10) r2 = random.r

浏览 2提问于2020-08-18得票数 0

回答已采纳

1回答

Python Fernet加密熵低的原因

、、

我使用python cryptography.fernet的Fernet加密并生成密钥，如下所示 salt = os.urandom(16) kdf = PBKDF2HMAC( algorithm=hashes.SHA256(), length=32, salt=salt, iterations=78643, backend=default_backend() ) key = base64.urlsafe_b64encode(kdf.derive(password)) 加密使用： f

浏览 0提问于2021-05-31得票数 0

1回答

增量式最大熵分类器

、、

用于构建最大熵分类器的算法是否可以修改为增量式功能，或者根据定义它是一个批处理过程吗？我已经找到了实现，但它们都是批处理过程，即使在检查了代码之后，我也无法想象如何修改它们以使其以增量方式运行。这有可能吗？

浏览 2提问于2011-07-07得票数 3

回答已采纳

1回答

keras模型训练的最高损失量是多少？

、、、

我正在使用Keras训练我的模型，并尝试读取评估统计数据。我知道损失函数是用来做什么的，但是最高值可能是多少呢？越接近零越好，但我不知道0.2是不是更好。我可以看到，在更多的迭代之后，损失正在下降，准确率也在提高。我训练模型的代码如下： def trainModel(bow,unitlabels,units): x_train = np.array(bow) print("X_train: ", x_train) y_train = np.array(unitlabels) print("Y_train: ", y_train

浏览 27提问于2019-05-09得票数 1

回答已采纳

2回答

使用TensorFlow的sigmoid_cross_entropy_with_logits，成本函数应该是零吗？

、、、

我正在构建一个CNN来进行二进制分类(1或0)。为此，我使用了成本函数sigmoid_cross_entropy_with_logits。但出于某种原因，即使预测值等于正确的值，使用此函数的成本也永远不会等于零。我试着用TensorFlow网站上的公式来绘制输出：https://www.tensorflow.org/api_docs/python/tf/nn/sigmoid_交叉_熵_使用_逻辑这个公式： max(x, 0) - x * z + log(1 + exp(-abs(x))) 通过绘制这个图，我意识到，当输出相等时，它真的不是零。例如，如果z=0和x= 0，则此函数的结果是~

浏览 0提问于2018-08-16得票数 0

1回答

RuntimeError：_thnn_mse_loss_forward不是为torch.cuda.LongTensor类型实现的

、、、、

我正在使用PyTorch，但是我得到了一个错误！我的错误代码如下： for train_data in trainloader: example_count += 1 if example_count == 100: break optimer.zero_grad() image, label = train_data image = image.cuda() label = label.cuda() out = model(image) _, out = torch.max(out, 1) # print

浏览 5提问于2019-02-26得票数 7

1回答

HKDF IKM长度要求？

我阅读了RFC5869和我没有看到任何建议或要求的八进制长度的IKM使用的香港国防军-提取操作。在HKDF-展开操作中使用的Hash方法与IKM长度之间有什么关系吗？例如，当使用SHA-256时，这要求IKM是一个256位的密钥。

浏览 0提问于2022-07-22得票数 1

回答已采纳

1回答

属性熵的计算

请给出熵(Ssun)的一步一步的计算。我不明白0.918是怎么算出来的。我试过了，但是我得到了Sunny，Windy，Rainy的值为0.521089678，0.528771238，0.521089678。我能够正确计算目标熵(判定)为= -(6/10)*log(6/10) + -(2/10)log(2/10) + -(1/10)log(1/10) + -(1/10)log(1/10) = 1.570950594 我完全被困在下一步了。请求你的帮助。参考：http://www.doc.ic.ac.uk/~sgc/teaching/pre2012/v231/lecture11.html请搜

浏览 0提问于2015-02-11得票数 4

1回答

Mersenne (MT)的熵是多少？

从严肃的密码学来看：“当分布均匀时，熵是最大化的，因为均匀分布使不确定性最大化:没有任何结果比其他的结果更有可能，因此，n位值不能超过n位熵。” MT力求有尽可能均匀的分布，因此人们会认为熵是最大化的，并且等于种子的位长。但是，经过624次迭代后，MT变得完全可预测，此时它的熵应该被认为是零，但随后的分布仍然是一致的。这两种观点似乎相互矛盾。

浏览 0提问于2019-01-20得票数 6

1回答

FootPrint参数在skimage.filters.rank.entropy中是什么？(Scikit-Image，Python)

、、

我正在尝试从包文档中复制下面的示例。但是，在用“disk(2)”或“disk(10)”调整“足迹”参数(在skimage.filters.rank's熵函数中)之后，每次我都会得到一个模糊的图像。文档声明‘邻域’表示为1‘s和0’s的ndarray，但是“足迹”参数以像素和熵公式表示什么呢？ import matplotlib.pyplot as plt import numpy as np from skimage import data from skimage.util import img_as_ubyte from skimage.filters.rank import e

浏览 12提问于2021-12-07得票数 0

回答已采纳

2回答

位与异或结合时的比特熵公式

、、、

假设位A和B都有每比特的.5熵位。级联A‖B的两位结果有1比特的熵总量，并保留了.5比特的熵密度。 A和B的排他性或，即A⊕B的单比特熵会有多少个比特？我猜这个公式类似于每比特熵的\mathord{\mathrm{E}}(A⊕B)=1-(1 - \mathord{\mathrm{E}}(A))(1-\mathord{\mathrm{E}}(B))=.75比特。这是正确的吗？如果是这样的话，是否有这个方程的一个简短的证明，我可以参考？另外，我是否正确地解释过，你只能通过低熵度的异或比特来接近每比特的1位熵，但实际上却无法达到它呢？

浏览 0提问于2020-10-06得票数 3

回答已采纳

1回答

熵与最小熵的关系

我知道熵是可以编码一组消息的位数。然而，我不明白最小熵是什么，它与熵有什么关系。让我们描述一个简单的密码情况:如果密码是100随机位，那么最小熵也是100吗？

浏览 0提问于2018-11-08得票数 12

1回答

ID3机器学习算法能够处理比“是/否”更多的类吗？

我花了五天的时间在这上面，几乎没有睡觉，现在我已经到了我的头脑尽头。事实上，由于睡眠不足，我现在感到不舒服。我用两个类实现了ID3，例如YES/NO，现在我被赋予了一个具有3x可能结果的数据集的任务。数据的示例子集： 3.4,5.2,1.4,0.2,BarnOwl 2.3,4.5,1.3,0.3,BarnOwl 3.4,6,4.5,1.6,SnowyOwl 2.9,5.7,4.2,1.3,SnowyOwl 2.8,6.4,5.6,2.1,LongEaredOwl 3.2,6.4,5.3,2.3,LongEaredOwl 2.8,6.2,4.8,1.8,LongEaredOwl 2.3,5,

浏览 2提问于2014-03-20得票数 1

回答已采纳

1回答

熵保持函数

设F是一个确定性压缩函数，具有固定长度、128位输入和8位输出。函数的每个输入都有128位熵，这是否意味着输出字节有128位熵？

浏览 0提问于2020-03-26得票数 1

回答已采纳

4回答

Python3 ImportError:无法导入名称“极大熵”

我使用python3.5.3和 from scipy import maxentropy 我得到了错误: ImportError:无法导入名称‘极大熵’，请建议错误的解决方案。谢谢

浏览 17提问于2017-07-14得票数 1

回答已采纳

1回答

是否有办法检查文件数据是否加密？

、、

我想检查文件是否加密，是否有更好的方法来检查我们是否能检测到加密。我已经用shannon熵来检查文件熵，这样我们就可以找到文件的熵，从而得出数据要么是加密的，要么是压缩的，或者是随机的，因为如果文件的熵很高，它可以声明这三个conditionsBut，，它不能区分压缩文件和加密文件，因为高熵可以导致这些条件中的任何一个()。我们如何检测该文件是否加密？

浏览 1提问于2020-11-15得票数 1

1回答

我会用什么特征选择算法来找出哪个特征对每个类的影响最大？

、、

目前，我正在实验一个数据集，使用有监督学习的10个特征和3个类，但是出现了一个问题，那就是，我将使用什么特征选择算法来找出哪一个特征对哪个类影响最大，或者哪一个特征的组合将导致什么类。例如，以一组数据，包括睡眠时间和研究时间，这些数据可能导致传球或失败。我想知道“小时学习”是如何影响传球课的，它是如何影响“不及格”课程的，同样的，睡眠时间是如何影响传球或失败的。什么样的特征选择方法会告诉我，睡眠时间对失败有x影响，对传球有影响，对研究时间也是一样的？

浏览 8提问于2016-04-04得票数 1

回答已采纳

1回答

转换字符集如何影响哈希熵？

、

是否将大型字符集哈希映射到固定大小的子字符串？的小字符集哈希值较低的熵。我正在编写一个python应用程序，它涉及到为网站生成密码。在应用程序期间，我希望将十六进制散列转换为字母数字字符串，并接受输出的前20个字符。我想转换为字母数字，因为大多数网站至少支持上-下字母数字字符集。我将十六进制字节\{00...\text{ff}\}的较大字符集映射到较小的大小写字母数字\{a...z, A...Z, 0...9\}集上。映射是通过循环回收62个字母数字元素来完成的，以对应256个字节中的每个元素。 00 \rightarrow a 01 \rightarrow b \vdots

浏览 0提问于2014-02-18得票数 1

回答已采纳

1回答

pymc3:为什么所有的东西都是用日志表示的？

、、

我正在试图理解pymc3，它看起来是一个漂亮的包。我不明白的一件事是，为什么所有的概率都是对数的？Beta分布的描述说它是"Beta对数似然“。评估分布的函数是"logp“和"logcdf”。我在其他地方也看到了对logp的引用，但没有看到任何关于我们为什么要记录日志的迹象。我担心我可能遗漏了一些基本的东西。谢谢你提供的任何信息。

浏览 8提问于2019-12-05得票数 0

回答已采纳

1回答

具有实值特征的斯坦福分类器

、、、、

我想使用进行文本分类。我的特征主要是文本特征，但也有一些数字特征(例如句子的长度)。我从开始，将当前特性替换为一个简单的实值特性F，如果停止灯为BROKEN，则值为100，否则为0.1，结果如下所示(除了第10-16行中的makeStopLights()函数，这只是原始ClassifierExample类的代码)： public class ClassifierExample { protected static final String GREEN = "green"; protected static final String RED = "re

浏览 13提问于2017-02-09得票数 1

回答已采纳

1回答

如果模型输出层有多个神经元，并且只有一个值可预测，那么Tensorflow模型如何计算损失？

、

我最近注意到，我可以拥有并使用Tensorflow模型，该模型具有任意数量的输出，即使预测值只是一个真实值。例如，我可以有16个输出的模型，只有一个真正的目标值，然而，模型仍然没有错误的正常训练。我的问题是，在比较输出和目标值时，Tensorflow如何处理输出的不正确大小。怎样才能计算损失呢？它是试图使每个输出尽可能接近目标值，还是做某种平均？

浏览 7提问于2021-12-16得票数 1

1回答

如何用Pytorch计算语言模型的困惑

、、

我是微调GPT-2模型的语言生成任务使用拥抱面对变形金刚库-毕火炬，我需要计算一个评估分数(困惑)的微调模型。但我不知道如何利用损失来做到这一点。我想知道如何计算模型的困惑与sum_loss或平均损失或任何其他建议也是欢迎的。任何帮助都是徒劳无功。编辑： outputs = model(article_tens, labels=article_tens) loss, prediction_scores = outputs[:2] loss.backward() sum_loss = sum_lo

浏览 0提问于2020-05-24得票数 3

回答已采纳

2回答

为什么AES密文熵总是接近8？

、、

我有三个二进制文件： 31744字节长， 5712980字节长和 10806008字节长。字母表是从00到ff的全部256个符号。我计算香农熵，用频率代替概率。 H= 4.291334237835409 H= 7.999155088532762 H= 7.993862849926811 然后我用AES加密了这三个文件。字母表还是一样的。我计算了香农熵。 H= 7.255697988479884 H= 7.999970021706294 H= 7.999829860973214 好的，我看到了差别，加密数据的熵更高，这是预期的。但是，为什么加密数据的熵接近8而不成长呢？明文字节码的熵是随着数

浏览 0提问于2016-03-15得票数 2

回答已采纳

1回答

J48与马尔可夫链的区别

、、、

我试图用C#和F#领域中的不同算法的相对速率来评估WekaSharp，而我感兴趣的算法之一是马尔可夫链。我知道Weka有一个HMM应用程序，但是我无法将它实现到WekaSharp中，我想知道是否有一种方法可以修改J48算法以适应这个目的。我知道J48和一阶马尔可夫链之间有一些相似之处，但我试图确定需要修改什么，以及这是否是一件合理的事情。下面是在殷朱的J48中实现的WekaSharp： type J48() = static member DefaultPara = "-C 0.25 -M 2" static member MakePara(?binarySp

浏览 3提问于2013-11-27得票数 5

回答已采纳

1回答

我们能在最大熵模型中使用梯度下降法吗？

我看到很多实现使用GIS或IIS来训练最大熵模型。我们能用梯度下降法吗？如果我们可以使用它，为什么大多数教程直接告诉GIS或IIS方法，但不显示简单的梯度下降法来训练最大熵模型？正如我们所知，softmax回归相当于最大模型，但我从未听说过GIS或IIS在softmax中。为什么？是否有一个玩具代码使用简单的梯度去训练最大模型？我认为很容易实现一个玩具代码，它的推导只是计算经验期望和模型期望。

浏览 0提问于2016-07-10得票数 2

回答已采纳

1回答

如何加快tf.nn.softmax_cross_entropy_with_logits()中交叉熵损失的计算

我想建立一个多标签分类模型(每个例子都有多个标签，每个示例的标签数量都不是固定的)。例如，example1可能有类标签"X“、"Y"，而example2有类标签"X”、“Y”和"Z“。我的目标是计算这个多标签分类模型的交叉熵损失。我的第一个解决方案是手动创建目标类的密集、单热表示并计算损失。然而，当我的词汇量是O(10K)时，这个解决方案是缓慢的。我想知道是否有更有效的方法来做到这一点？更新以提供相关代码 ## During the data input phrase def input_fn(): ... ## target_id

浏览 3提问于2017-07-20得票数 0

回答已采纳

1回答

压缩校验和是否被认为是唯一的

、

我猜答案可能是否定的。由于压缩试图使用各种优化方法来缩小输出大小，这可能会取消哈希算法的属性。但是以下面的Python代码为例： >>> import zlib >>> import hashlib >>> zlib.compress(hashlib.sha256('data'.encode('utf-8')).digest()) 来自zlib压缩的输出是否被认为是唯一的？请注意，由于哈希值是相当随机的，因此不能有效地压缩它： >>> len(zlib.compress(hashlib.

浏览 0提问于2016-05-21得票数 1

回答已采纳

1回答

如何防范随机数生成器攻击

我使用的是自定义硬件，使用的是来自ADC转换器和其他几个种子的随机噪声。我将它们合并到一个算法中，并通过FIPS发布140-2对随机数生成器进行了测试。它已经通过了测试，但我正在阅读RNG攻击，并没有完全理解这些攻击。如果人们想弄乱我的种子，我能做些什么来对付它吗？硬件处于一个不安全的环境中，所以如果一次攻击经历了打开它、查找源等麻烦，我就没有办法对付它了。除了选择多个种子之外，您还能做什么来确保RNG的安全吗？

浏览 0提问于2015-03-04得票数 1

回答已采纳

1回答

如何知道时间序列是预测的还是随机的(单变量时间序列预测)？

、、、、

我试图根据变量的前10个值来预测变量的当前值。我尝试了多重时间序列方法，包括ARIMA，LSTM和线性回归。它们都没有很好的表现，所以我开始认为，我拥有的数据序列只是随机的，不可预测的。如果你有什么建议，请告诉我。或者，如果您知道我可以计算的任何度量，以确保我拥有的数据序列不只是随机的。对于LSTM，我尝试使用Window方法在以下链接中进行预测：https://machinelearningmastery.com/time-series-prediction-lstm-recurrent-neural-networks-python-keras/ 以下是我使用的自相关图、图和数据序列的一

浏览 0提问于2021-06-03得票数 3

回答已采纳

1回答

Tensorflow中的不平衡二进制分类

、、

我试图使用tensorflow (V.1.1.0)对输出层的单个神经元执行二进制分类。下面的片段对应于我目前使用的丢失函数和优化器(灵感来自答案)。 ratio=.034 #minority/population ratio learning_rate=0.001 class_weight=tf.constant([[ratio,1.0-ratio]],name='unbalanced_ratio') #weight vector, (lab_feed is one_hot labels) weight_per_label=tf.transpose(tf.matmul(lab_

浏览 2提问于2017-08-02得票数 0

回答已采纳

1回答

这个密码生成器安全吗？

、

128位熵 http://nxtra.org/nxt-client/js/passphrasegenerator.js 对于所有新浏览器(Chrome、Firefox、IE11)，它都使用应该是安全的crypto.getRandomValues，但对于IE10(及更早版本)，它使用用户随机输入的鼠标与Math.random相结合 $("html").on("mousemove", function(e) { var seed = [e.pageX, e.pageY, +new Date]; PassPhraseGe

浏览 0提问于2014-03-19得票数 3

3回答

Python NLTK最大熵分类器错误

、、、

我目前使用的是NLTK的朴素贝叶斯分类器，不过我也想尝试一下Max Ent分类器。从文档中看，它应该采用与Naive Bayes相同的功能集格式，但由于某种原因，我在尝试它时遇到了这个错误： File "/usr/lib/python2.7/site-packages/nltk/classify/maxent.py", line 323, in train gaussian_prior_sigma, **cutoffs) File "/usr/lib/python2.7/site-packages/nltk/classify/maxent.py"

浏览 0提问于2012-04-05得票数 3

3回答

如何比较图片并判断哪个图片的内容更多？

、、、

目标:我想从动画GIF中抓取最好的帧，并将其用作静态预览图像。我认为最好的框架是显示最多内容的框架-不一定是第一帧或最后一帧。以这个GIF为例： -- 这是第一帧： -- 这是第28帧：很明显，第28帧很好地代表了整个GIF。如何以编程方式确定一个帧是否比另一个帧具有更多的像素/内容？任何想法，想法，包/模块，或文章，你可以告诉我，将非常感谢。

浏览 1提问于2017-08-09得票数 6

1回答

用散列秘密播撒GPG密钥源

、、

可能重复: 用于公钥加密的工具，其中密码是私钥？我想知道你们是否可以告诉我使用散列密码作为GPG密钥生成器种子的潜在问题。至于为什么有人会想这样做，我可以看到两个好处：使用令人难忘的密码可以消除将密钥存储在磁盘上的需要，从而在发生数据盗窃时保护您免受身份盗用。由于用户的内存包含重新生成密钥所需的所有内容，因此不需要担心电子数据丢失。痴呆症仍然适用。正如Stephen指出的那样，原因1很弱，因为密码保护的RSA密钥也有这个好处。RAM仍然是脆弱的，但这也很难获得访问，对吗？但是，假设人们对备份(他们不是)和理由2是有效的，那么使用散列作为RNG种子是否存在潜在的系统性问题？

浏览 0提问于2012-10-20得票数 2

回答已采纳

1回答

是什么创建了‘`maxent_treebank_pos_tagger/english.泡菜’？

、、、

nltk包的内置语音标记似乎没有针对我的用例()进行优化。显示它使用了一个名为maxent_treebank_pos_tagger的保存的、经过预先训练的分类器。是什么创造了maxent_treebank_pos_tagger/english.pickle？我猜外面有一个标记语料库，用来训练这个标记者，所以我想我正在寻找(a)标记语料库和(b)基于标记语料库训练标记者的确切代码。除了大量的googling之外，到目前为止，我试图直接查看.pickle对象，以找到它内部的任何线索，从下面开始 from nltk.data import load x = load("nltk_data

浏览 0提问于2015-07-13得票数 10

2回答

scikit-learn默认使用哪种决策树算法？

、

有几种算法可以构建决策树，例如CART (分类和回归树)、ID3 (迭代二叉树3)等 scikit-learn默认使用哪种决策树算法？当我查看一些决策树python脚本时，它使用fit和predict函数神奇地生成结果。 scikit-learn会根据数据聪明地选择最好的决策树算法吗？

浏览 25提问于2019-08-21得票数 2

回答已采纳

1回答

神经网络回归预测的截止点

、、、

上下文:我有一组文档，每个文档都有两个相关的概率值:属于A类的概率和属于B类的概率。例如，文档D的概率(0.6，0.4)与地面真理相关联。每个文档都由它所包含的术语的tfidf表示，从0到1，我还尝试了doc2vec (规范化表单-1到1)和一些其他方法。我建立了一个非常简单的神经网络来预测这个概率分布。输入层，节点数与功能相同。单节点隐藏层具有最大软件和两个节点的输出层交叉熵损失函数我还尝试了不同的更新功能和学习速度。这是我用诺尔学习编写的代码： net = nolearn.lasagne.NeuralNet( layers=[('

浏览 8提问于2016-08-13得票数 3

2回答

python支持向量机的主动学习(如池抽样)

、、

我正在研究一个问题，它将极大地受益于主动学习协议(例如，与现有模型相比，给定一组未标记数据，该算法要求由“oracle”标记未标记数据的子集)。有没有人在支持向量机(最好是python)中实现主动学习(使用池抽样、委员会查询或其他方式)的示例？

浏览 5提问于2016-05-03得票数 7

回答已采纳

1回答

微分隐私可以用来证明两个发行版是不可区分的吗？

差分隐私可以用来证明某种计算的“隐私损失”是有意义的“有界”的。在密码学中，通常考虑“不可区分性”，即我们希望\Delta(D_0, D_1)是小的。这两个概念可以联系起来吗？我模糊地知道，差异隐私的标准概念可以与诸如“集中式差异隐私”这样的东西相关，这本身就是两个发行版上的Renyi类型的界限(这与我想要的总变化距离界有点类似)。但我想用“所以，这两个发行版是无法区分的”来结束我的论证--差异隐私能帮助我实现这个目标吗？

浏览 0提问于2021-03-15得票数 2

1回答