学算法的重要性_学算法需要学什么_学算法需要学代码 - 腾讯云开发者社区

、、

我有一个二进制分类问题，其中大多数特征都是分类的，有4个可能的值:是的，不，无关的，nan。我试图找出这些特性对目标列(二进制)的模块化全局特性的重要性。这些列表示特定过程中的检查。如果某一特性有任何问题，则值为“是”，否则为“否”。如果对某个程序来说，某个检查是不相关的，那么答案将是“不相关的”。 | Feature 1 | Feature 2 | Target | | --------- | ---------- | ------ | | Yes | Irrelevant | Yes | | No | Yes | Yes |

浏览 0提问于2022-06-26得票数 1

1回答

在机器学习中有类似于即席学习的方法吗？

、

当我们使用机器学习方法时，我们将数据集划分为测试和训练数据，实际上，我们总是通过使用所有数据，然后为一个新的查询计算y值来使用一种自组织方法。但是，是否有一种特殊的方法，我们可以逐个特性来查询一个新查询，看看我们的预测是如何变化的呢？这样做的好处是我们确切地知道是哪个特性改变了预测，以及如何改变了预测。如果有任何建议，包括参考文献，我将不胜感激，因为我真的不知道如何搜索它。还可能没有正确选择“临时办法”一词。

浏览 2提问于2022-08-29得票数 -1

1回答

随机林的混合预测类型

、、、

我试图建立一个使用随机森林的分类模型，用于一个包含5个预测变量的数据集。两个预测变量是连续型的，一个可以是[0, 1000]区间中的实值，另一个可以是[-10, 10]的实值；一个预测变量是[10000, 15000]的整数值。另外，剩下的两个预测变量具有分类值，即{ A, B, C, D, E F}和{NY, LA, Chicago}。是否需要对这些不同的预测器类型进行预处理？

浏览 1提问于2014-08-18得票数 1

回答已采纳

1回答

一些已知的匹配算法是什么？

也就是说，给定一组人，每个人都有给定的特征，是否有一个众所周知的算法可以成功地将最相似的人配对。我是不是想多了，或者有没有什么标准化的方法来实现它？

浏览 0提问于2012-07-29得票数 0

1回答

最有效的格问题求解算法是什么？

我最近对后量子密码学非常感兴趣，特别是基于点阵的密码学。在这篇文章中，没有一种量子算法能比传统的计算机更好地解决点阵问题。然而，有一些算法理论上可以解决格点问题，尽管速度很慢。我想自己研究这些算法中的一个或多个，以帮助我更好地理解格密码学和一般格。那么，什么是最有效的格问题求解算法，为什么它是如此有效？

浏览 0提问于2019-06-21得票数 1

回答已采纳

1回答

确定决策树回归使用的关键列/功能

、、

在Azure ML中，我有一个使用boosted决策树回归的预测回归模型，它相当准确。输入数据集有超过450列，该模型在没有过度拟合的情况下，对测试数据集进行了很好的预测。为了报告结果，我需要知道模型主要用来进行预测的特征/列，但在查看经过训练的模型数据时，我很难找到这些信息。如何识别此信息？我很高兴将结果数据集导入到R中，以帮助找到这一点，但我只需要指示开始工作的方向。

浏览 0提问于2017-07-10得票数 0

2回答

私钥加密和对称加密有区别吗？

我经常看到这些术语可以互换使用，但这是对的吗？是否有不使用对称加密的私钥算法？

浏览 0提问于2016-11-19得票数 1

回答已采纳

2回答

处理和理解句子

、、、、

我正在尝试写一个简单的代码，它可以处理句子中的单词来形成意义。我已经尝试开发一个好的算法很长一段时间了，无论我如何尝试，这个算法总是过于复杂和冗长。如果你有什么建议，我将不胜感激。谢谢

浏览 0提问于2011-02-21得票数 0

回答已采纳

1回答

学习随机森林以查找所选要素的分数

、、、

我正在尝试理解每个选择的特征所获得的相关分数。到目前为止，我已经尝试过了： classifier = SelectFromModel(RandomForestClassifier(n_estimators = 100)) m = classifier.fit(train.drop(columns='indicator'), train.rg_risk) X_train = train.drop(columns='indicator') selected_feat=X_train.columns[(classifier.get_support())]

浏览 17提问于2020-05-05得票数 1

1回答

量子计算及其威胁

、、、

因为量子计算机有成为下一代超级计算机的潜力。这会使密码学过时吗？

浏览 0提问于2015-10-30得票数 -1

2回答

是否有一种与模型无关的方法来确定特性的重要性？

Sklearn有一个feature_importances_属性，但这是高度特定于模型的，我不知道如何将其解释为删除最重要的特性并不一定会降低模型的质量。是否有一种与模型无关的方法来判断哪些特性对于预测问题很重要？我能看到的唯一方法是：使用不同型号的集合要么从一大组特性开始，然后一次删除一个。若要查找“提升”功能，请将集合质量与完整特征集与整体质量与移除特征集进行比较。 (这不能做的是找到连接的特性:某些特性可能不完全相同，但是有一个共同的潜在原因，这对预测很重要。因此，移除两者都不会有太大变化，但两者都可能会发生很大变化。我向另一个问题要这个。)

浏览 0提问于2017-10-21得票数 6

回答已采纳

2回答

XGBoost模型具有特征重要性等于零的特性。

、

我遇到了这个问题：一个包含100个特征的XGBoost模型(.pickle文件，在V0.7.post3下构造)，但我在模型(model.feature_importances_)中发现55个特征的重要性为0(如下面的矩阵)；另外，当我将泡菜文件转换为PMML (启动在线)时，PMML文件中只有45个特性(那些显然带有importance>0 )；所以，我的问题是： --为什么重要性等于0的特性最终出现在XGB模型中？如果他们没有真正参与/参与分裂，为什么他们会留在这个模型中呢？ ## Feature importance maxtrix from model for demo ar

浏览 0提问于2022-01-27得票数 2

1回答

图显示自变量和因变量(二进制)之间的关系

我的因变量是二进制。我的自变量大多不是。我现在正处于探索阶段。 Y X1 X2 0 23 0 1 29 1 0 15 1 1 40 0 1 25 1 0 22 1 This is just a portion of my data. 我想用散点图来找出Y X1和X2之间的关系。我还能做些什么来更清楚地看待这段关系。

浏览 0提问于2018-05-17得票数 1

回答已采纳

3回答

用随机森林选择重要变量，然后进行logistic回归？

、、

我在想，用随机森林来选择最重要的变量，然后放入logistic回归进行预测是否有意义？我认为这可能没有什么意义，因为什么是重要的随机森林可能不是重要的逻辑回归？

浏览 0提问于2017-04-22得票数 0

回答已采纳

1回答

为什么变量重要性没有反映在实际用于树构造的变量中？

、

我使用以下代码在R上生成了一个(未修剪的)分类树： fit <- rpart(train.set$line ~ CountryCode + OrderType + Bon + SupportCode + prev_AnLP + prev_TXLP + prev_ProfLP + prev_EVProfLP + prev_SplLP + Age + Sex + Unknown.Position + Inc + Can + Pre + Mol, data=train.set, control=rpart.control(minsplit=5, cp=0.001), method="c

浏览 0提问于2018-03-11得票数 1

回答已采纳

1回答

当前加密的量子安全风险

、

量子计算机将决定传统加密技术的命运。其中，受到最大打击的将是99 %的应用程序使用的RSA算法--任何安全传输和存储通信数据或软件更新的加密标准。对于不可避免的问题，有什么解决办法？

浏览 0提问于2018-06-19得票数 0

2回答

生物信息学数据结构

参与生物信息学的人应该知道哪些数据结构？我想每个人都应该知道列表、散列、平衡树等等，但我希望有特定于域的数据结构。有专门讨论这个问题的书吗？谢谢，卢西恩

浏览 0提问于2010-11-30得票数 -1

1回答

密码学未来的发展方向是什么？更大的数目/更快的搜索，或者新的方法，例如，保理？

、、

我正在上密码学的课程，我很重视任何评论。这不是太技术性的问题，而是更多关于密码学的方向或策略的问题。我的问题是，例如，公钥密码学“只是”一个处理大整数的困难的问题吗？我可以理解，分解两个大素数的乘积是很费时的。是否有一种基本的信念，即可能开发新的保理方法，这将导致打破一些密码，或推动数字大小的要求越来越高？还是行业专业人士更倾向于更快、更大的数字处理能力，作为最有可能的未来？

浏览 0提问于2013-01-02得票数 2

2回答

如何在异常点检测中增加权重

、

假设我们有特征A，B，C，D，E来表示孤立点检测模型中的一个观测值。在我们的案例中，我们使用的是scikit-学习异常点的检测。 AFAIK，如果我们规范所有的功能，它们和其他功能一样重要。如果我想使B变得非常重要，例如，如果A，C，D，E增加20%，观测值仍可视为正常情况，而B值增加10%，则需要将观测值标记为异常值。在孤立点检测模型中，有增加或减少特征权重的方法吗？

浏览 0提问于2017-09-12得票数 3

1回答

基于格的密码学实用吗？

、

格型密码学在“实用”环境中的可行性有多大？有人说，基于格的密码学将是一个后量子密码体制，但它是可行的吗？

浏览 0提问于2018-08-19得票数 14

回答已采纳

1回答

根据流量对节点进行排名(传入/传出)

、、

我正在做一个关于交通交叉口的研究在这个研究中我试图找到有影响力的节点，也就是…哪些交叉点会相互影响，我试图将我的网络表示为一个图网络，所以我搜索了网络中已经使用的算法，希望将同样的算法应用到我的问题中，我遇到的是PageRank算法，但它似乎只取决于链接的数量，但在我的情况下，我也想考虑流量是否有一些算法可以帮助我实现这一点？

浏览 1提问于2014-02-16得票数 0

2回答

如何改变Xgboost中的特性

、、

我有一个附加的功能，在XGBOOST功能重要性评分中得分为0。不过，我想让我的模型考虑一下。是否有允许编辑(蛮力)特性重要性的解决方案？否则，有什么理论可以解决我的问题吗？提前谢谢。

浏览 0提问于2018-11-12得票数 1

回答已采纳

1回答

解释混沌密码学

、、、

我将冒险学习混沌密码学。然而，我发现很难向那些对密码学有一定了解的人解释混沌密码学的含义。我也不能向那些不知道什么是密码学的人解释--在一个更基本的层面上。你能帮我解释一下混沌密码学吗？

浏览 0提问于2018-12-10得票数 3

4回答

谷歌PageRank:它是按域名还是按网页计算的

谷歌的PageRank是作为整个网站(域名)的一个值计算的，还是为每个网页计算的？

浏览 13提问于2009-02-25得票数 2

回答已采纳

1回答

二元分类问题中最主要因素的推导

、、、、

我有一个二进制分类问题，大约有30个特征和一个最终通过/失败标签。我首先训练了一个分类器，以便能够预测新的实例将通过或失败，但现在我想得到一个更深入的理解。如何根据这些项目的特性对这些项目通过或失败的原因进行一些分析？理想情况下，我希望能够显示出与每个因素相关的权重的最大贡献因素。更复杂的是，我的特征不一定是统计上相互独立的。我应该研究什么样的方法，哪些关键字会指向正确的方向？的一些初步想法：使用决策树分类器(ID3或CART)，并查看树的顶部以寻找顶层因素。我不确定这种方法会有多强大，我也不清楚如何分配每个因素的重要性(一个人只会得到一个有序的列表)。

浏览 3提问于2019-01-30得票数 0

回答已采纳

1回答

密钥交换与密钥封装

、、、、

据我所知，密钥交换协议的步骤包括 Alice和Bob各自使用自己的公钥和私钥加密某些内容，并将结果发送给对方。 Alice和Bob各自用自己的私钥和对方发送的结果执行某种机制。他们应该就秘密达成一致。关键封装是 Alice生成一个密钥和公钥，并将公钥发送给Bob。 Bob生成自己的密钥并使用Alice的公钥对其进行加密。他把结果寄给爱丽丝。 Alice使用她的私钥解密结果，最后得到Bob的密钥。这是正确的吗?如果不正确，是否有人能澄清我误解或遗漏了哪些部分？查看NIST PQC KEM提交的已知答案测试，当提供种子时，每个算法返回密钥、公钥、密码文本和共享秘密。共享秘密鲍勃的私钥和密

浏览 0提问于2020-01-23得票数 6

1回答

数字证书、详尽的用途和参考资料集

、、、

就安全性的细节而言，我是一个新手，是concerned.can，有人列出了数字证书的所有可能用途？它被用于SSL，签名和其他什么？此外，是否有一本好的参考书或文章可以全面了解证书？

浏览 0提问于2019-11-06得票数 -3

1回答

使用SPSS的MLP-NN来衡量排名的重要性的指标是什么？(SPSS中有没有类似Matthew系数的东西？)

、

我使用了SPSS的多层感知器模型，根据变量对特定目标的重要性来对一些变量进行排名。我的问题是。用来衡量模型性能的指标是什么？在非SPSS NN模型中，人们会使用类似Matthew系数的东西来衡量性能，SPSS中是否有MLP-NN的度量标准？

浏览 15提问于2019-11-25得票数 0

1回答

聚类算法，其结果不受数据置换和引导扰动的影响

、、、、

我想知道，在文献中是否有一种聚类算法，其输出(分区、树状图、软赋值等)不变性：数据点中的排列(通常许多层次聚集聚类不是这样) 由于引导特征而引起的扰动我很高兴在文献中找到这样一个算法的切入点！准确地说，我知道聚类的公理式，例如Kleinberg的不可能性定理()或聚类分类法()的开始，但他们似乎没有考虑过这两项属性。

浏览 4提问于2015-01-21得票数 0

回答已采纳

3回答

关于特征选择技术的建议？

、、、、

区块报价我是一名学生，机器学习的初学者。我想做特写列的选择。我的数据集是50000×370，这是一个二进制分类问题。首先，我用std.deviation = 0删除了列，然后删除了重复列，之后我检查了具有最高ROC曲线区域的前20个特性。PCA的下一步应该是什么？有人能给出一系列的步骤来进行特征选择吗？

浏览 1提问于2016-04-14得票数 0

1回答

如何衡量算法的重要性？

、、

我正在尝试理解深度学习的算法和统计逻辑。然而，我不能理解两个算法A和B分别以75%和78%的测试集精度存在的情况。如果测试集包含100个实例，这是否意味着算法A明显优于算法B？

浏览 7提问于2020-06-06得票数 0

1回答

使用经过训练的非线性回归模型识别最大预测值的变量。

、

我训练了一个具有23个特征的非线性回归模型。我试图确保模型不与验证数据的~0.6r平方和实际与模型预测目标值之间的0.75相关系数过拟合。我想知道做以下工作是否有意义。使用该模型识别将最大限度地提高预测值的23个特性的值：例如，考虑一个预测房价的模型: avg_area_price和平方英尺，然后确定avg_are_price和平方英尺的值，这将导致最高房价。注意，我们可能没有在数据中观察到这一点，但是回归模型捕获了输入特性到输出关系，因此它可以识别这一点。我试着去研究它，发现线性规划可以帮助实现线性回归。https://stats.stackexchange.com/question

浏览 0提问于2021-05-10得票数 1

2回答

“非对称密钥密码体制”“非对称密码学”术语有什么区别？

、

“非对称密码学”和“非对称密钥密码体制”术语有什么区别？

浏览 0提问于2019-08-26得票数 1

回答已采纳

1回答

随机森林重要特征输出稳定性问题

、、

我拟合了两个几乎相同的随机森林回归模型。这两种模型使用相同的数据集，其中有60个特征和90个数据点。唯一的区别是它们使用的是不同的目标(当然，每个模型的目标列被排除在各自的特性数据格式之外)。两个模型的交叉验证设置都是相同的(折叠次数、迭代次数、评分)和超参数网格也是相同的。我对特性重要性输出感兴趣。然而，其中一个模型始终输出相同的顶级功能，而另一个没有。有人知道为什么会这样吗？

浏览 1提问于2022-07-05得票数 0

1回答

h2o随机森林中“重要性”的度量是什么？

、、

这是我的代码： set.seed(1) #Boruta on the HouseVotes84 data from mlbench library(mlbench) #has HouseVotes84 data library(h2o) #has rf #spin up h2o myh20 <- h2o.init(nthreads = -1) #read in data, throw some away data(HouseVotes84) hvo <- na.omit(HouseVotes84) #move from R to h2o mydata <- a

浏览 5提问于2016-03-15得票数 9

回答已采纳

1回答

隔离森林特征重要性

、、、、

对于scikit-LearchVersion0.19.1，在隔离林中没有计算特性重要性的实现。我也很难找到任何在线资源，提出解决问题的方法。有没有人知道这样做的方法，或者有什么建议？以下是我一直在思考的一些想法：为每个树中的每个节点计算某种类型的“隔离度量”(例如样本分割的%)，并为每个拆分特性获得该度量的平均值。模型拟合后，一次对每个特征进行遍历，对该特征的数据进行随机排序，并计算异常分值。然后计算异常分数的平均变化。所有的见解都欢迎。谢谢!

浏览 0提问于2018-07-06得票数 5

1回答

轻量级非对称加密算法

、、、

我是一名嵌入式系统研究人员，也是密码领域的新手。实际上，我需要知道是否有任何轻量级的非对称加密算法，特别是考虑到密钥生成所需的时间。我发现NTRU被认为是最轻量级的非对称密码系统之一，对吗？

浏览 0提问于2015-12-15得票数 4

2回答

自动对比度和亮度(用于OCR)

、、、、

你知道这是否可能吗？

浏览 0提问于2011-05-04得票数 2

1回答

估计事件时间戳之间的时间延迟

、、

我有两个设备(在本例中是计算机)，每个设备都具有本地时钟和时间戳数字事件的能力，即它们可以检测和时间戳输入数字转换，并产生和时间戳输出数字事件。我的目标是找出这两个设备的时钟之间的偏移量。我有两种物理机制来实现这种同步:我在随机(但精确地有时间戳)从一个设备发送一个数字脉冲到另一个设备，而且我有一个外部源，它发送正在记录的脉冲，并在这两个设备上加盖时间戳。有一种可能，一个设备开始记录更早，甚至跳过一些事件。示例：记录时间戳设备1：0,100,125,200,275,300 装置2：1000,1025,1100,1175,1200,1450 这种情况下的时间延迟是900 (设备1上的事件

浏览 8提问于2015-04-03得票数 0

1回答

如何裁剪图像的roi

、、

在我的项目中，我想裁剪图像的ROI。为此，我创建了一个包含感兴趣区域的地图。现在我想裁剪具有最重要像素的区域(黑色不重要，白色很重要)。有没有人知道如何实现它？我认为这是一个最大化的问题下图中的红色边框是我想如何裁剪这张图的一个例子

浏览 0提问于2012-12-05得票数 2

回答已采纳

1回答

第一次预测的精确度、F分数和召回率高

、、、

我已经打印了我的SVM模型预测二进制类的分类报告，但它在第一次预测中得分很高(超过95%)，我知道当它打印高值时是好的，但之后我需要进行特征选择，你认为这是正常的吗？什么样的特征选择适用于二分类？

浏览 0提问于2020-06-10得票数 0

2回答

是否有一些算法不支持高效的并行实现？

、、、

这是我感兴趣的一个非常简单的研究问题。是否有一些算法的例子，或仅仅是一些代码，可以有效地实现，但不支持高效的并行化？

浏览 3提问于2014-01-12得票数 2

回答已采纳

2回答

为什么当我用相同的数据集构建模型但使用catboost时，xgboost模型中最重要的特性一点也不重要？

、、、、

Feature Importance From Xgboost: ('A', 20.263429) ('B', 14.631438) ('C', 49.617475) ('D', 1.7183341) ('E', 0.0) ('F', 4.438192) ('G', 4.4471968) ('H', 0.75913663) ('I', 4.1248) Feature Importance From Catboost: ('A', 31

浏览 0提问于2019-12-27得票数 1

1回答

使用堆叠集成的特征选择？

、、

我想组合一些估计器，例如Logistic Regression、Gaussian NB和Features Selection的K-Nearest Neighbors，我尝试使用StackingClassifier()估计器来实现，但是这个估计器没有feature_importances_属性。有没有其他方法可以结合这些分类器来选择特征呢？ (预先谢谢:)

浏览 0提问于2021-06-16得票数 0

1回答

如何更好地产生大素数:筛选，然后随机采摘或随机采摘，然后检查？

、

我正在编写RSA算法，我想知道选择初始素数(p和q)的最佳和/或通常方法是什么。我知道有两种方法可以实现这一点，一种是基于素数筛子，另一种是基于素数测试：使用素数筛在随机范围内找到素数，然后从筛的输出中随机选取素数。随机挑选一个数字，然后测试它是否是素数。从安全和效率的角度来看，什么是最好的方法？

浏览 0提问于2012-02-04得票数 9

回答已采纳

1回答

“量子安全”算法与当前的“安全”密码算法(前量子算法)有什么根本区别？

我最近读到，正在开发用于加密/散列的“量子安全”算法。据推测，这些算法将与目前使用的“非量子安全”算法(RSA、DH、AES、ChaCha20、Poly1305、SHA3 2/SHA3 3等)有着根本的区别。哪些基本差异使算法成为“量子安全”？在非量子计算机中，量子安全算法是否更加脆弱？

浏览 0提问于2021-07-22得票数 4

回答已采纳

4回答

不安全的加密系统

我是密码系统的新手，但我看过很多消息来源即使是好的算法和好的密钥也不够，我有点困惑，为什么呢？

浏览 0提问于2009-07-12得票数 1

回答已采纳

2回答

块密码用于公钥密码吗？

我读过关于块密码的文章，大多数文章都说它们被用于对称密钥加密。它们是否也被用于公钥密码学？如果不是，pkc的替代用途是什么？谢谢,

浏览 0提问于2013-06-04得票数 5

1回答

客户端加密软件的开发过程

、

我希望研究开发加密软件背后的过程。我特别感兴趣的是从系统分析( Systems，SA)的角度来看待软件过程。经过一些广泛而详尽的搜索后，我一直无法找到讨论加密软件设计策略、方法、用户启发等问题的来源。我尝试了我能想到的、至今仍能想到的谷歌搜索词的每一种可能组合，但并不完全是我想要的。也许这是寻找这些信息的错误方法，但我认为这可能会提供一些急需的洞察力。具体问题包括：哪一种方法与加密软件设计的效果很好？瀑布还是敏捷？开发过程的不同阶段是什么？是否有任何与加密算法设计有关的行业标准？任何正确方向的帮助或指导都将不胜感激。

浏览 0提问于2016-12-06得票数 -1

1回答