在scikit learn的LDA实现中，transform和decision_function有什么不同？_scikit learn中的多元计算器与简单计算器有什么不同？_使用sklearn时，python中的fit、transform和fit_transform有什么不同？ - 腾讯云开发者社区

因此，我在数据和标签上训练LDA，然后使用transform(X)或decision_function(X)将数据投影到一维空间。我想了解这两个函数之间的区别。我的直觉是decision_function(X)应该是transform(X) + bias，但事实并非如此。此外，我发现这两个函数给出了不同的AUC分数，因此表明它不是我所认为的单调转换。在文档中，

浏览 53提问于2021-05-07得票数 1

2回答

学习LDA函数图中的缺陷显示出非零相关性。

、、、

我使用scikit-learn的LDA函数做了一些LDA，在我得到的图表中我注意到LDs之间有一个非零的相关性。from sklearn.lda import LDAtransf_lda = sklearn_lda.fit_trans

浏览 9提问于2014-07-28得票数 7

回答已采纳

1回答

费舍尔投影降维算法与其它LDA方法的比较

、、

与其他LDA降维方法相比，Fischer投影的性能如何？我认为Fischer投影是通过最大化类分离来减少维数的一种很好的方法，但是当我查看scikit learn中的LDA方法时，Fischer投影甚至没有出现在列表中。这让我想，和外面的其他方法相比有什么好处吗？编辑(回答)：我的错，他们是一样的。Fischer投影是

浏览 0提问于2018-03-12得票数 0

回答已采纳

1回答

如何利用LDA获取主题建模中每个文档的主题概率

、、

我使用scikit-learn LDA来生成LDA模型，然后我可以得到主题-术语。我想知道如何才能得到每个文档的每个主题的概率？

浏览 0提问于2018-04-09得票数 1

回答已采纳

1回答

从LDA中获取主题-词分布

、、

我想知道在scikit learn的LDA实现中是否有一种返回主题-单词分布的方法。类似genism的show_topics()方法。我查了文件但什么也没找到。

浏览 5提问于2017-05-26得票数 14

回答已采纳

2回答

在scikit* learn中，predict_proba和decision_function有什么不同？*

我正在学习 (分类器比较)，并且把predict_proba和decision_function搞混了。这两个有什么不同？是不是每种分类方法都有这两种方法中的一种作为分数？哪一个更适合解释分类结果，我应该如何从两个中选择？

浏览 2提问于2016-04-11得票数 38

回答已采纳

1回答

机器学习.多标签分类svm

、、、

在Python的多类分类中使用支持向量机有困难。事实上，问题是关于性别分类(从图像)，其中培训数据集只包含"y=1“或 "y=-1”作为类标签(二进制)。但是，在预测中，如果是男性，我必须预测"1“，如果它是女性，则必须预测"-1”，如果分类器不知道，则必须预测"0“。我不知道如何添加这个"0“类。我该用什么？decision_function？PS:分数是这样计算的：

浏览 0提问于2017-03-25得票数 0

回答已采纳

1回答

在nltk中使用scikit-learn分类器，多类情况

、、

文本文档的分类是一个，但在NLTK中没有一个干净的支持，也有像这样困难的方法来做这件事的示例。我想用NLTK进行预处理，并用sckit-learn进行分类，我在NLTK中发现了SklearnClassifier，但有一个小问题。在scikit-learn everything is OK：from sklearn.multi

浏览 2提问于2012-11-23得票数 6

回答已采纳

1回答

SciKit FastICA返回什么，FastICA和fastica之间的区别是什么(都返回不同的值)？

、、

我试着在学校里使用scikit学习模块进行机器学习练习。我试图重建的练习已经给出了一个例子，在sklearn文档中，使用ICA 实现的盲源分离。此示例基本上生成3个信号(或声源)，然后与添加的噪声合并，然后尝试使用ICA重建原始源。很简单，对吧？然而，我有以下的困惑： FastICA到底返回了什么？我试图找出'ica‘是什么，以便准确地理解ica.fit_transform</

浏览 1提问于2016-06-22得票数 3

回答已采纳

2回答

使用xgboost进行校准

、

我想知道我是否可以在xgboost中进行校准。更具体地说，xgboost是否像scikit learn一样提供了现有的校准实现，或者是否有一些方法可以将xgboost中的模型放入scikit learn的CalibratedClassifierCV据我所知，在sklearn中这是一个常见的过程： # Train random forest classifier,

浏览 3提问于2016-02-24得票数 12

3回答

科学-学习-我应该适合TF或TF-以色列国防军模型吗？

、、、

我试图找出适合不同概率模型的最佳方法(如潜隐Dirichlet分配、非负矩阵分解等)。查看sklearn文档中的示例，我想知道为什么LDA模型适合TF数组，而NMF模型适合TF-国防军数组。这一选择有确切的原因吗？下面是示例：http://scikit-learn.org/stable/auto_实例/应用程序/主题_抽提_使用_nmf_lda</

浏览 0提问于2016-10-21得票数 4

1回答

如何从科学学习中运行和解释Fisher线性判别分析

、、

基本上，如果我错了，如果n个样本被分类在几个类别中，Fisher's LDA试图找到一个轴，在这个轴上投影应该使J(w)值最大化，即总样本方差与不同类别内方差之和的比率。我认为这可以用来为每个类找到最有用的特性。我有一个样本分类y，即n个标签数组，每个标签对应每个样本。基于y，我希望将特征的数量减少到，例如，3个最具代表性的</e

浏览 5提问于2014-04-24得票数 4

回答已采纳

1回答

在scikit-learn的LDA实现中，我如何在整个语料库中按频率对主题进行排序？

、、

我已经使用了scikit-学习执行LDA主题建模，我最终想按整个语料库的显着性/频率对主题进行排序，但我不知道如何做到这一点。LDA.fit(tf) 据我所知，最好的解决方案可能是使用从LDA.

浏览 0提问于2021-07-28得票数 1

回答已采纳

2回答

scikit learn中的"decision_function“是如何计算分数的？

、、

我想定义decision_function()是如何工作的，我的意思是，如果有什么等价的东西能够报告工作中的那个函数。我想在scikit-learn中的SVC中看到这些信息，我正在使用线性、多边形和rbf内核。我正在用"ovr“多类方法训练我的模型，但我找不到在我的文章中如何计算分数来报告函数。这在

浏览 3提问于2020-10-28得票数 0

1回答

pyspark.sql.utils.IllegalArgumentException：‘字段’features‘不存在

、、

我正在尝试通过SparkNLP对文本数据进行主题建模和情感分析。我已经对数据集执行了所有预处理步骤，但在LDA中遇到错误。get_tokenizers = Tokenizer(inputCol="headline_text", outputCol="get_tokens") remover = StopWordsRemover(inputCol="get_toke

浏览 187提问于2021-04-22得票数 1

回答已采纳

1回答

SGD分类器精度-召回曲线

、、、、

我正在研究一个二进制分类问题，我有一个sgd分类器，如下所示： max_iter = 1000, validation_fraction = 0.2,)disp = plot_precision_recall_curve(sgd

浏览 1提问于2021-05-09得票数 1

回答已采纳

1回答

无法用sklearn绘制Python中的2类线性判别分析

、

谢谢你阅读我的问题-我将非常感谢任何意见！我有一个分类问题，简称为T和非T。我有一个名为PODall的数据，它包含我的数据及其标签(0 (非T) vs 1 (T))。我已经使用sklearn模块来运行这一分析。我借用了的代码，以便能够可视化我的数据，即绘图

浏览 3提问于2021-01-09得票数 0

1回答

LatentDirichletAllocation巨蟒

、、

我通过python库的scikit为LatentDirichletAllocation使用了以下代码：tf = tf_vectorizer.fit_transform(documents) lda_W = <

浏览 31提问于2018-05-28得票数 0

回答已采纳

1回答

我可以安全地分配给`coef_`和其他估计参数在科学知识-学习？

、

学习用于模型持久性的泡菜。然而，他们注意到泡菜的局限性，当涉及到不同版本的科学知识-学习或巨蟒。(另见)现在，我的问题是：可以通过持久化估计的属性来实现持久性，并在以后分配给它们吗？这种方法对所有的估计器都是安全的，还是在

浏览 4提问于2017-09-20得票数 6

回答已采纳

1回答

在SciKit学习或Gensim (Python3)中调整LDA超参数？

、、、、

我正在尝试Gensim和SciKit learn (Python3)中的主题建模，我想了解更多关于在这两个包中调整超参数的信息。我在GITHUB上找到了一些相关的讨论，例如"optimize hyperparameters as part of LDA training"，但没有完整的文档。我甚至不确定在SciKit学习中超参数优化是不是可能<

浏览 31提问于2021-01-20得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云