Lime解释器显示不同于分类器预测的预测概率-情感分析

Lime解释器是一种用于解释机器学习模型预测结果的工具，它与分类器预测的预测概率不同，主要用于情感分析任务。

情感分析是一种通过自然语言处理技术来识别和分析文本中的情感倾向的任务。它可以帮助我们了解用户对于特定主题或产品的情感态度，从而为企业决策提供参考。

Lime解释器通过生成可解释的解释模型来解释机器学习模型的预测结果。它基于局部线性模型，通过对输入文本进行微小的扰动，观察模型预测结果的变化，从而推断出模型对于不同特征的重要性。

Lime解释器的优势在于它能够提供对于模型预测结果的解释，帮助我们理解模型是如何做出预测的。这对于调试和优化模型非常有帮助，同时也增加了模型的可信度和可解释性。

在情感分析任务中，Lime解释器可以帮助我们理解模型对于不同文本特征的重要性，从而解释模型为什么会给出某种情感倾向的预测结果。这对于了解用户对于特定产品或主题的情感态度非常有帮助。

腾讯云提供了一系列与情感分析相关的产品和服务，其中包括：

自然语言处理（NLP）：腾讯云的NLP服务提供了情感分析功能，可以帮助用户快速实现情感分析任务。详情请参考：腾讯云自然语言处理（NLP）
人工智能开放平台（AI Lab）：腾讯云的AI Lab提供了丰富的人工智能服务，包括情感分析。用户可以通过AI Lab平台使用腾讯云的情感分析API进行情感分析任务。详情请参考：腾讯云人工智能开放平台（AI Lab）

以上是关于Lime解释器和情感分析的简要介绍和腾讯云相关产品的推荐。希望对您有所帮助！

如何使用Lime对时间序列进行分类

、、、、

我有一个简化的模型，看起来像这样： model = Sequential() model.add(LSTM(12, input_shape=(1000,12))) model.add(Dense(9, activation='sigmoid')) 我的训练数据是这样的： (900,1000,12) 正如你从输出层看到的，我有9个输出，所以每个信号(长度为1000)将被分类到一个或多个输出中(这是一个多标签分类) 我这样训练我的模型： history = model.fit(X_train,y_train, batch_size=32, epochs=10,validation

浏览 104提问于2020-04-30得票数 1

1回答

中性tweet的TextBlob朴素贝叶斯分类器

、、、、

我正在用TextBlob做一个关于情感分析的小项目。据我所知，有两种方法可以检验推特的情绪： neutralTraining Tweet极性:使用它，我可以判断tweet是正、负还是是一个分类器:我使用这种方法训练一个TextBlob朴素贝叶斯分类器，将其分为正推和负推，并使用分类器将推特分类为“正”或“负”。我的问题是，使用朴素的贝叶斯分类器，我是否也可以将推文归类为“中性”？换句话说，备选案文1中定义的“情感极性”可以在备选案文2中以某种方式使用吗？

浏览 4提问于2019-12-27得票数 0

1回答

是否有使用强化学习进行文本分类的例子？

、、、

想象一个像情感分析这样的二元分类问题。既然我们有标签，我们就不能利用实际预测之间的差距作为对RL的奖励吗？我想尝试对分类问题进行强化学习

浏览 1提问于2017-06-20得票数 8

1回答

如何解决情感分析中的歧义问题？

、、

我对文本挖掘还很陌生，今天我正在挑战自己去做情感分析。但是我在做情感分析的时候遇到了一些问题。在我的语言中，一个词可以有一些不同的含义。像"setan“的意思是: 1)魔鬼2)咒骂的话。如何解决情感分析中的这种歧义？对于每个人的信息，我使用的算法是朴素贝叶斯分类器。对于工具，我使用RapidMiner。我需要你的帮助。任何建议都是很棒的。谢谢!

浏览 1提问于2018-05-15得票数 3

1回答

拦截在非专业术语中的效用- ELI5

、、、、

我正在处理一个具有1000行和10个特性的二进制分类问题。在我使用随机森林进行分类的同时，我也用石灰来解释随机森林的预测。然而，我偶然发现了如下所示 Intercept 0.7932393836062923 Prediction_local [0.71440155] Right: 0.6854552819361831 石灰根据以下公式计算prediction_local exp.local_exp = exp.intercept[1] + sum([weight[1] for weight in exp.local_exp[1]]) 0.714401551296631 #ret

浏览 0提问于2022-02-07得票数 0

1回答

数值图的NLP \ LimeTextExplainer

、、、

在我的NLP任务中，我想了解分类器的“规则”。为此，我构建了一个LimeTExtExplainer。 c= make_pipeline(cv,naive_bayes) explainer = LimeTextExplainer(class_names=class_names, random_state=42, bow=False) exp = explainer.explain_instance(X_test[i], c.predict_proba, num_features=20,) fig = exp.as_pyplot_figure() 上面的代码创建了一个漂亮的清单，1克，完全符合我

浏览 2提问于2021-01-09得票数 1

回答已采纳

1回答

ValueError:对于文本分类，ROC_Curve不支持多类格式

、、、、

我试图用ROC来评估我的情感文本分类器模型。这是我对中华民国的代码： # ROC-AUC Curve from sklearn.metrics import roc_curve, auc import matplotlib.pyplot as plt fpr, tpr, thresholds = roc_curve(y_test, y_test_hat2) roc_auc = auc(fpr, tpr) plt.figure() plt.plot(fpr, tpr, color='darkorange', lw=1, label='ROC curve (area =

浏览 23提问于2022-03-25得票数 1

回答已采纳

1回答

与可解释性有关的不确定性

、

当我在这篇文章中写“不确定性”时，我的意思是：如果我将一个分类器分类为a_1,..,a_n类别，而对于一个观察到的x，则将x分类为带有概率p_i的a_i，那么这个决策的不确定性就是1-p_i。我想询问一下这个概念与精确性和可解释性之间的联系。例如，如果我有一个“非常确定”的分类器(在测试/训练集的均值/中位数上)，这个属性与实现实时准确预测的频率有多大关系？反之亦然？此外，如果我的分类器是“确定的”，这如何影响我解释它的决定在任何意义上的能力？我找不到这个不确定性的概念和这些问题的好资源，所以我也非常感谢一些参考资料！

浏览 0提问于2020-07-26得票数 1

1回答

火花中的机器学习

、、

我使用Apache进行情感分析，我使用朴素贝叶斯算法对文本进行分类。我不知道怎么找出标签的概率。如果我知道在python中找到标签的概率，我会很感激。

浏览 0提问于2016-06-21得票数 5

回答已采纳

2回答

朴素贝叶斯分类器的平衡语料库

、、

我正在使用NB分类器进行情感分析。我发现了一些信息(博客、教程等)，培训语料库应该是平衡的： 33.3%阳性； 33.3%中性 33.3%阴性我的问题是：为什么corspus应该平衡？Bayes定理是建立在推理/案例的可能性基础上的。因此，为了培训目的，在现实世界中，负面推文仅占10%，而不是33.3%，这不是很重要吗？

浏览 5提问于2017-07-02得票数 2

2回答

对硬标记排序数据集使用回归而不是分类

、、

让我们想象一下，我有一个带有注释情感的电影评论数据集： -1 means negative 0 means neutral +1 means positive 我看到很多人试图用分类来解决这些问题，但是不应该用回归来代替吗？对我来说，使用回归可以让系统建立标签之间存在转换的模型，例如0在两者之间。对此有什么想法吗？

浏览 0提问于2016-10-20得票数 1

回答已采纳

2回答

LSTM返回具有Sigmoid激活的概率序列

、、、

我是LSTM的新手，所以我尝试用Keras编写一个简单的情感分类脚本。然而，我无法理解输出。这是我的情感分类代码： import keras from keras.models import Sequential from keras.layers import Dense, Activation, LSTM, Embedding from keras.callbacks import EarlyStopping, ModelCheckpoint es = EarlyStopping(monitor='val_loss', patie

浏览 5提问于2020-02-27得票数 3

回答已采纳

1回答

预测的标签或预测的概率在中国的阴谋？

、

作为绘制ROC曲线的参数，例如在分类模型中，我可以得到预测的标签和预测的概率。输出层中有softmax层。在分类问题中，我应该使用预测的标签或预测的概率来绘制ROC曲线。

浏览 0提问于2018-05-27得票数 1

1回答

我能不能用生存分析模型来预测被出售的物品的概率？

、、

我正在建立一个模型来计算物品被出售的概率(至少在合理的时间内)。我知道这件商品何时上市，以及该商品何时售出。这里最好的方法是什么？近70%的项目在数据集中出售，我提出的最好的分类模型到目前为止只有72%的准确性。我能把这变成一个生存分析问题并输出一个出售物品的概率吗？

浏览 0提问于2020-12-05得票数 0

2回答

带有预处理输入的模型的石灰文本解释器

、、、、

我试着用石灰文本解释器来解释Keras模型。我有新闻标题和二进制目标变量(情感)。我的模型如下： vocab_size = len(tokenizer.word_index) + 1 embedding_dim = 16 max_length = 3000 trunc_type='post' padding_type='post' oov_tok = "<OOV>" training_sequences = tokenizer.texts_to_sequences(X_titles_tr) # train texts traini

浏览 30提问于2022-08-12得票数 0

回答已采纳

1回答

高斯朴素贝叶斯概率

、、

我将如何将概率附加到高斯朴素贝叶斯模型输出的预测上？我之所以问这个问题，是因为predict_proba函数U可以与sklearn的高斯朴素贝叶斯分类器一起使用，它只给了我0或1，这不是我想要的。

浏览 0提问于2020-06-05得票数 1

1回答

这是一个好的基于分类模型的混淆矩阵和分类报告吗？

、、、

我建立了分类模型。当实现决策树分类器时，下面的结果。预测精度 0.785813630042 混淆矩阵 [一三零二一五八一 2577 13953] precision recall f1-score support 2.0 0.34 0.45 0.39 2883 3.0 0.90 0.84 0.87 16530 avg /总计0.81 0.79 0.80 19413 对于神经网络预测精度 0.863132952145 混淆矩阵 [718 2165 492 1603

浏览 0提问于2017-05-05得票数 0

1回答

如何计算随机森林中的个别树木的投票，以及在Sklearn中如何计算额外的树木的票数？

、、、

我已经在锈蚀中构建了自己的额外树(XT)分类器，用于二进制分类。为了验证我的分类器的正确性，我一直比较它与Sklearns实现的XT，但我不断得到不同的结果。我想我的代码一开始肯定有一个bug，但现在我意识到它不是一个bug，而是计算集合中不同树之间的选票的不同方法。在我的代码中，每一棵树都根据叶数据子集中最常见的分类进行投票。例如，如果我们遍历一棵树，发现我们在一个叶节点上有40种分类，60种分类为1，树将数据分类为1。查看Sklearn关于XT ()的文档，我阅读了关于预测方法的下面一行输入样本的预测类别是由森林中的树木投票，并按其概率估计进行加权。也就是说，预测类是树的平均概率估计

浏览 9提问于2021-04-05得票数 1

回答已采纳

2回答

用于情感分析的Mahout

、、

使用mahout，我能够对数据的情感进行分类。但是我被困在了一个混乱的矩阵中。我正在使用mahout 0.7朴素贝叶斯算法来对推文的情绪进行分类。我使用trainnb和testnb朴素贝叶斯分类器来训练分类器，并将推文的情绪分类为“积极”、“消极”或“中性”。样本正训练集 'positive','i love my i phone' 'positive' , it's pleasure to have i phone' 同样，我也准备了负性和中性的训练样本，这是一个巨大的数据集。我提供的样本测试数

浏览 1提问于2013-03-07得票数 6

回答已采纳

1回答

支持多标签分类的算法

、、

在sklearn的文档中，它指出有几种算法固有地支持多标签分类，例如RandomForest或MLP：https://scikit-learn.org/stable/modules/multiclass.html。它是来自于模型的实现还是结构？此外，它是如何为这些算法工作的？是单打独斗的策略还是别的什么？谢谢。

浏览 0提问于2019-06-06得票数 2

回答已采纳

1回答

情感分析- flair预训练的模型分类器。如何加速

、、

我想从flair图书馆用预先训练的flair英语模型对情感进行分类。我有大约9万条推特，我想对每件事进行分类。问题是，在大约7小时内，这个天赋库就能做到这一点。比较NLP情感分类器或TextBlob可以在1分钟内完成这一任务。我对这个问题的代码是： def flair_sentiment(data, classifier): """ data : text sequence (pandas.Series) classifier : pretrained flair classifier """ values = [] for Item in

浏览 0提问于2019-09-07得票数 3

1回答

用C.50和type="prob“在R中绘制ROC曲线时的预测误差

、、

我正在为我实现的一系列分类器绘制ROC曲线。问题是，当我有一个带有成本矩阵的C.50分类器时，我会得到下一个错误消息(我正在使用RStudio)。预测错误。C5.0(分类器。成本1，数据，type="prob")：置信值(即类概率)不应与成本一起使用。分类器很好，当我在预测命令中不使用type="prob“时，它也工作得很好，但是我不能绘制ROC曲线。这是我用来创建我自己的ROC曲线的代码： pred.class.cost <- predict(classifier.cost.1, data, type="prob") perf.cl

浏览 1提问于2015-09-17得票数 1

回答已采纳

2回答

分类分数是如何解释的？

、、、

我想知道如何解释分类分数(我不确定的单词得分或概率，请纠正我)。例如，对于二进制分类，正值被标记为1，-1标记为负值。现在，公平地说，对于一个分数10分，实例更有可能被成功地预测，而不是一个5分，尽管结果可能是错误的。谢谢。

浏览 0提问于2020-07-06得票数 2

回答已采纳

2回答

基于词库的情感分析的准确性

、、、、

我正在对我获得的一组Twitter数据执行不同的情感分析技术。它们是基于词典的(维达情感和SentiWordNet)，因此不需要预先标记的数据。我想知道是否有一种方法(如F-Score，ROC/AUC)来计算分类器的准确性。我所知道的大多数方法都需要一个目标来比较结果。

浏览 3提问于2017-12-18得票数 1

2回答

基于方面的机器学习情感分析

、、

我在机器学习方面很新。我已经用类别，方面，意见词和情感注释了数据。例如，对于下面的文本 “苹果真好吃” 我有分类->食物，方面->苹果，意见词->tasty和情感->积极的。我有类似这种格式的训练数据。如何使用这种训练集训练支持向量机分类器？如何提取n字元、词性和情感词等特征来训练分类器？您能否建议使用机器学习算法进行基于这方面的情感分析的开始步骤？

浏览 0提问于2015-01-11得票数 3

1回答

如何正确比较这两个混淆矩阵？

、、、

我曾在电影评论数据库中使用过Vader，一种社交媒体的情感分析工具。这两个混淆矩阵在vader.py算法中不同，因为第一个是来自nltk的： 📷 第二个来源于Vader在github上的原始代码，包括对否定词的修正，等等。 📷 我想知道如何才能正确地比较这两者，因为我真的无法读懂它们。他们之间似乎没有太大的区别，我不明白这里错误的来源是什么。

浏览 0提问于2020-08-31得票数 1

回答已采纳

1回答

Google cloud natural language API添加自己的上下文分类器

、、、

我一直在搜索如何在google natural language API中创建一个新的实体，但什么也没有找到。有没有人可以帮助我创建一个新的分类器，这样如果我传递一个句子，并且我想检测假设'python‘作为编程语言，那么我将如何获得它。当前API将'python‘作为'other’。我还研究了cloud auto ml api作为我的解决方案，并试图创建和训练一个模型，但它只能做情感分析，而不是实体detection.It给我的分数，而不是告诉我Java是编程语言。感谢advance.Your帮助，我们将不胜感激。

浏览 2提问于2018-08-02得票数 0

2回答

有什么方法来绘制集合硬投票分类器的ROC曲线吗？

、、

我正在研究一个多类文本分类问题，并为文本分类进行集成学习。我选择硬投票作为合奏技巧。我试图为我的集成方法绘制ROC曲线，但由于显示了ROC曲线不能用于硬投票集成方法这一错误，它是行不通的。因此，我的问题是，是否有任何可能的方法，我可以为我的硬投票集成分类器绘制ROC曲线在python。

浏览 0提问于2020-07-07得票数 3

4回答

情感分析java库

、、、、

我有一些未贴标签的微博帖子，我想创建一个情感分析模块。为了做到这一点，我尝试了和 web服务，但是效果并不好。现在我不想训练我的分类器。因此，我想建议我一些图书馆或一些网络服务。我想要一个经过测试的图书馆。这篇文章的语言是英语。并进行了预处理。附注：我使用的编程语言是Java

浏览 9提问于2014-11-15得票数 7

回答已采纳

1回答

Scikit-Learn-如何添加“未分类”类别？

、、

我正在使用Scikit-Learn通过LinearSVC对文本(在我的例子中是推文)进行分类。当文本与训练集中定义的任何类别不匹配时，是否有方法将文本分类为未分类？例如，如果我有体育、政治和电影的类别，并试图在一条关于计算的推文上预测分类，那么它应该保持不分类。

浏览 6提问于2016-08-04得票数 3

2回答

分类链

、

我的问题是如何创建分类链我正在处理的问题是一个多类问题，在这里我必须分配7个可能的类中的一个。为此，我开始训练一个基于随机森林的分类器，结果没有那么好。人们对95%+的期望是精确的，而我当时只有79岁。所以我开始为每堂课训练7个不同的分类器。当我参加第一班时，为了训练的目的，我把其他班级的班级标签转换为“其他”。通过这个过程，单个分类器的性能注册了~ 95%+。然后我想，可以用一种最精确的模型首先尝试分类的方式来链接分类器(以瀑布的方式)，其次是最精确的在行上进行预测，第三种是最精确的，等等。培训过程仍然相同(与7个分类器相同)。具体来说，我们假设分类器1在100行上进行预测，发现

浏览 0提问于2015-10-29得票数 6

2回答

分类树中“实数”与“判定值”的混淆

、、、

我正在阅读XGBoost指南，我对它在决策树的评分系统和分类/回归树之间的区别感到困惑。我挂的那一段是： CART 分类回归树与决策树略有不同，在决策树中叶只包含决策值。在CART中，真正的分数是与每一片叶子相关联的，这给了我们更丰富的解释，超越了分类。我一点也不确定这意味着什么。我对回归决策树的理解是，每个叶都有一个值，它是分配给该叶的所有训练示例的平均值(在遵循树的结构之后)。在一个多树模型中，当我们预测一个新的例子时，我们在每棵树中导航它，然后将它最后的叶子值进行平均值；这个平均值是最后的预测。我的问题是： ( a)我对决策树的理解正确吗？在XGBoost和LightGBM使用的购

浏览 0提问于2021-09-13得票数 2

1回答

情感识别或特征提取

、、、

我正在开发一个模块，可以从人的面部识别情感(基本的情感，例如: joy，悲伤，厌恶，恐惧，惊讶，中立)。我使用的工具包括： OpenCV 2.4.2 Qt创造者明w 4.4 首先，我认为我可以利用Open的人脸识别模块来适应我的目标，并使用它(LBPH人脸识别器)，但可以取得很好的效果。我用来自不同类别情感的图像训练识别器，并对一组样本图像进行人脸识别，以识别情感(而不是人)。然后我放弃了这个想法，开始寻找特征提取方法，这样一旦我得到一个样本的面部图像，我就可以根据提取的特征(使用支持向量机)对其进行分类。我偶然发现了一些库，但它们都是针对Visual的。我是否应该

浏览 1提问于2015-03-20得票数 0

回答已采纳

1回答

在Keras中用LSTM获取文本分类的单词概率

、、、

我使用带有Keras的LSTM进行情感分类，我希望得到LSTM分配给句子中每个单词的概率，以便知道哪些词是更多的代表。例如，对于以下一句： “这里的风景很美，很平静” 我认为最有代表性的句子分为积极词是“精彩”和“平静”。如何获得LSTM分配给每个单词的概率？ lstm_layer = layers.LSTM(size)(embedding_layer) output_layer1 = layers.Dense(50, activation=activation)(lstm_layer) output_layer1 = layers.Dropout(0.25)(output_layer1

浏览 4提问于2020-04-03得票数 1

回答已采纳

2回答

什么是分类器使用的科学工具-学习的VotingClassifier？

、、

我看了一下scikit的文档--学习，但我不清楚在VotingClassifier的引擎盖下使用了什么样的分类方法？它是logistic回归，支持向量机，还是一种树方法？我感兴趣的是如何改变遮罩下使用的分类器方法。如果Scikit-learn没有提供这样的选项，那么是否有一个可以很容易地与scikit集成的python包--学习，它将提供这样的功能？编辑：我指的是用于第二个级别模型的分类器方法。我完全知道，第一级分类器可以是任何类型的分类器支持的科学工具包-学习。第二级分类器使用第一级分类器的预测作为输入。所以我的问题是-这个二级分类器使用什么方法？这是logistic回归吗？还是别的

浏览 0提问于2019-01-15得票数 3

回答已采纳

2回答

Tensorflow中离散标号的分类

、、

我用Tensorflow尝试了一个非常简单的分类例子。而不是使用一个热向量，tf.nn.softmax和交叉熵损失与logits。我想使用0/1标签的离散情况。当NN模型的输出为0或1时，我做了一些类似于y_ =tf.nn.sigmoid=tf.nn.sigmoid(tf.matmul，weight2) + bias2) y_ = tf.cast(tf.greaterequal(y，0.5)，tf.float32)的事情，所以这会给出0或1的张量。但是当我尝试训练时，这会给我错误的解释，说没有提供梯度。这是完整的代码。我的问题，我想做什么，它是否有可能在tf？如果是，怎么做？

浏览 5提问于2017-04-16得票数 0

回答已采纳

1回答

多类分类:概率与校准

、、、、

我正在用不同的分类器处理一个多类分类问题，使用Python和scikit学习。我想使用预测的概率，基本上是比较不同分类器对特定情况的预测概率。我开始阅读有关“校准”的内容，例如在和，我开始感到困惑。我所理解的是:一个经过良好校准的概率意味着一个概率也反映了某个类别的分数。这是否意味着，如果我有10个分布均匀的类，理想情况下，每个类的校准概率将在0.1左右？我是否可以将predict_proba的概率(没有校准)解释为“分类器对于这个分类器是否是正确的类有多确定”？希望有人能为我澄清这一点！)

浏览 0提问于2020-02-07得票数 3

1回答

用高斯贝叶斯分类器对Logistic回归进行概率分类

、、、、

我有一个二进制分类问题，其中我有一些伟大的特性，有能力预测几乎100%的测试数据，因为问题相对简单。但是，根据问题的性质，我没有什么可犯的错误(比方说)，所以我不愿意给出一个我不确定的预测，我宁愿把输出作为概率，设定一个阈值，并且能够说，“如果我小于百分之九十五确定，我会称之为”不确定“并采取相应的行动。说“我不知道”比犯错误更好。到目前一切尚好。为此，我尝试了高斯贝叶斯分类器(我有一个连续性。和Logistic回归算法，为分类提供了概率和预测。说到我的问题： GBC的成功率在99%左右，Logistic回归的成功率较低，在96%左右。所以我当然更喜欢使用GBC。然而，尽管GBC是

浏览 3提问于2018-11-16得票数 0

2回答

关于LIBSVM预测的概率估计

、

我正在尝试使用SVM分类器进行3类分类。我们如何解释LIBSVM预测的概率估计。它是否基于实例与最大边距超平面的垂直距离？请通过一些关于LIBSVM分类器预测的概率估计的解释。首先调整参数C和gamma，然后使用带有训练和测试的-b选项输出概率估计。

浏览 1提问于2011-10-18得票数 4

2回答

使用Keras中的functional来预测模型类的更好方法是什么？

、、、

我们可以使用predict_classes()函数在Keras中使用序列分类模型来预测新数据实例的类。如何预测使用functional开发的模型的类？例如，我有一个模型(基于函数API )，在最后一层激活了sigmoid，以获得多标签分类中的概率。当我应用model.predict()时，我得到了一系列的概率，即使损失是binary_crossentropy。我知道我可以手动进行这个分类，例如采用以下方法。 test_predict_proba = model.predict(x_test, batch_size=batch_size) class_predict = (test_pred

浏览 0提问于2020-04-29得票数 3

1回答

如何知道二进制分类器中测试数据的正确性概率

、、、、

我使用Keras，Tensorflow编写了一个顺序分类器脚本。给定样本图像的目录路径，它是一个二值图像分类器来预测类。我想在我的脚本中实现一个概率特性，其中包括类，给出了分类器预测的正确性概率。例如：输入 img = image.load_img('dataset/test/sample/fff.jpeg', target_size = (img_width, img_height)) img = image.img_to_array(img) img = np.expand_dims(img, axis = 0) prediction = model.predict

浏览 0提问于2020-02-10得票数 0

1回答

如何从RandomForestClassifier输出软标签预测，而不是0或1

、

我正在做一个二进制分类的kaggle竞赛。我想输出概率输出(软标签--介于0和1之间的某个值)，而不是只输出0和1。使用随机森林分类器

浏览 1提问于2021-03-25得票数 0

1回答

判别模型机器学习

我有点搞不懂有区别的模特。我知道概率分类器使用最大似然来理解输入属于哪一类，而线性分类器使用输入的线性组合进行分类。在这一点上，我不明白区分模型是概率分类器还是线性分类器。

浏览 1提问于2021-01-18得票数 1

回答已采纳

4回答

情感分析(观点挖掘)中最具挑战性的问题是什么？

、

观点挖掘/情感分析是Natural Language processing.Some最近的一个子任务。将它与文本分类进行比较，有些人对它采取了更深入的立场。你认为情感分析(观点挖掘)中最具挑战性的问题是什么？你能说出几个吗？

浏览 2提问于2011-01-26得票数 4

回答已采纳

1回答

学习算法在分类中的百分比

、

我使用weka，我有一个训练集，训练集中的例子的分类是布尔型的。有了训练集之后，我想要预测新输入的百分比是真还是假。我想得到一个介于0-1之间的数字，而不仅仅是0或1。我怎么能做到这一点，我已经看到，在前言中只有可能性分类。提前谢谢。

浏览 0提问于2013-01-14得票数 0

1回答

用于文本分类的预训练模型

、、、、

所以我有几个没有标签的单词，但我需要将它们分类为4-5个类别。我可以明确地说，这个测试集是可以分类的。虽然我没有训练数据，因此我需要使用预先训练好的模型来对这些单词进行分类。哪个模型适合这个范例，它已经在哪个数据集上进行了训练？谢谢

浏览 19提问于2020-12-12得票数 0

2回答

如何提高小文本的分类性能

、、、

我得到的数据大多是tweet或小评论(300-400个字符)。我使用了词袋模型并使用了NaiveBayes分类。现在我有很多错误分类的案例，都是下面提到的类型： 1.] He sucked on a lemon early morning to get rid of hangover. 2.] That movie sucked big time. 现在的问题是，在情感分类过程中，两个人都因为“糟糕”这个词而变得“消极”。 Sentiment Classification : 1.] Negative 2.] Negative 类似地，在文档分类过程中，由于单词"sucked“的存在，

浏览 5提问于2015-12-29得票数 2

1回答

威卡退耕还林

、、、、

我正在使用Weka，并希望对随机森林进行回归。具体来说，我有一个数据集： Feature1,Feature2,...,FeatureN,Class 1.0,X,...,1.4,Good 1.2,Y,...,1.5,Good 1.2,F,...,1.6,Bad 1.1,R,...,1.5,Great 0.9,J,...,1.1,Horrible 0.5,K,...,1.5,Terrific . . . 我不想学习预测最有可能的类，而是学习给定特征向量在类中的概率分布。我的直觉是，仅在Weka中使用RandomForest模型是不合适的，因为它将试图最小化其绝对误差(最大似然)而不是其平方误差(条

浏览 5提问于2012-11-07得票数 2

回答已采纳

1回答

如何测量朴素贝叶斯分类器的不确定性和预测误差？

、、

我有一个由30行和5列组成的小数据集(4个特性和1个类)。分类器用于给出事件发生的可能性。因此，类变量给出了发生的概率。如何测量分类器的不确定性和预测误差？我读过一篇关于测量预测不确定性的这里文章。然而，它正在解决多类分类的问题！

浏览 0提问于2019-01-17得票数 1

1回答

MLPClassifier中最重要的特性

、、、、

我想知道是否有任何方法来可视化或找到最重要/最重要的特性，在安装MLP分类器后，在Sklearn。简单的例子： import pandas as pd import numpy as np from sklearn.preprocessing import StandardScaler from sklearn.model_selection import LeaveOneOut from sklearn.neural_network import MLPClassifier from sklearn.model_selection import GridSearchCV from skle

浏览 3提问于2017-06-09得票数 6