如何在NLP中训练数据集后预测标签

、、、、

我正在尝试对评论进行情感分析；数据集包含两个主要列:第一列是“评论”，其中包含用户的评论，第二列是评论是正面的还是负面的；我从一个来源获得了一个模板来预处理数据，训练和测试都是可以的。但是，我想输入一个文本，并希望模型预测它是积极的还是消极的。我尝试了许多形式的输入:仅字符串，字符串列表，numpy to array等。然而，我总是遇到错误；你知道如何输入要预测的数据吗？

浏览 14提问于2019-11-07得票数 0

1回答

带有自定义标签的SparkNLP的NerCrfApproach

、

我正在尝试使用CoNLL格式的数据集训练SparkNLP NerCrfApproach模型，该数据集具有产品实体(如I-Prod、B-Prod等)的自定义标签。然而，当使用训练好的模型进行预测时，我只得到了"O“作为所有标记的分配标签。当使用在SparkNLP研讨会示例中的CoNLL数据上训练的相同模型时，分类效果很好。(请参阅https://gith

浏览 23提问于2021-10-13得票数 0

回答已采纳

1回答

在简历中标记自定义实体(NER)

、、、

例如，如果我想确定特定的单词是否是简历中的技能。如果(Java，c++)出现在我的文本中，我应该能够将它们标记为技能。我不想将spacy用于自定义语料库，我想创建数据集，例如，单词将是我的特征，label(技能)将是我的因变量。处理这类问题的最佳方法是什么？

浏览 11提问于2020-02-25得票数 0

1回答

SpaCy二进制文本分类

、、、

我有两个文件夹的数据集。其中一个包含与个人信息(如姓名、电子邮件、地址等)相关的文档(文本、pdfs)，另一个包含非个人信息。我试着写了很多借鉴吉顿的代码，但似乎什么都没有用。 nlp.add_pipe(textc

浏览 0提问于2019-07-22得票数 0

2回答

学习和预测误差分析(Scikit GridSearchCV )

、、

我想手动分析我的ML模型(无论哪个)所做的错误，将其预测与标签进行比较。根据我的理解，这应该在验证集的实例上完成，而不是在训练集上。我通过GridSearchCV训练我的模型，提取best_estimator_，在交叉验证期间表现最好的那个，然后在整个数据集上重新训练。因此，我的问题是:如果我的最佳模型在整个训练集上重新训练，我如何在验证集上获得

浏览 32提问于2020-09-25得票数 0

回答已采纳

1回答

机器学习中数据集的标注

、、

我观察到的例子是简要概述了.For训练系统，给出了特征向量作为输入。在有监督学习的情况下，数据集被标记。我对贴标签感到困惑。例如，如果我必须区分两种类型的图片，我将提供一个特征向量，并在输出端测试，我将提供1类型A和2类型B，但如果我想从图像数据集中提取感兴趣的区域。我将如何标记我的数据来提取ROI使用支持向量机。

浏览 1提问于2016-02-14得票数 2

1回答

我是一个数据科学和机器学习技术的初学者。我需要建立一个模型，允许我根据情感分析对文本进行分类。现在我只有课文，他们错过了任何课程，也没有任何关于情感分析的信息。所收集的数据(文本)约为50000，并且已经清除了标点符号和停止词。我听说了可能建立一些神经网络或使用逻辑回归，但我不知道具体的模型使用。此外，我可能会考虑从头开始构建一个新的模型(我知道这需要花费很长时间和大量的努力)，但是我想知道我需要什么(例如，已经存在的模型/数据集用来训练字典和情感分析)。

浏览 0提问于2020-05-05得票数 1

1回答

多类分类的概率阈值

、、

我使用Python中的Random Forest将我的数据分类为6个类。我的数据是X，Y，Z坐标，一些几何特征和标签。我正在使用几何特征和标签来使用训练集(我的数据的随机70% )来训练分类器。我也想在测试集上使用50%的概率阈值(剩余30%的数据)，因此概率小于50%的预测数据被分配到表示未知的类6，其余的像往常一样从0到5。但是，我希望输出的预测</e

浏览 2提问于2020-07-27得票数 1

1回答

如何在自然语言处理中找到答案类型和questionType

我需要从问题中找出“答案类型检测”。是否有任何开放的api，它将为我提供以下答案类型

浏览 0提问于2016-05-11得票数 0

1回答

检查包含未编码的新要素的数据的标注

、

在训练和测试了一个数据集之后，我想让它预测某个只有特征的数据集的标签。在我使用的普通示例中但由于我正在处理的数据需要编码，所以在一次热编码后，它导致列大小为2891。那么，现在如何检查尚未编码的新功能的标签？

浏览 0提问于2018-07-15得票数 0

1回答

数据集上的NLP分类

、

我正在努力学习NLP。我理解从文本预处理到td-以色列国防军和字嵌入的基本概念.我如何应用这一学习？我有两个列的数据集:答案和性别。我想用NLP将答案列转换成向量，然后使用监督机器学习来训练一个模型，预测某一类型的答案是由男性还是女性给出的。我不知道如何处理后，我Pre_processed文本。

浏览 3提问于2022-02-04得票数 0

1回答

用只有正面特征的标签来训练CNN的最佳策略是什么？

、、、

我有一个大型的图像数据库，这些图像只被部分标记为多个、非排他性特征或它们上的对象。例如，水下场景中可能有标签water、swimsuit和fish。问题是它只有部分标记，这意味着标签cat不存在并不意味着图像上没有猫。训练CNN能够告诉数据集上丢失的标签的最佳策略是什么？图像库上有23万张图像，但是考虑到多个标签是可能的，很难分辨出完全标记的图像的比例。我能够编写python代码，并设法使用keras在gpu上的mnist数

浏览 0提问于2018-01-29得票数 3

回答已采纳

1回答

有没有办法识别图像中的物体？

、、、

我正在寻找一些预先训练的深度学习模型，可以识别图像中的对象。通常这些图像是用于产品的购物网站的类型。我想要识别图像中的产品是什么。我遇到过一些预训练的模型，比如VGG，Inception，但它们似乎是针对一些通用对象进行训练的，比如1000个对象。我正在寻找的东西，是在10000或更多的训练。

浏览 1提问于2018-04-08得票数 0

2回答

试图找出训练集是哪一个

、

如何替换h(s)函数中的值？源PDF格式

浏览 0提问于2020-12-21得票数 4

回答已采纳

1回答

虽然支持向量机是有效的，但支持向量机预测不能预测OK。

、、、

我有一个(图1)未标记的训练集，我正在尝试检测异常值，并提出了一个用0:normal data和1:outlier标记数据的过程，并希望使用支持向量机进行训练。我遵循的指令来训练支持向量机的模型，但是当我试图训练相同的数据的标签时，它并没有预测任何(图2)！图1:训练后的支持向量图2:支持向量机模型对训练数据的预测

浏览 0提问于2016-09-01得票数 0

回答已采纳

1回答

如何使用Google在单个注释中提取多个标签文本项

、、、、

我使用Google实体提取创建了数据集，并上传了输入数据的输入数据(训练、测试、验证jsonl文件)，比如将存储在google存储桶中的NLP格式。display_name": "City" "text_snippet": { }这是用来预测标

浏览 6提问于2020-05-04得票数 4

3回答

此场景的文本分类技术

、、、

我对机器学习算法完全陌生，我有一个关于数据集分类的快速问题。现在，测试数据只包含消息，我正试图获得相应的分类。谢谢你，亚当

浏览 4提问于2017-08-30得票数 0

回答已采纳

1回答

Azure AutoML似乎添加了额外的输入？

、、

在我的数据集中，我有4列浮点数和1列包含人名的列。我的目标是能够根据这4个浮点数的输入来检测这个人。 ? 我已经成功地基于这些信息训练了一些模型。数据转换图表如下所示，这是我所期望的： ? 因此，它忽略了一列(我假设是"person“列)，并使用剩下的4列作为RandomForrest分类器的输入。到目前为止一切都很好。这个变量似乎对输出数据有很大影响 ?

浏览 19提问于2021-10-15得票数 0

1回答

XGboost预测

、

培训后：他们对测试数据进行预测，但问题是测试数据已经有了所有的标签。如果我的测试数据只有特性而没有标签，我如何修改该示例以进行预测？另外，我从他们的数据集中观察到：agaricus.txt.train和agaricus.txt.test不需要有相同的特性，甚至每个训练数据都有不同的特性。我以前做过线性

浏览 0提问于2021-10-31得票数 0

3回答

如何在nlp中进行特征提取

、、、、

我正在构建一个多类文本分类器，它有一个作业门户的数据集。数据集由映射到实际名称的组织名称组成(见下文)。我想做一个毫升模型，可以预测实际的组织名称。我的数据集如下所示： FlipKart pvt有限公司 A.)我能提取什么样的特征？B.)我的特征提取器也应该使用训练集的标签吗？ C.)我的特性应该是什么样的，

浏览 2提问于2018-02-08得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

带有自定义标签的SparkNLP的NerCrfApproach

在简历中标记自定义实体(NER)

SpaCy二进制文本分类

学习和预测误差分析(Scikit GridSearchCV )

机器学习中数据集的标注

从零开始建立文本分类模型

多类分类的概率阈值

如何在自然语言处理中找到答案类型和questionType

检查包含未编码的新要素的数据的标注

数据集上的NLP分类

用只有正面特征的标签来训练CNN的最佳策略是什么？

有没有办法识别图像中的物体？

试图找出训练集是哪一个

虽然支持向量机是有效的，但支持向量机预测不能预测OK。

如何使用Google在单个注释中提取多个标签文本项

此场景的文本分类技术

Azure AutoML似乎添加了额外的输入？

XGboost预测

如何在nlp中进行特征提取

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐