腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(4246)
视频
沙龙
1
回答
如
何在
NLP
中
训练
数据
集
后
预测
标签
、
、
、
、
我正在尝试对评论进行情感分析;
数据
集
包含两个主要列:第一列是“评论”,其中包含用户的评论,第二列是评论是正面的还是负面的;我从一个来源获得了一个模板来预处理
数据
,
训练
和测试都是可以的。但是,我想输入一个文本,并希望模型
预测
它是积极的还是消极的。我尝试了许多形式的输入:仅字符串,字符串列表,numpy to array等。然而,我总是遇到错误;你知道如何输入要
预测
的
数据
吗?
浏览 14
提问于2019-11-07
得票数 0
1
回答
带有自定义
标签
的SparkNLP的NerCrfApproach
、
我正在尝试使用CoNLL格式的
数据
集
训练
SparkNLP NerCrfApproach模型,该
数据
集
具有产品实体(
如
I-Prod、B-Prod等)的自定义
标签
。然而,当使用
训练
好的模型进行
预测
时,我只得到了"O“作为所有标记的分配
标签
。当使用在SparkNLP研讨会示例
中
的CoNLL
数据
上
训练
的相同模型时,分类效果很好。(请参阅https://gith
浏览 23
提问于2021-10-13
得票数 0
回答已采纳
1
回答
在简历中标记自定义实体(NER)
、
、
、
例如,如果我想确定特定的单词是否是简历
中
的技能。如果(Java,c++)出现在我的文本
中
,我应该能够将它们标记为技能。我不想将spacy用于自定义语料库,我想创建
数据
集
,例如,单词将是我的特征,label(技能)将是我的因变量。 处理这类问题的最佳方法是什么?
浏览 11
提问于2020-02-25
得票数 0
1
回答
SpaCy二进制文本分类
、
、
、
我有两个文件夹的
数据
集
。其中一个包含与个人信息(
如
姓名、电子邮件、地址等)相关的文档(文本、pdfs),另一个包含非个人信息。我试着写了很多借鉴吉顿的代码,但似乎什么都没有用。
nlp
.add_pipe(textc
浏览 0
提问于2019-07-22
得票数 0
2
回答
学习和
预测
误差分析(Scikit GridSearchCV )
、
、
我想手动分析我的ML模型(无论哪个)所做的错误,将其
预测
与
标签
进行比较。根据我的理解,这应该在验证
集
的实例上完成,而不是在
训练
集
上。我通过GridSearchCV
训练
我的模型,提取best_estimator_,在交叉验证期间表现最好的那个,然后在整个
数据
集
上重新
训练
。因此,我的问题是:如果我的最佳模型在整个
训练
集
上重新
训练
,我如
何在
验证
集
上获得
浏览 32
提问于2020-09-25
得票数 0
回答已采纳
1
回答
机器学习
中
数据
集
的标注
、
、
我观察到的例子是简要概述了.For
训练
系统,给出了特征向量作为输入。在有监督学习的情况下,
数据
集
被标记。我对贴
标签
感到困惑。例如,如果我必须区分两种类型的图片,我将提供一个特征向量,并在输出端测试,我将提供1类型A和2类型B,但如果我想从图像
数据
集中提取感兴趣的区域。我将如何标记我的
数据
来提取ROI使用支持向量机。
浏览 1
提问于2016-02-14
得票数 2
1
回答
从零开始建立文本分类模型
、
、
、
我是一个
数据
科学和机器学习技术的初学者。我需要建立一个模型,允许我根据情感分析对文本进行分类。现在我只有课文,他们错过了任何课程,也没有任何关于情感分析的信息。所收集的
数据
(文本)约为50000,并且已经清除了标点符号和停止词。我听说了可能建立一些神经网络或使用逻辑回归,但我不知道具体的模型使用。此外,我可能会考虑从头开始构建一个新的模型(我知道这需要花费很长时间和大量的努力),但是我想知道我需要什么(例如,已经存在的模型/
数据
集
用来
训练
字典和情感分析)。
浏览 0
提问于2020-05-05
得票数 1
1
回答
多类分类的概率阈值
、
、
我使用Python
中
的Random Forest将我的
数据
分类为6个类。我的
数据
是X,Y,Z坐标,一些几何特征和
标签
。我正在使用几何特征和
标签
来使用
训练
集
(我的
数据
的随机70% )来
训练
分类器。我也想在测试
集
上使用50%的概率阈值(剩余30%的
数据
),因此概率小于50%的
预测
数据
被分配到表示未知的类6,其余的像往常一样从0到5。但是,我希望输出的
预测</e
浏览 2
提问于2020-07-27
得票数 1
1
回答
如
何在
自然语言处理中找到答案类型和questionType
我需要从问题中找出“答案类型检测”。是否有任何开放的api,它将为我提供以下答案类型
浏览 0
提问于2016-05-11
得票数 0
1
回答
检查包含未编码的新要素的
数据
的标注
、
在
训练
和测试了一个
数据
集
之后,我想让它
预测
某个只有特征的
数据
集
的
标签
。在我使用的普通示例
中
但由于我正在处理的
数据
需要编码,所以在一次热编码
后
,它导致列大小为2891。那么,现在如何检查尚未编码的新功能的
标签
?
浏览 0
提问于2018-07-15
得票数 0
1
回答
数据
集
上的
NLP
分类
、
我正在努力学习
NLP
。我理解从文本预处理到td-以色列国防军和字嵌入的基本概念.我如何应用这一学习?我有两个列的
数据
集
:答案和性别。我想用
NLP
将答案列转换成向量,然后使用监督机器学习来
训练
一个模型,
预测
某一类型的答案是由男性还是女性给出的。我不知道如何处理
后
,我Pre_processed文本。
浏览 3
提问于2022-02-04
得票数 0
1
回答
用只有正面特征的
标签
来
训练
CNN的最佳策略是什么?
、
、
、
我有一个大型的图像
数据
库,这些图像只被部分标记为多个、非排他性特征或它们上的对象。例如,水下场景
中
可能有
标签
water、swimsuit和fish。问题是它只有部分标记,这意味着
标签
cat不存在并不意味着图像上没有猫。
训练
CNN能够告诉
数据
集
上丢失的
标签
的最佳策略是什么?图像库上有23万张图像,但是考虑到多个
标签
是可能的,很难分辨出完全标记的图像的比例。我能够编写python代码,并设法使用keras在gpu上的mnist
数
浏览 0
提问于2018-01-29
得票数 3
回答已采纳
1
回答
有没有办法识别图像
中
的物体?
、
、
、
我正在寻找一些预先
训练
的深度学习模型,可以识别图像
中
的对象。通常这些图像是用于产品的购物网站的类型。我想要识别图像
中
的产品是什么。我遇到过一些预
训练
的模型,比如VGG,Inception,但它们似乎是针对一些通用对象进行
训练
的,比如1000个对象。我正在寻找的东西,是在10000或更多的
训练
。
浏览 1
提问于2018-04-08
得票数 0
2
回答
试图找出
训练
集
是哪一个
、
如何替换h(s)函数
中
的值?源PDF格式
浏览 0
提问于2020-12-21
得票数 4
回答已采纳
1
回答
虽然支持向量机是有效的,但支持向量机
预测
不能
预测
OK。
、
、
、
我有一个(图1)未标记的
训练
集
,我正在尝试检测异常值,并提出了一个用0:normal data和1:outlier标记
数据
的过程,并希望使用支持向量机进行
训练
。我遵循的指令来
训练
支持向量机的模型,但是当我试图
训练
相同的
数据
的
标签
时,它并没有
预测
任何(图2)!图1:
训练
后
的支持向量图2:支持向量机模型对
训练
数据
的
预测
浏览 0
提问于2016-09-01
得票数 0
回答已采纳
1
回答
如何使用Google在单个注释中提取多个
标签
文本项
、
、
、
、
我使用Google实体提取创建了
数据
集
,并上传了输入
数据
的输入
数据
(
训练
、测试、验证jsonl文件),比如将存储在google存储桶
中
的
NLP
格式。display_name": "City" "text_snippet": { }这是用来
预测
标
浏览 6
提问于2020-05-04
得票数 4
3
回答
此场景的文本分类技术
、
、
、
我对机器学习算法完全陌生,我有一个关于
数据
集
分类的快速问题。现在,测试
数据
只包含消息,我正试图获得相应的分类。谢谢你,亚当
浏览 4
提问于2017-08-30
得票数 0
回答已采纳
1
回答
Azure AutoML似乎添加了额外的输入?
、
、
在我的
数据
集中,我有4列浮点数和1列包含人名的列。我的目标是能够根据这4个浮点数的输入来检测这个人。 ? 我已经成功地基于这些信息
训练
了一些模型。
数据
转换图表如下所示,这是我所期望的: ? 因此,它忽略了一列(我假设是"person“列),并使用剩下的4列作为RandomForrest分类器的输入。到目前为止一切都很好。这个变量似乎对输出
数据
有很大影响 ?
浏览 19
提问于2021-10-15
得票数 0
1
回答
XGboost
预测
、
培训
后
:他们对测试
数据
进行
预测
,但问题是测试
数据
已经有了所有的
标签
。如果我的测试
数据
只有特性而没有
标签
,我如何修改该示例以进行
预测
?另外,我从他们的
数据
集中观察到:agaricus.txt.train和agaricus.txt.test不需要有相同的特性,甚至每个
训练
数据
都有不同的特性。我以前做过线性
浏览 0
提问于2021-10-31
得票数 0
3
回答
如
何在
nlp
中进行特征提取
、
、
、
、
我正在构建一个多类文本分类器,它有一个作业门户的
数据
集
。
数据
集
由映射到实际名称的组织名称组成(见下文)。我想做一个毫升模型,可以
预测
实际的组织名称。我的
数据
集
如下所示: FlipKart pvt有限公司 A.)我能提取什么样的特征?B.)我的特征提取器也应该使用
训练
集
的
标签
吗? C.)我的特性应该是什么样的,
浏览 2
提问于2018-02-08
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
2019 最新实战!给程序员的 7 节深度学习必修课,最好还会 Python!
2019最新实战!给程序员的7节深度学习必修课,最好还会Python!
基于transformer一步一步训练一个多标签文本分类的BERT模型
训练情感分类器很难?百行Python代码就能做到!
利用AllenNLP,百行Python代码训练情感分类器
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券