腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
句子
而
不是
标记
的
序列
标注
、
、
、
我有属于一个段落
的
句子
。每句话都有一个标签。s1、s2、s3、…,l1,l2,l3,…我知道我必须使用编码器对每个
句子
进行编码,然后使用
序列
标记
。你能指导我如何将它们组合在一起吗?
浏览 5
提问于2020-02-04
得票数 2
1
回答
返回n个最佳
标记
序列
的
语音标签
的
NLTK(或其他)部分
要一部分语音
标注
器,它不仅返回给定
句子
的
最佳标签
序列
,而且返回n个最佳标签
序列
。因此,对于'像箭一样飞行'
的
情况,它可以返回例如按照它们
的
概率进行排序
的
NN VBZ IN DT NN和NN NNS VBP DT NN。我需要使用自己
的
标记
集和
句子
示例来训练
标记
器,并且我希望
标记
器能够对
句子
的
不同特征进行设计。
浏览 143
提问于2018-06-04
1
回答
极短
句子
的
NER与文本分类
、
给出一组大
的
短句(约20-30字)和多个标签任务(约100个标签,每个
句子
可以有3个标签)。 哪种方法更有益处?使用NER模型,在每个
句子
的
标记
上附加标签,或者使用文本分类,其中样本是整个
句子
。 标签是医生正在做
的
动作(如“清洁伤口”、“去除皮肤”等)。
浏览 0
提问于2020-02-09
得票数 2
3
回答
使用tensorflow进行
序列
标记
:同步
序列
输入和输出
我想使用Tensorflow进行
序列
标记
,也就是词性
标记
的
一部分。我尝试使用这里概述
的
相同
的
模型: (它概述了一个将英语翻译成法语
的
模型)。由于在
标注
中,输入
序列
和输出
序列
具有完全相同
的
长度,所以我配置了桶,使输入
序列
和输出
序列
具有相同
的
长度,并试图在ConLL 2000上使用该模型学习POS标签。然而,解码器似乎有时输出一个短于输入
序列
浏览 8
提问于2015-11-16
得票数 4
2
回答
从一组文档中分类
标注
句子
的
最佳方法
、
、
、
我有一个分类问题,我需要找到最好
的
方法来解决它。我有一套培训文档,文档中
的
一些
句子
和/或段落都有
标记
。并
不是
所有的
句子
/段落都有标签。一个
句子
或段落可能有多个标签/标签。我想做
的
是做一些模型,如果给出一个新
的
文件,它将为文件中
的
每一个
句子
/段落提供建议
的
标签。理想情况下,它只会给我高概率
的
建议。如果我使用像nltk Naiv
浏览 0
提问于2013-09-19
得票数 7
1
回答
使用torchtext和文本
序列
作为输入
、
、
、
我正在尝试使用torchtext进行
序列
标注
,其中
序列
是
句子
。因此,每个Example都是一个
句子
及其
标记
的
列表: { 'labels': [0,1]] 当然,我仍然希望单词级别的词汇化和词汇化,但似乎没有一种明显
的
浏览 2
提问于2019-04-27
得票数 1
1
回答
DOCCANO和SpaCY中未
标记
的
实例。它们有什么价值吗?
、
、
、
我正在使用doccano
序列
标记
和spacy进一步建模。我所
标注
的
一些
句子
不包含我感兴趣
的
任何标签,所以它们仍然是“未
标注
”
的
。没有标签。现在
的
问题是: 为了训练SpaCy模型
而
包含未
标记
的
实例有价值吗?如果存在,那么应该将这些数据声明为“不平衡
的
数据集”并采取相应
的
行动吗?(助推?击打?过度取样?在这种情况下最佳实践是什么?
浏览 11
提问于2021-06-11
得票数 0
1
回答
NLP中字母词
序列
信息
的
传统替代
、
NLP研究者通过特征工程获取单词
序列
信息
的
传统/早期方法是什么?例如,我想要一个可以区分"cat ran after the dog."和"dog ran after the cat."
的
特性
浏览 0
提问于2021-07-01
得票数 1
回答已采纳
1
回答
在seq2seq模型中,角星
的
“精度”意味着什么?
、
、
、
我正试图建立一个seq2seq模型来预测
序列
。最基本
的
模型是建立
的
,但我在这里很难理解“度量=”精度“
的
含义。”下面是与我构建
的
模型非常相似的链接。model.compile(optimizer='rmsprop', loss='sparse_categorical_crossentropy', metrics=['acc']) 精确图很好,但是由于我试图得到
的
是
序列
的
预测,所以我不知道这里<
浏览 6
提问于2022-05-12
得票数 0
2
回答
自然语言处理模型
、
我是NLP
的
初学者,做一个项目来解析,并理解用户用英语输入行
的
意图。 对用户输入语句进行基本
的
标记
和词性
标注
,并在上述模型上进行测试,以了解该
句子
<em
浏览 1
提问于2011-10-30
得票数 1
2
回答
哪个NLP库有最成熟
的
汉语模式?
、
我试图做一些关于简体中文文本
的
NLP (需要提取
句子
结构和做命名实体识别)。我以前在英语文本中使用过spaCy,但我看到关于中国模式
的
一点注记表明它们是一项正在进行
的
工作,对于我尝试过
的
例子来说,for提取
的
准确性很低。 哪个NLP库拥有最成熟
的
预建汉语模型?理想情况下,基于Python
的
。
浏览 0
提问于2020-08-02
得票数 1
1
回答
Keras中
的
序列
标记
、
、
、
、
我在研究
句子
标注
问题。对于
句子
中
的
每一个字,我想预测四个类中
的
一个,所以我想要
的
输出应该如下所示: 我自己写
的
填充物(
句子
末尾
的
零
浏览 1
提问于2016-01-23
得票数 5
2
回答
CRF(条件随机场)可以用来
标注
整个
句子
吗?
、
、
我正在尝试使用机器学习来
标记
句子
(每个
句子
只有一个标签,我假设
句子
是相互独立
的
)。我认为线性CRF模型在这种情况下是可以
的
,但我有一些问题。 我尝试使用 (我看到
的
其他实现似乎都有类似的格式)。它使用
句子
作为输入,但输出标签被分配给每个
标记
。如何对整个
句子
使用单个标签?(我想到
的
技巧是只为测试数据中
的
点分配一个重要标签,并将其作为整个
句子
的
输出标
浏览 3
提问于2016-07-21
得票数 1
2
回答
OpenNLP是否在幕后使用WordNet进行命名实体识别
、
、
、
、
我尝试过使用SourceForge
的
OpenNLP Tools 1.5从文本中获取命名实体。我确实在OpenNLP下载中找到了一个JWNL文件。(具体地说,这是否意味着名称模型文件是用WordNet生成
的
)?
浏览 2
提问于2011-04-28
得票数 1
回答已采纳
1
回答
基于Viterbi算法
的
词性
标注
、
我正在做一个项目,在这个项目中,我需要使用维特比算法对
句子
列表进行词性
标注
。对于我
的
训练数据,我有已经由单词
标记
的
句子
,我认为我需要解析这些
句子
并将其存储在某种数据结构中。然后我有一个测试数据,其中也包含每个单词都被
标记
的
句子
。 我对如何处理这个问题感到有点困惑。我想问题
的
部分原因是我认为我没有完全理解维特比算法
的
要点。我是否应该使用Viterbi算法来
标记
我<e
浏览 4
提问于2014-02-27
得票数 1
2
回答
从文档中删除word类
、
、
是否可以从文档中删除特定类型
的
单词(例如冠词、名词、代词、形容词、动词、副词、连词、介词和所有格代词),就像从正文中删除停用词一样?如果是这样的话,是怎么做
的
?我想象一个自然语言处理库会有这样
的
功能,但是我还没有找到任何东西。
浏览 1
提问于2017-08-16
得票数 1
1
回答
用于识别没有字典
的
未转录语音
的
开源工具
、
、
执行下列操作
的
工具/程序:输出:在音频上对齐并
标记
语音转录
的
音频文件(在IPA中)。这能不能只用一本语音词典,
而
不需要一本单词词典呢?
浏览 2
提问于2014-12-12
得票数 2
回答已采纳
2
回答
在进行预测时,LSTM中
的
开始和结束
标记
、
、
、
我看到了LSTM
序列
到
序列
生成模型
的
示例,这些模型对每个
序列
使用开始和结束
标记
。 我想了解在使用这个模型进行预测时,如果我想对任意
序列
进行预测--是否需要在其中包含开始和结束
标记
?
浏览 0
提问于2022-02-20
得票数 2
1
回答
如何从特征向量或单词生成
句子
?
、
、
、
、
现在,我想从这些标题(单词)中生成一个
句子
。我应该从哪里开始呢?有没有关于如何通过
序列
标注
生成
句子
的
教程?
浏览 2
提问于2015-12-28
得票数 5
1
回答
BART Tokenizer
标记
同一个单词
的
方式不同吗?
、
、
、
、
我注意到,如果我用多个
句子
来
标记
全文,有时我会得到一个不同于单独
标记
每个
句子
的
标记
数,并将这些
标记
加在一起。我已经做了一些调试,并有了这个小
的
可重复
的
例子来说明这个问题。', 'ĠThames', 'Ġis', 'Ġa', 'Ġriver'] 我想了解为什么泰晤士河这个词在
序列
开始
的
时候被分割成两个记号,<em
浏览 3
提问于2022-08-23
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
序列标注算法评估模块 seqeval 的使用
Bi-LSTM+CRF在文本序列标注中的应用
让人心疼的句子:失望攒够了是不是还留下来攒
卖客户想要的,而不是需要的
ACL2017 中科院:基于新标注方案的实体与关系联合抽取
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券