腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
用词
来
规范
句子
nlp-compromise
我试着用这段代码
来
规范
化'Select two Hold‘这句话: const config = {numbers: true, case: true, plurals:true, whitespace如果我将
句子
改为:'Select two holds‘,结果是:"select 2holds“。
浏览 27
提问于2019-03-21
得票数 0
1
回答
输入通用
句子
编码器的数据应该
规范
化吗?
python
、
tensorflow
、
nlp
、
artificial-intelligence
我目前正在为我的B.Sc使用张量流的通用
句子
编码器()。论文中,我研究了提取摘要技术。在这项任务的绝大多数技术(如)中,
句子
首先是
规范
化的(小写、去掉停
用词
、lemmantisation),但我找不到提示
句子
是否应该首先
规范
化。真的是这样吗?这很重要吗?
浏览 15
提问于2021-02-23
得票数 0
回答已采纳
2
回答
NLP & ML短语提取
machine-learning
、
nlp
、
nltk
、
stanford-nlp
、
text-mining
我可以使用什么ML算法
来
训练给定
句子
中的动作短语。play cricket Label2: wash clothes 我有一个大约2k个
句子
和相应的动作短语(标签)的数据,需要根据它们预测另一组
句子
。有人能指导我如何使用NLP/ML
来
做这件事吗?使用哪个Algo
来
做同样的事情?(最好是python)
浏览 0
提问于2017-02-04
得票数 0
1
回答
查询以获取两个字符串之间的常
用词
sql
、
sql-server
、
sql-server-2012
我需要一个SQL查询
来
获取仅在两个
句子
之间的常
用词
。例如:
句子
2:我需要一个有用的网站此外,如果我需要将
句子
1与表字段记录进行比较,以获得包含
句子
1的最常见单词的记录,我该怎么办?
浏览 0
提问于2012-12-14
得票数 1
回答已采纳
1
回答
词性(POS)与句法依存分析
nlp
、
text-mining
、
linguistics
两者都根据单词的角色对
句子
中的单词进行标记。但是它们到底有什么不同呢?
浏览 26
提问于2018-09-06
得票数 2
3
回答
Stop Word Library For Sentiment Analysis工具
java
、
sentiment-analysis
、
stop-words
、
google-prediction
我有一些标记的训练数据,我将使用它们
来
训练模型。由于这是从社交媒体收集的数据,
句子
中的大多数单词都是停
用词
,所以我想在训练模型之前删除它,这是否有助于提高准确性?在java中有没有什么库可以用来删除这些停
用词
,而不是构建我自己的停
用词
集。 致敬Deepesh
浏览 7
提问于2015-02-12
得票数 0
2
回答
如何找到常
用词
最多的两个
句子
?
algorithm
给出一个
句子
列表,找出两个常
用词
最多的
句子
。常
用词
不需要位于
句子
中的相同位置(顺序无关紧要)。更新: 这个问题是否存在非成对算法?因为配对是非常简单的。然后创建一个n*n的二维数组,用于统计两个
句子
在倒排索引中出现在同一存储桶中的次数。
浏览 2
提问于2014-02-11
得票数 1
1
回答
按意义
规范
化单词
nlp
、
nltk
、
normalize
我正在做一个
句子
分析,在那里我理解
句子
,并将信息解码为键值对。chair" , "cost": "200 usd" } 现在这个json out put不容易使用,除非我对它进行
规范
化我想把所有表示钱的词标准化为一个常
用词
,即钱。
浏览 0
提问于2017-05-08
得票数 1
1
回答
NLTK:如何根据
句子
地图提取信息?
python
、
nlp
、
artificial-intelligence
、
nltk
我知道你可以用名词提取来把名词从
句子
中取出来,但是我怎么能用
句子
重叠/地图
来
删除短语呢?
句子
的表达方式不同,所以不能
用词
。因为单词的位置变了
浏览 0
提问于2016-07-10
得票数 1
回答已采纳
3
回答
在使用Spacy,Bert时,是否有必要对文本分类进行停
用词
删除、词干提取/词汇化?
nlp
、
spacy
、
text-classification
、
bert-language-model
当使用Spacy,Bert或其他高级NLP模型
来
获得文本的向量嵌入时,文本分类是否有必要进行停
用词
删除、词干提取和词汇化?Text=“婚礼上供应的食物非常美味” 1.由于Spacy,Bert是在巨大的原始数据集上训练的,在使用bert/spacy生成用于文本分类任务的嵌入之前,在这些文本上应用停
用词
删除、词干提取和词汇化是否有任何好处2.我可以理解,当我们使用countvectorizer,tfidf向量器
来
实现
句子
的嵌入时,去掉停
用词
,词干提取和词汇化会很好。
浏览 4
提问于2020-08-28
得票数 7
2
回答
将R中tibble中的单词替换为空格,而不使用反联接
r
、
n-gram
、
stop-words
、
tibble
我有一堆这样的
句子
:Chat <chr>我已经有了它们的列表,我想用空格替换这些停
用词
。我尝试过使用mutate和gsub,但它只接受一个正则表达式。反联接在这里不起作用,因为我正在尝试做二元/三元组,我没有一个单词列
来
反联接停
用词
。有没有办法替换R中每个
句子
中的所有这些单词?
浏览 1
提问于2018-02-05
得票数 2
回答已采纳
3
回答
使用无神经网络的预训练词向量进行文本分类
python
、
text
、
classification
、
embedding
我的数据集非常小(大约2300个
句子
和大约5个类),考虑到上述方法将不同的方法视为完全独立的方法,希望使
用词
向量方法进行分类。我使用了带有浅层神经网络的预训练词向量,但收效甚微。问题:我正在寻找一种使
用词
向量对
句子
进行分类的替代方法,并考虑将
句子
的词向量合并为一个向量,然后获取每类
句子
向量的质心-然后通过新
句子
和质心之间的距离度量进行分类。在我的数据集很小的情况下,如何将单词向量组合成一个“
句子
向量”?
浏览 0
提问于2019-01-30
得票数 0
1
回答
R-修复使用anti_join删除停
用词
时的排序问题(创建ngram)
r
、
sorting
、
text-mining
、
word-frequency
对R和编码非常陌生,并尝试对一长串
句子
及其给定的权重进行频率分析。我取消了数据的嵌套和突变,但当我尝试删除停
用词
时,每个
句子
中单词的排序顺序会变得随机化。is.na(word)) 我可以做些什么
来
保持每个
句子
中的原始排序顺序?我对
句子
中的所有单词都进行了索引,这样我就可以将它们与给定的权重进行匹配。有没有一种更好的方法
来
删除停
用词
而又不会打乱排序顺序?
浏览 0
提问于2017-08-15
得票数 1
1
回答
使
用词
性标注
来
否定
句子
php
、
regex
、
nlp
我正在尝试找到一种方法
来
否定基于词性标注的
句子
。
浏览 0
提问于2012-05-01
得票数 6
回答已采纳
2
回答
跨语言语义相似性
nlp
、
nltk
、
gensim
、
word2vec
我使
用词
嵌入
来
寻找两个
句子
之间的相似之处。使用word2vec,如果一个
句子
用英语,另一个
句子
用荷兰语(虽然不是很好),我也可以得到一个相似性度量。所以我开始怀疑是否有可能用两种不同的语言(没有明确的翻译)计算两个
句子
之间的相似性,尤其是如果语言有一些相似之处(英语/荷兰语)?
浏览 7
提问于2017-08-08
得票数 2
回答已采纳
1
回答
使用自然语言处理比较两个
句子
的语法
python-2.7
、
nlp
、
nltk
我有两个
句子
可以根据它们的语法使用NLP进行比较。我对NLP完全陌生,想知道是否有算法
来
确定这一点。我知道如何使
用词
语相似度和情感进行比较。
浏览 1
提问于2017-10-13
得票数 2
1
回答
停止字删除功能的问题
python
、
nlp
、
nltk
我一直在构建一个停
用词
删除函数,但我不确定我做错了什么。我有一个列表,里面有标记化的
句子
,在这些标记化的
句子
中是标记化的单词。在这个函数中,我的目标是创建一个新列表,循环遍历列表中的
句子
,然后循环遍历
句子
中的单词,检查它们是否为停
用词
,并使用非停
用词
标记附加到新列表中。尽管感觉这很合乎逻辑,但它仍然不起作用。
浏览 7
提问于2021-08-12
得票数 1
1
回答
我如何从法庭报告中提取合法赔偿的理由?
deep-learning
、
nlp
、
data
、
stanford-nlp
我在做一个项目(与法庭有关)。在某一点上,我要找出合法赔偿的理由。例如,让我们把这些判决(从法庭报告中)和我想做一个算法,从这句话中提取出合法赔偿的动机。第一句算法的输出必须是“补偿未付工资”或“补偿未付工资”。因为我不是NLP专家(但我已经做过一个关于情感分析的项目,所以我知道一些关于NLP的东西),而且有这么多的文章,我不知道从哪里开始。 我正在研究法语文本,但我可以不用写
浏览 0
提问于2020-01-09
得票数 0
3
回答
在Python中删除不带标记化的停
用词
python
、
stop-words
我正在尝试从练习中的字符串列表中删除停
用词
:,我的解决方案如下:labels = [] with open(".
浏览 0
提问于2019-09-14
得票数 1
1
回答
高效的reg ex
来
删除python中的停
用词
regex
、
python-2.7
、
stop-words
我正在使用以下reg-ex从文本中删除停
用词
但它剥离了空格too.As,因此我得到了一个
句子
,在删除停
用词
之后,剩下的单词之间没有空格。
浏览 4
提问于2014-04-08
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用CRM来规范审批流程
使用checkstyle来规范你的项目
使用BEM命名规范来组织CSS代码
用法律来规范“自动驾驶商业化”
印度议会建议颁布数字竞争法来规范大型科技公司
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券