腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
计算
句子
集合之间的语义
相似
度
nlp
、
word2vec
、
tf-idf
、
cosine-similarity
、
sentence-similarity
我有两组短消息,我想计算这两组短消息之间的
相似
度
,并根据它们的语义
相似
度
来识别它们是否在谈论相同的子主题。我知道如何使用成对
相似
度
,我的问题是我想计算两个集合中所有
句子
之间的总体
相似
度
,而不是两个
句子
的
相似
度
。有没有办法使用tf-idf或带有余弦
相似
度
的word2vec/doc2vec来计算总分?
浏览 4
提问于2019-08-02
得票数 0
1
回答
如何预测给定
句子
的语法是否正确?
python
、
nlp
、
prediction
、
word2vec
、
language-model
我正在尝试创建一个预测模型,该模型通过检查
句子
中单词的顺序来判断给定
句子
是否正确。该模型检查特定的单词序列是否已经出现在巨大的语料库中,是否有意义。我尝试用word2vec模型来做这件事,去掉了两个
句子
的余弦
相似
度
或WMD距离,但这只给出了基于词向量
相似
度
的
相似
度
,而不是单词的序列。因此,如果我们将输入作为两个
句子
:
句子
1-“我要去商店”
句子
2-“去我是商店去” 输出应指示<e
浏览 15
提问于2019-04-10
得票数 0
1
回答
句子
转换器如何预测新实例
python
、
nlp
、
huggingface-transformers
、
sentence
、
sentence-similarity
我正在探索
句子
转换器,并偶然发现了这个。它展示了如何对我们的自定义数据进行培训。但我不知道该怎么预测。如果有两个新
句子
,如1)这是第三个例子,2)这是第三个例子。我怎么能预测到这些
句子
有多
相似
呢?example sentence", "Each sentence is converted"]问题1) 这是一种在训练旧模型和创建新模型之后获得
句子
嵌入的正确方法吗我很困惑,因为在拟合过程中,我们给出了两个
句子</e
浏览 1
提问于2022-01-04
得票数 2
1
回答
如何根据常用词对文本进行分类
python
、
pandas
、
nlp
、
nltk
这个问题是关于基于常用词的文本分类,我不知道我是否正确地处理了这个问题我有一个excel,在"Description“列中有文本,在" ID”列中有一个唯一的ID,我想迭代描述,并根据文本中常见单词的百分比或频率比较它们。我想对描述进行分类,并给它们另一个ID。请参见下面的示例…… import pandas as pd df = pd.DataFrame({'ID': ['12 ', '54'
浏览 21
提问于2019-08-22
得票数 0
1
回答
寻找文本中
句子
之间的语义连贯性
python
、
vector
、
tf-idf
、
sentence-similarity
、
latent-semantic-analysis
我需要一些帮助写一个程序的基础上,从这些链接和的代码,将自动计算之间的语义
相似
度
a.连续的
句子
和b.
句子
由1个中间短语,在和整个文件(1000
句子
)。提供的代码已经标记化并可以找到语义
相似
度
,但我不知道如何编写新代码来计算(并显示)整个文本(a,b)中连续和“插入”
句子
之间的语义
相似
度
。.I不想一遍又一遍地做同样的事情。
浏览 13
提问于2017-01-11
得票数 0
1
回答
如何抓取语义
相似
的
句子
python
、
nlp
、
data-science
、
sentence-similarity
、
semantic-analysis
我有一个小的文本数据集,并想从网络上抓取
相似
的
句子
。使用Bert相关模型、doc2vec和空间
相似
度
的sentence_transformers软件包进行
相似
性度量。我将阈值设置为85%,但
相似
度
得分高于阈值的
句子
并不真正相关。如何用python从web上抓取
相似
的
句子
?
浏览 33
提问于2020-06-06
得票数 1
1
回答
STS基准数据集中的语义
相似
度
得分是如何计算的?
python
、
nlp
、
cosine-similarity
、
bert-language-model
这是GitHub存储库:我正在尝试完成的任务:我有另一个自定义数据集,其中也有成对的
相似
和不
相似
句子
。(Bert语句转换器:)它的计算方式必须与STS基准数据集中
句子
对的计算方式相同。这个帖子非常
浏览 31
提问于2020-02-23
得票数 0
1
回答
对问答系统NLP的几点建议
nlp
、
artificial-intelligence
、
chatbot
、
question-answering
我正在尝试建立一个问题回答系统,其中我有一组预定义的问题和他们的答案。对于来自用户的任何给定问题,我必须查找类似的问题是否已经存在于预定义的问题中,并发送答案。如果它不存在,它必须回复一个通用响应。任何关于如何使用NLP实现这一点的想法都会非常有帮助。
浏览 2
提问于2020-03-15
得票数 0
2
回答
使用tensorflow对
句子
相似
性进行建模
python
、
machine-learning
、
tensorflow
、
deep-learning
我正在尝试使用tensorflow对
句子
相似
度
进行建模。理想的做法是,首先将连接的
句子
馈送到rnn,然后将rnn的输出馈送到softmax,以进行二进制分类,无论
相似
与否。
浏览 0
提问于2016-05-03
得票数 7
1
回答
欧几里德距离是否衡量语义
相似
性?
scikit-learn
、
gensim
、
euclidean-distance
、
cosine-similarity
、
sentence-similarity
我想衡量
句子
之间的
相似
度
。我可以使用sklearn和欧几里得距离来衡量
句子
之间的语义
相似
度
吗?我还读到了关于余弦
相似
性的文章。有人能解释一下它们与度量的区别吗?使用的最佳方法是什么?
浏览 0
提问于2018-11-11
得票数 2
3
回答
句子
间的语义
相似
度
java
、
nlp
我需要任何开源工具或技术来找到两个
句子
的语义
相似
度
,其中我给出两个
句子
作为输入,并接收分数(即语义
相似
度
)作为输出。有什么帮助吗?
浏览 3
提问于2010-01-11
得票数 8
3
回答
如何找到两个文档之间的
相似
度
python-3.x
、
spacy
我曾尝试使用spacy的
相似
度
函数来获取文档中的最佳匹配
句子
。然而,它失败了,因为它认为每个项目符号是一个
句子
,项目符号是不完整的
句子
(例如
句子
1“密码应该是最小的8个字符的长度,
句子
2的形式是一个项目符号”8个字符“)。它不知道它是指密码,所以我的
相似
度
很低。
浏览 24
提问于2019-04-12
得票数 0
4
回答
是否可以使用Google BERT来计算两个文本文档之间的
相似
度
?
python
、
text
、
scikit-learn
、
nlp
、
word-embedding
是否可以使用Google BERT来计算两个文本文档之间的
相似
度
?据我所知,BERT的输入应该是有限大小的
句子
。一些作品使用BERT来计算
句子
的
相似
度
,例如: 是否有BERT done的实现,以便将其用于大型文档而不是
句子
作为输入(具有数千个单词的文档)?
浏览 1
提问于2019-09-11
得票数 12
1
回答
用词向量表示
句子
的余弦
相似
度
现在可以衡量词序吗?
nlp
、
deep-learning
我知道,原始的余弦
相似
度
,当应用于通过特定单词的频率来表示两个文档时,并不衡量词序。我现在看到一大堆论文将余弦
相似
度
应用于由单词向量组成的
句子
对的表示。我假设他们把每个
句子
的token# x嵌入长度矩阵展平成一个长向量,它的长度是原始
句子
的token# x嵌入长度。因此,“我爱你”和“你爱我”(归一化为"I")在这种应用余弦
相似
性的新方法中不会产生1,而旧方法会产生1。我说的对吗?谢谢你的任何启发性的回答。
浏览 2
提问于2016-06-21
得票数 1
1
回答
一组文本文档的
相似
性
data-mining
、
text-mining
、
sentence-similarity
我正在寻找一种算法,试图检查2)多个文档(约5000个)之间的
相似
度
我需要相同的,因为我正在尝试评估特定类别下的文本文档/
句子
是否以任何方式彼此
相似
。
浏览 2
提问于2017-05-16
得票数 0
1
回答
哪种类型的自动编码器可以实现文本
相似
性?
neural-network
、
nlp
、
autoencoder
我正在解决以下任务:我想找出
句子
对之间的
相似
度
得分。我的想法是为
句子
中的每个单词生成嵌入,并将向量提供给编码器,编码器将学习将这些多个输入聚合为一个较低的表示序列向量。并使用该序列向量之间的余弦
相似
度
来找出
相似
度
得分。我的问题是,对于哪种类型的自动编码器或神经网络架构更适合我的情况,您有什么建议吗?
浏览 3
提问于2019-11-25
得票数 0
1
回答
基于语义
相似
性的
句子
分类
machine-learning
、
data-mining
、
clustering
我有一套独特的
句子
。对于每一个
句子
,我计算出一个语义
相似
度
分数(0到1之间),其余的
句子
,如下面的例子所提到的。., senN}sen1 and sen3 = 0.7......同样,对于所有的
句子
,我计算成对的语义
相似
性分数。既然,我得到了一个成对的价值
浏览 0
提问于2017-08-11
得票数 0
回答已采纳
2
回答
句子
语义
相似
度
和频度
python
、
nlp
、
nltk
我有一组逐字逐句的
句子
,我试着做的是....if两个
句子
有相同的意思,这些
句子
应该被原来的
句子
替换,然后我必须计算这些
句子
的频率。 有没有办法可以用NLTK来做呢?在这方面的任何建议都是欢迎和赞赏的。
浏览 1
提问于2018-05-02
得票数 1
1
回答
用
相似
算法python识别两个
句子
之间的缺失词
nlp
、
similarity
、
cosine-similarity
、
sentence-similarity
总的来说,我想做的是:给定两个
句子
A和B,我想知道B中的哪些词在语义上与A中的词完全不同。本质上,我需要计算两个
句子
之间的
相似
度
,找出哪个单词(来自B)的
相似
度
很低,然后打印出来。我计算了余弦
相似
度
,但没有给出多少关于矩阵
相似
性的信息。让我们说A=“肺癌是一种恶性肿瘤”而B=“肺癌是一种肺部疾病”, 由于疾病和肿瘤在语义上是
相似
的,所以A中
相似
度
小的单词是“恶性”的,因为它与B中的
浏览 3
提问于2022-02-20
得票数 1
1
回答
相似
性评分在gensim中意味着什么?
python
、
text
、
gensim
、
sentence-similarity
我使用Gensim库来查找
句子
与段落集合、文本数据集之间的
相似
之处。分别使用了余弦
相似
度
、软余弦
相似
度
和移动测度。Gensim返回一个项目列表,包括、docid、和
相似
性评分。对于余弦
相似
度
和软余弦
相似
度
,我猜
相似
度
是向量之间的余弦。我说的对吗? 在Gensim文档中,他们写道,这是语义的关联性,没有额外的解释。我已经搜索了很多,但没有找到任何答案。有什么帮助吗?
浏览 0
提问于2021-09-20
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
用线性规划去计算句子之间的相似度
自然语言处理中句子相似度计算的几种方法
如何用 word2vec 计算两个句子之间的相似度?
论文查重相似度28%能通达吗 发表论文的相似度是多少?
文本相似度计算综述
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券