腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(4252)
视频
沙龙
1
回答
在
同一
时间段
内
使用
WMD
进行
文本
相似
度
python
、
pandas
、
gensim
、
word2vec
、
similarity
我想研究
同一
年
内
的
文本
相似
度
,而不是整个数据集中的
相似
度
。为了找到最
相似
的
文本
,我
使用
了WM距离
相似
度
。对于两个
文本
将是: word2vec_model = gensim.models.KeyedVectors.load_word2vec_format('GoogleNews-vectors-negative300', binary=True)
浏览 19
提问于2020-11-01
得票数 1
回答已采纳
2
回答
如何通过抓取整个网站来选择与我的句子
相似
的句子?
nlp
、
artificial-intelligence
、
chatbot
、
word2vec
、
doc2vec
如果我给出一个句子,如何返回所有
相似
的句子?面试需要多长时间?1.面试持续多长时间。该怎么做呢?我正在考虑的一种方法是爬行30到40个公司招聘网站的常见问题页面,并
使用
doc2vec嵌入问题,然后我会将所有类似的向量放在一个集群中。 有比这更好的方法吗?
浏览 0
提问于2018-05-11
得票数 1
1
回答
具有大规模毁灭性武器距离的BERT语句
相似
度
nlp
、
bert-language-model
、
sentence-similarity
我尝试用BERT和word mover距离(
WMD
)来计算这两个句子之间的
相似
度
。我无法
在
蟒蛇中找到正确的大规模杀伤性武器公式。也尝试了
WMD
库,但它
使用
word2vec模型
进行
嵌入。请帮助解决以下问题,以获得
相似
的分数
使用
大规模毁灭性武器。= model.encode(sentence_obama) distance =
浏览 9
提问于2022-06-05
得票数 1
1
回答
如何在python中提高词移位距离
相似
度
,并
使用
加权句子提供
相似
度
评分
python
、
algorithm
、
text
、
nlp
、
spacy
单词移动距离可用于识别
文本
之间的
相似
性。这种
相似
性可用于比较多个
文本
以找到最接近的
相似
文本
。然而,我无法定制算法来做以下事情:1)消除位置(GPE) -由spacy识别,
在
文本
中
在
比较
相似
度
时有任何权重。instance = WmdSimilarity(
wmd
_corpus, loaded_model, num_best=10)sent =
浏览 27
提问于2019-02-05
得票数 1
回答已采纳
2
回答
如何加快Word Mover在数据帧中
文本
上的距离计算?
python
、
parallel-processing
、
word2vec
data.Messages.str.split()] , index = data.ID )我想也许可以
使用
swifter并创建一个函数来
使用
应用,但我似乎不能正确地
使用
它。def compute_
wmd</em
浏览 8
提问于2021-09-22
得票数 2
2
回答
使用
平均方法从word2vec词向量计算句子向量的具体步骤是什么?
python
、
vector
、
nlp
、
word2vec
、
sentence
我是否通过对这些单词向量
进行
分量平均来获得句子向量?如果向量的长度不同,例如:(1,2)(4,5,6)(7,8,9,23,76),这些情况下的平均过程是什么样子的?
浏览 3
提问于2017-08-12
得票数 1
1
回答
词移位距离与余弦
相似
度
python
、
nlp
、
gensim
、
semantics
、
cosine-similarity
我想知道哪种算法
在
语义
相似
性方面是最好的?有谁能解释一下原因吗? 谢谢!
浏览 25
提问于2020-01-04
得票数 0
2
回答
计算文档与特定关键字的
相似
度
python
、
nlp
、
cosine-similarity
、
sentence-similarity
flavivirus","swamp","virus","contagious","mosquito bite","virus","agent","host"] 有没有办法用PYTHON计算一组关键词和新闻文章之间的
相似
度
浏览 44
提问于2020-07-21
得票数 1
2
回答
如何在文档中实现语义
相似
度
information-retrieval
我正在做一个项目,在这个项目中,我需要根据搜索查询对
文本
文档
进行
排名,但我需要对具有单词或句子的语义
相似
度
的文档
进行
排名,我无法开始关于如何
使用
java找到语义
相似
度
。是否有任何链接或论文可以让我开始
在
文档或任何想法中找到单词的语义
相似
度
。
浏览 3
提问于2014-06-25
得票数 0
2
回答
添加高于阈值的连续临时值以创建“
度
小时”
r
、
dataframe
、
threshold
、
temperature
我正在处理每小时温度的数据集,我需要为每个极端事件计算高于热阈值的“
度
小时数”。我打算对每个事件的强度(合并的强度和持续时间)运行统计,以比较
同一
时间段
内
的多个地点。14.0263 13.2521189 12.43721191 12.703选择仅高于阈值18
度
的小时,然后减去18
度
后的数据显示高于18
度
:5297 0.010 5468
浏览 0
提问于2017-01-17
得票数 1
2
回答
在对段落/doc2vec向量
进行
聚类时,合适的距离度量是什么?
python
、
cluster-analysis
、
distance
、
doc2vec
、
hdbscan
我的目的是
使用
HDBSCAN对来自doc2vec的文档向量
进行
聚类。我想找到有语义和
文本
重复的小集群。但是,要对文档
进行
聚类,HDBSCAN需要一个距离矩阵,而不是
相似
度
矩阵。
在
sklearn中,从余弦
相似<
浏览 0
提问于2018-10-09
得票数 4
回答已采纳
1
回答
在
语义网络
相似
度
中评估短
文本
python
、
nlp
、
semantics
、
similarity
、
sentence-similarity
我有一个评估短
文本
的程序。它给出一个原始
文本
,并将其传输到语义网络。然后将其与几个短
文本
进行
比较,这些短
文本
也被转换为语义网络。
使用
意义与句子的
相似
度
来衡量原始
文本
与其余
文本
之间的
相似
度
。可以
使用
哪些库?有没有现成的代码可以
在
我的工作中
使用
?请帮帮忙
浏览 24
提问于2020-11-12
得票数 0
2
回答
如何在
文本
相似
度
评分时对大熊猫数据
进行
矢量化和加速双循环
python
、
pandas
、
similarity
、
fuzzy-classification
Dry Fish'],}我希望
在
name例如,South Beach和Beach属于聚类数1,它们的
相似
度
很高。所以我们把它和唯一的id联系起来,比如1。Dog和Big Dog有很高的
相似
性,他们的独特身份将是,2说。对于Cat唯一的id将是,3说。最后,对于‘鱼’和‘干鱼’的独特身份将是,说4。诸若此类。
浏览 0
提问于2022-12-11
得票数 1
1
回答
如何计算短
文本
语料库的语义
相似
度
?
nlp
、
information-retrieval
、
corpus
在
两个短
文本
语料库之间
进行
无监督语义
相似
度
比较的正确方法是什么?比较两者的LDA主题分布似乎不是一种解决方案,因为对于较短的文档,生成的主题并不能很好地掌握语义。分块没有帮助,因为下面的tweet不一定是
同一
主题。例如,在这些语料库中创建文档TF-IDF之间的余弦
相似
性矩阵是一种好方法吗?
浏览 0
提问于2020-04-20
得票数 0
1
回答
如何根据文档集合计算文档
相似
度
?
information-retrieval
有什么方法可以组合成对的文档
相似
性得分,以获得某个文档相对于文档集合的总体
相似
性得分? 如何根据文档集合计算文档
相似
度
?- ResearchGate。可从:访问2016年8月22日。
浏览 16
提问于2016-08-22
得票数 0
2
回答
如何在最大的数据库中查找
相似
的消息
php
、
mysql
、
artificial-intelligence
当用户收到一条消息时,我需要根据单词的出现情况
在
我的数据库中查找相关消息。然后,当我收到一条消息时:1-我解析单词(看起来像我的批处理的第一步。)相同大小的消息,查询
相似
消息的时间约为9.8秒。我需要一个更好的算法来做到这一点。 有什么想法吗?
浏览 7
提问于2011-02-05
得票数 4
回答已采纳
2
回答
特定主题语言模型的评价
machine-learning
、
nlp
、
language-model
、
gpt
我已经
在
我的自定义数据集上完成了一个预先训练过的语言模型(GPT-2)。我希望有一种方法来评估我的模型生成特定预定义主题的句子的能力,以单个关键字的形式给出。我已经尝试过的是:从LM生成足够多的句子,并将这些句子与目标主题(或主题中的每一个单词,我们有多个单词)之间的平均余弦
相似
度
作为这里描述。我不确定这是否是一种有效的方法,而且句子之间的余弦
相似
性
在
很多情况下也会产生很差的结果。 提前感谢您的帮助。
浏览 0
提问于2020-10-02
得票数 2
回答已采纳
1
回答
如何计算TF-IDF
nlp
、
tf-idf
我想
使用
TF-IDF的余弦
相似
度
方法来得到两个单词的语义
相似
度
。首先,我想从wikipedia或word- text中提取这些单词的含义,然后对
文本
进行
预处理并找到TF-IDF。当我
在
谷歌上搜索这个问题时,我发现为了找到TF-IDF,我们应该有一个训练集和测试集。
在
我的例子中,哪个是训练集,哪个是测试集?如何
使用
计算结果计算余弦
相似
度
?
浏览 3
提问于2012-10-06
得票数 1
回答已采纳
1
回答
使用
序列匹配器比较
文本
相似
性:为什么小写和大写字符串的结果不同?
python
、
text
、
nlp
、
similarity
我
在
pandas数据框中有一组
文本
(字母数字),我想计算成对
文本
(例如
文本
1和2、2和3、3和4...)的
相似
度
分数。 我正在
使用
序列匹配器
进行
计算,并能够获得分数。我认为
在
将
文本
转换为小写后,也值得比较它们。我创建了2个分数列来比较结果:分数1=非小写
文本
对的
相似
性分数(保留
文本
的原始大小写)分数2=小写
文本
对的
相似
性分数。我
浏览 0
提问于2021-04-05
得票数 0
1
回答
基于语义
相似
性的词组聚类训练集
python
、
python-3.x
、
machine-learning
、
cluster-analysis
、
word
我
使用
python作为工具来实现机器学习的目的。
浏览 1
提问于2016-10-10
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
从单词嵌入到文档距离:WMD一种有效的文档分类方法
风清气雅过新年,人工智能带你读唐诗
AI识图驴唇不对马嘴?Google AI:用交错训练集提升图像描述准确性
拼多多店群如何防止店铺关联
Excel VBA案例,写一个自定义函数,判断两个字符串的相似度
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券