腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在同一时间段内使用WMD进行
文本
相似
度
、
、
、
、
我想研究同一年内的
文本
相似
度
,而不是整个数据集中的
相似
度
。为了找到最
相似
的
文本
,我使用了WM距离
相似
度
。对于两个
文本
将是: word2vec_model = gensim.models.KeyedVectors.load_word2vec_format('GoogleNews-vectors-negative300distance = word2vec_model.wmdistance("stri
浏览 19
提问于2020-11-01
得票数 1
回答已采纳
1
回答
相似
性评分在gensim中意味着什么?
、
、
、
我使用Gensim库来查找句子与段落集合、
文本
数据集之间的
相似
之处。分别使用了余弦
相似
度
、软余弦
相似
度
和移动测度。Gensim返回一个项目列表,包括、docid、和
相似
性评分。对于余弦
相似
度
和软余弦
相似
度
,我猜
相似
度
是向量之间的余弦。我说的对吗? 在Gensim文档中,他们写道,这是语义的关联性,没有额外的解释。我已经搜索了很多,但没有找到任何答案。有什么帮助吗?
浏览 0
提问于2021-09-20
得票数 0
回答已采纳
1
回答
Elasticsearch:在相关评分中使用密集向量上的距离(在查询时)
我使用elasticsearch来组合不同的东西:-基于密集向量(余弦
相似
度
)的
文本
得分搜索。我的问题是,在查询阶段不计算余弦
相似
度
,我在
文本
中的搜索充当预筛选器。我将始终获得结果链接到
文本
搜索,即使余弦
相似
更好。我想在查询时计算余弦
相似
度
,这个分数将与<
浏览 1
提问于2020-01-29
得票数 1
回答已采纳
2
回答
用于检查两个
文本
之间
相似
度
百分比的MySQL函数
、
我需要检查通过表格提交的
文本
与MySQL数据库中存储的一些
文本
之间的
相似
性百分比的MySQL代码。TABLE - Articles id, article_body, a
浏览 41
提问于2011-10-12
得票数 7
1
回答
基于word2vev的句子
相似
度
研究
、
、
基本上,我想知道的是一个特定的句子/文档与我的训练语料库有多
相似
。假设我有一个训练语料库,里面充满了关于狗的
文本
。如果我想检查“飞机有100个座位”这句话与训练语料库的
相似
度
,我希望输出一个低
相似
度
分数。
浏览 12
提问于2019-08-09
得票数 0
2
回答
如何在文档中实现语义
相似
度
我正在做一个项目,在这个项目中,我需要根据搜索查询对
文本
文档进行排名,但我需要对具有单词或句子的语义
相似
度
的文档进行排名,我无法开始关于如何使用java找到语义
相似
度
。是否有任何链接或论文可以让我开始在文档或任何想法中找到单词的语义
相似
度
。
浏览 3
提问于2014-06-25
得票数 0
1
回答
Python多进程和NLTK wordnet路径
相似
性
、
、
、
、
我正在使用多处理池来加速
文本
语料库上的标题提取过程。在代码的一个阶段,我使用wordnet路径
相似
度
模块来确定两个单词的
相似
度
。如果我按顺序运行我的代码,即不使用多进程池,我会得到计算该路径
相似
度
的正常时间。但是,当我使用多处理来同时处理多个文档时,我观察到与顺序相比,在计算此路径
相似
度
时存在很大的时间延迟。
浏览 1
提问于2019-01-15
得票数 0
1
回答
如何匹配来自不同eCommerce来源的产品?提取产品属性
、
、
、
、
而且,不同类别的产品属性是不同的,而不是
相似
的。我正在努力寻找解决方案,这将适用于各种产品。大多数
文本
分类方法是对类别进行分类,而不是提取属性。来自不同站点的产品标题示例。
浏览 0
提问于2018-06-05
得票数 1
回答已采纳
1
回答
一种层次结构的
相似
度
算法
、
、
在Android术语中有一个屏幕层次结构(以
文本
形式)。 任务是获取屏幕的“指纹”,以便稍后识别。结构可能变化不大,所以在百分比上获得
相似
度
是很好的。有没有针对层次结构的
相似
度
算法?或者我应该使用字符串
相似
度
算法?
浏览 54
提问于2019-06-24
得票数 0
回答已采纳
1
回答
使用序列匹配器比较
文本
相似
性:为什么小写和大写字符串的结果不同?
、
、
、
我在pandas数据框中有一组
文本
(字母数字),我想计算成对
文本
(例如
文本
1和2、2和3、3和4...)的
相似
度
分数。 我正在使用序列匹配器进行计算,并能够获得分数。我认为在将
文本
转换为小写后,也值得比较它们。我创建了2个分数列来比较结果:分数1=非小写
文本
对的
相似
性分数(保留
文本
的原始大小写)分数2=小写
文本
对的
相似
性分数。我预计小写
文本
对的
相似
度</e
浏览 0
提问于2021-04-05
得票数 0
1
回答
在语义网络
相似
度
中评估短
文本
、
、
、
、
我有一个评估短
文本
的程序。它给出一个原始
文本
,并将其传输到语义网络。然后将其与几个短
文本
进行比较,这些短
文本
也被转换为语义网络。使用意义与句子的
相似
度
来衡量原始
文本
与其余
文本
之间的
相似
度
。
浏览 24
提问于2020-11-12
得票数 0
1
回答
DeepLearning4J - ParagraphVectors:为什么
相似
性是负面的?
、
、
、
、
我正在做的是在一组
文本
文档上训练模型,然后计算这些文档之间的
相似
度
。 现在,正如参考页面()所说,该工具用来计算
相似
度
的度量是余弦
相似
度
,它应该包含在0到1之间。但是,对于某些文档对,我得到了负分。
浏览 0
提问于2016-02-29
得票数 0
2
回答
nltk.corpus.wordnet的哪个
相似
度
函数适合于查找两个单词的
相似
度
?
、
、
、
、
nltk.corpus.wordnet中的哪个
相似
度
函数适合于查找两个单词的
相似
度
? lch_similarity()?我想使用一个用于word clustering的函数和用于在大
文本
中查找
相似
collocation的yarowsky算法。
浏览 5
提问于2011-09-13
得票数 5
2
回答
如何使用词性来评估语义
文本
的
相似
度
?
、
、
、
我正在尝试编写一个程序来评估
文本
之间的语义
相似
度
。我已经比较了
文本
之间的n-gram频率(一种词汇测量)。我想要一些不那么肤浅的东西,我认为在句子结构中查看
相似
度
是评估
文本
相似
度
的一种方法。然而,我所能做的就是计算词性(例如,每个
文本
4个名词,2个动词,等等)。然后,这类似于只计算n-gram(实际上不如ngram好)。如何使用词性来“更深”地衡量语义
文本
的
相似
性?
浏览 1
提问于2012-07-12
得票数 1
1
回答
查找某些
文本
文件之间的
相似
度
百分比
、
、
、
、
我用C++编写了一个程序,它根据1到100之间的整数变量v的值序列生成一个
文本
文件。
文本
文件格式如下:1 2 3 4 5 4 5 6 7 8 8 4 5 7 1 如何执行
相似
浏览 2
提问于2016-11-08
得票数 0
1
回答
如何发现一个
文本
与另一个
文本
的部分
相似
?
、
我们知道如何评估两个完整
文本
的
相似
度
,例如,通过词移位距离。如何在一个
文本
中找到与另一个
文本
相似
的片段?
浏览 27
提问于2019-04-10
得票数 0
1
回答
如何抓取语义
相似
的句子
、
、
、
、
我有一个小的
文本
数据集,并想从网络上抓取
相似
的句子。使用Bert相关模型、doc2vec和空间
相似
度
的sentence_transformers软件包进行
相似
性度量。我将阈值设置为85%,但
相似
度
得分高于阈值的句子并不真正相关。如何用python从web上抓取
相似
的句子?
浏览 33
提问于2020-06-06
得票数 1
4
回答
使用Microsoft Cognitive Services查找
相似
项目
是最好的,也是最少的工作,用来解决查找给定文章的
相似
文章的问题。文章是一串
文本
。假设我没有关于文章的用户交互数据。
浏览 2
提问于2016-07-01
得票数 0
1
回答
一组
文本
文档的
相似
性
、
、
我正在寻找一种算法,试图检查2)多个文档(约5000个)之间的
相似
度
我需要相同的,因为我正在尝试评估特定类别下的
文本
文档/句子是否以任何方式彼此
相似
。
浏览 2
提问于2017-05-16
得票数 0
1
回答
语义搜索-将
文本
和图像嵌入结合起来
、
、
我有一个关于将
文本
和图像嵌入到语义搜索中的问题。用例是在一个(B2B)市场上的产品搜索,我们有图像(S)和产品的标题和描述。我想让用户同时搜索图像和
文本
,但我不知道如何组合它们。我目前的想法是使用剪辑模型嵌入图像,用剪辑/语句转换器模型嵌入
文本
,将同样的内容应用到查询中,并将两个向量连接起来。如果这两个嵌入都被缩放成单位长度,那么它们应该具有相同的权重,并且对最终的
相似
性产生相同的影响。但是,我看到这种方法可能是非常有限的,因为我采取两个嵌入,只是将它们粉碎在一起,而不考虑任何细微差别。通过图像和
文本</
浏览 0
提问于2023-05-08
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
文本相似度计算综述
语义文本相似度研究进展
基于ALBERT的文本相似度解决方案
谷歌 AI:语义文本相似度研究进展
四种计算文本相似度的方法对比
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券