腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
基于
相似
度
的
文本
流聚类
算法
最近有什么突破吗?
text
、
cluster-analysis
、
similarity
我需要有一个轻量级
的
文本
流聚类工具。轻量级
的
意思是它没有内存,所以它可以记住之前
的
文本
条目。
文本
流在这里指的是字母数字和半结构化句子/短语
的
连续输入,例如:任何应用程序
的
日志。基于
相似
度
的
聚类是指
算法
对具有模式
相似
度
的
文本
进行分组聚类。例如: text1 = 'aaababac‘和text2
浏览 3
提问于2012-06-22
得票数 3
1
回答
一种层次结构
的
相似
度
算法
java
、
android
、
algorithm
在Android术语中有一个屏幕层次结构(以
文本
形式)。 任务是获取屏幕
的
“指纹”,以便稍后识别。结构可能变化不大,所以在百分比上获得
相似
度
是很好
的
。容器/UI元素
的
种类有限(例如LinearLayout、RelativeLayout等),因此顺序和层次结构很重要。 有没有针对层次结构
的
相似
度
算法
?或者我应该使用字符串
相似
度
算法
?
浏览 54
提问于2019-06-24
得票数 0
回答已采纳
1
回答
单词/句子
相似
度
。
最好
的
方法是什么?
python
、
nlp
我需要为产品主数据构建一个
算法
,我不确定
最好
的
NLP方法。场景是:-我有产品黄金记录;-我有许多其他需要协调
的
产品目录;例如:-产品黄金记录:可口可乐和可口可乐零;-需要进行哈密化
的
产品描述:可口可乐300ml,可口可乐300毫升,可口可乐零。我需要一个通过
相似
度
来协调
的
算法
,因为我必须考虑打字错误,有时还需要考虑句子中
的
产品片段。示例: Coke zero JS MKT (JS和MKT是垃圾,但句子更类似于Coke
浏览 14
提问于2019-07-31
得票数 0
回答已采纳
1
回答
基于用户阅读
的
文章
的
相似
文章建议
python-2.7
、
machine-learning
、
recommendation-engine
我正在寻找
最好
的
算法
,用于我
的
项目中
的
文章建议。我们有1000篇文章。我想根据他正在阅读
的
文章向用户推荐类似的文章。哪种
算法
最适合这个。我尝试了基于内容
的
推荐,这涉及到训练模型。在我
的
例子中,它可以是基于用户正在阅读
的
文章
的
简单
文本
相似
度
,而不是用户阅读文章
的
历史记录
浏览 1
提问于2017-09-12
得票数 0
2
回答
nltk.corpus.wordnet
的
哪个
相似
度
函数适合于查找两个单词
的
相似
度
?
python
、
nlp
、
nltk
、
wordnet
、
corpus
nltk.corpus.wordnet中
的
哪个
相似
度
函数适合于查找两个单词
的
相似
度
? lch_similarity()?我想使用一个用于word clustering
的
函数和用于在大
文本
中查找
相似
collocation
的
yarowsky
算法
。
浏览 5
提问于2011-09-13
得票数 5
3
回答
文本
相似
度
算法
java
、
algorithm
、
text
、
similarity
我正在做一个Java项目,在这个项目中我必须制作一个
文本
相似
性程序。我想让它取2个
文本
文档,然后将它们相互比较,得到它们
的
相似
度
。它们彼此有多么
相似
。稍后,我将放入一个已有数据库,该数据库可以找到单词
的
同义词,并查看
文本
文档编写者是否在
文本
完全相同
的
情况下将单词更改为其他同义词。上下移动伞也是一样
的
。是的,因为这是一个抄袭项目…… 我想听听你们会推荐什么样
的
<em
浏览 58
提问于2011-04-27
得票数 20
回答已采纳
5
回答
文本
相似
度
算法
java
、
text
、
nlp
、
levenshtein-distance
、
similarity
我需要一个函数来告诉它们是代表相同
的
文本
,还是表示类似的
文本
。该函数应返回
文本
相似
性
的
百分比-同意 “所有的人都很快乐”和
浏览 4
提问于2010-02-24
得票数 14
回答已采纳
1
回答
从大型
文本
语料库构建图表
nlp
、
text-mining
、
similarity
、
graphs
、
similar-documents
我得到了大量
的
文件,我应该对这些文件进行各种分析。由于文档将作为最终产品
的
基础,所以我考虑用这个
文本
语料库构建一个图表,每个文档对应于一个节点。构建图形
的
一种方法是使用模型(如use )首先查找
文本
嵌入,然后在
相似
度
超过给定阈值
的
两个节点(
文本
)之间形成一个链接。然而,我认为
最好
使用一种基于纯
文本
相似
性度量
的
算法
,即不将
文本
“转
浏览 0
提问于2022-05-21
得票数 1
回答已采纳
1
回答
如何将
文本
和分类数据混合在一起
的
数据进行聚类?
clustering
、
text-mining
、
k-means
、
categorical-data
我有一组字符串,每个字符串都有与之相关
的
分类信息。但是,分类信息并不总是很好,所以我需要根据
文本
内容和类别对消息进行聚类。做这件事
最好
的
方法是什么?
浏览 0
提问于2015-05-18
得票数 3
1
回答
一组
文本
文档
的
相似
性
data-mining
、
text-mining
、
sentence-similarity
我正在寻找一种
算法
,试图检查2)多个文档(约5000个)之间
的
相似
度
我需要相同
的
,因为我正在尝试评估特定类别下
的
文本
文档/句子是否以任何方式彼此
相似
。
浏览 2
提问于2017-05-16
得票数 0
1
回答
在两个数据集之间找到最佳匹配/得分
machine-learning
我正在寻找一个潜在
的
匹配
算法
应用于2个数据集( DS1,DS2),这将为所有DS1 x DS2提供一个分数。任何指针或文档,你可以指示我来帮助我这个?
浏览 0
提问于2021-03-17
得票数 0
5
回答
数据挖掘中
的
“
相似
性”
artificial-intelligence
、
data-mining
、
similarity
在数据挖掘领域,有没有一个特定
的
子学科叫做“
相似
度
”?如果是,它处理
的
是什么。任何例子,链接,参考资料都会很有帮助。提前感谢您分享您
的
知识。
浏览 1
提问于2010-05-22
得票数 9
回答已采纳
2
回答
用于检查两个
文本
之间
相似
度
百分比
的
MySQL函数
mysql
、
similarity
我需要检查通过表格提交
的
文本
与MySQL数据库中存储
的
一些
文本
之间
的
相似
性百分比
的
MySQL代码。 我正在寻找
的
MySQL存储过程,将像PHP
的
函数
的
工作。当用户提交
文本
时,
算法
应该返回数据库中与提交
的
文本
具有给定
相似
度
百分比
的
任何条目(它将只比较数据库中
的
一列),例如返回数
浏览 41
提问于2011-10-12
得票数 7
1
回答
聚类中
的
相似
矩阵
data-mining
、
clustering
、
similarity
我正在编写一种聚类
算法
,这在这中得到了解释。根据本文提出
的
算法
,该
算法
通过结构
相似
度
和属性
相似
度
进行聚类。该
算法
在第4页被描述为这里。
浏览 0
提问于2016-12-08
得票数 -4
3
回答
是否有解释字符之间距离
的
文本
距离(或字符串
相似
性)
算法
?
strings
、
text-processing
、
string-matching
我感兴趣
的
是找到一个
文本
距离(或字符串
相似
度
)
算法
,当字符进一步分开时,该
算法
计算一个更大
的
距离(或更低
的
相似
度
)。像L
浏览 0
提问于2022-09-22
得票数 -1
2
回答
如何从语义上比较
文本
computer-science
、
semantics
假设你有一堆书
的
描述。有什么技术可以使这篇文章相互比较,这样我就可以对具有
相似
主题
的
书籍进行分组。
浏览 2
提问于2012-09-26
得票数 1
回答已采纳
2
回答
查找两个字符串之间
的
匹配百分比,同时考虑到单词- Python
的
顺序。
python
、
algorithm
、
string-matching
、
sequencematcher
我正在寻找一种方法来输出两个字符串之间
的
匹配百分比(例如:名称),同时也考虑到它们可能是相同
的
,但是单词
的
顺序不同。我注意到,它没有考虑到c包含与a相同
的
单词,但在中,包含不同
的
顺序。谢谢!
浏览 0
提问于2018-10-31
得票数 1
回答已采纳
2
回答
Javascript
文本
相似
度
算法
javascript
、
algorithm
、
text
、
similarity
我正在建立一个网站,应该收集各种新闻提要,并希望
文本
比较
的
相似
性。我需要
的
是某种新闻
文本
相似
度
算法
。所以,如果有人能给我举一个例子,一个插件,或者任何说明这是如何可能
的
,或者至少在哪里寻找和开始调查。
浏览 7
提问于2011-02-18
得票数 11
2
回答
比较差异很小
的
数据集之间
的
相似
性
的
好方法是什么?
algorithm
、
statistics
、
similarity
假设我有一个100个MLB投手
的
列表,每个投手有5个统计数据。例如,对于一个朴素
的
相似
性
算法
来说,3.5和3.1
的
ERA之间
的
差异可能看起来不是很大,但在棒球中却很大。考虑到我看到
的
许多玩家统计数据都有这个小方差,像这样
的
很多小方差,那么计算两个玩家之间
相似
度
的
最好
方法是什么?---------------B | 3.
浏览 3
提问于2012-01-17
得票数 1
回答已采纳
3
回答
获取两个
文本
的
相似
度
百分比
java
、
lucene
当一个
文本
在第二个
文本
中时,我需要获得
文本
之间
的
相似
度
得分。例如:Text2: bbb ccc 我需要一些东西告诉我,Text2在Text1中是100%
的
。有什么方法可以做到这一点吗?
浏览 0
提问于2011-03-08
得票数 4
点击加载更多
相关
资讯
文本相似度计算综述
基于ALBERT的文本相似度解决方案
语义文本相似度研究进展
移动端图像相似度算法选型
简单解释推荐系统的相似度及算法
热门
标签
更多标签
云服务器
ICP备案
即时通信 IM
云直播
实时音视频
活动推荐
运营活动
广告
关闭
领券