腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Python
中
用于
匹配
具有
相似
ID
字符串
的
两个
集合
的
分类
器
、
、
、
、
我有两组数据,它们有共同
的
特征集,但它们
的
ID
名称
的
标签不同。 我想看看是否有一个最佳
的
分类
器
,可以帮助我选择哪些名称
匹配
是基于这些特征
的
最佳选择。Set 1看起来像这样: Name
ID
1 code1 move1 year Highland 1 ncSet 2看起来像这样: Name
ID</
浏览 20
提问于2019-01-15
得票数 4
1
回答
如何构建
分类
器
以确定两对是否
匹配
?
、
我正在尝试构建一个
分类
器
,它可以确定
两个
地址是
匹配
的
还是不
匹配
的
。构造
分类
器
的
将每个地址分段为它
的
子组件,如街道名称、邮政编码等 为每个字段构造一个
浏览 0
提问于2020-05-09
得票数 1
回答已采纳
1
回答
在随机森林中创建“未
分类
”类
、
、
、
我试图通过创建一个感兴趣
的
区域,然后根据该区域对卫星图像进行
分类
。我想定义一个像素为了被
分类
而必须
具有
的
相似
性级别,否则,它将不会得到任何类。例如,黑色应该是沥青:然而,在RGB
浏览 0
提问于2020-08-13
得票数 0
回答已采纳
4
回答
计算机科学
分类
学
、
、
、
我正在开发web应用程序,其中用户有标签
的
集合
。我需要为用户创建一个基于标签
相似
性
的
建议列表。 例如,当用户登录到系统时,系统将获取他
的
标记,并在用户数据库
中
搜索这些标记,并显示
具有
类似标记
的
用户。例如,如果用户1
具有
以下标记:Linux、Apache、MySQL、PHP和用户2
具有
Windows、IIS、PHP、MySQL,其中规定用户2<代码>E 29</>
匹配
浏览 2
提问于2010-06-07
得票数 4
回答已采纳
1
回答
如何确定
两个
名称列表之间
的
对应关系?
我有:100万个大学生姓名和300万个银行客户姓名请尽快答复,因为我急需这个。
浏览 1
提问于2011-03-03
得票数 2
5
回答
更好
的
模糊
匹配
性能?
、
、
、
、
我目前正在使用
的
方法get_close_matches方法来迭代15,000个
字符串
的
列表,以获得与另一个大约15,000个
字符串
的
列表最接近
的
匹配
: a=['blah','pie','apple'..有没有其他
的
库/方法可以更快,或者有办法提高这个方法
的
速度?我已经尝试过将
两个
数组都转换为小写,但这只会带来轻微
的
速度提升。
浏览 2
提问于2014-01-28
得票数 4
2
回答
NLP/机器学习文本比较
、
我目前正在开发一个程序,它可以将一个小文本(比如250个字符)与一个类似文本
的
集合
(大约1000-2000个文本)进行比较。其目的是评估文本A是否与
集合
中
的
一个或多个文本
相似
,如果类似,则必须通过
ID
检索
集合
中
的
文本。每个文本都有一个唯一
的
ID
。我希望输出有两种方式: 选项1:文本A
匹配
文本B
具有
90%
的
相似
性
浏览 4
提问于2013-08-26
得票数 16
1
回答
基于Watson图像识别的“
分类
”图像
、
、
、
在
中
,你可以给应用程序一个图像,它会对它进行
分类
,并告诉你它在图像
中
的
想法。它是如何做到这一点
的
? 据我从文档
中
可以看出,你只能给它正面和负面的图像,它只能说‘是’,这是比萨,或‘不’,这不是比萨。
浏览 6
提问于2016-04-02
得票数 3
回答已采纳
1
回答
两组不同尺寸顶点
的
最大加权二部
匹配
、
、
、
、
抽象问题我已经将对象(包围框)划分为
两个
集合
,并且我有一个
相似</
浏览 0
提问于2018-04-06
得票数 1
回答已采纳
1
回答
一种
用于
比较200k
字符串
的
数据结构
、
、
我有200,000个
字符串
。我需要在该
集合
中找到
相似
的
字符串
。我希望
相似
的
字符串
在
集合
中
的
数量非常少。请帮助我们实现高效
的
数据结构。 如果我正在寻找完全
匹配
的
字符串
,我可以使用一个简单
的
散列。但是,在我
的
例子
中
,“
相似
性”是自定义
的
:如果
两个
字符串<
浏览 2
提问于2012-12-27
得票数 3
回答已采纳
1
回答
句子多类
分类
的
BertForSequenceClassification与BertForMultipleChoice
、
、
、
、
我正在研究一个文本
分类
问题(例如情感分析),在这个问题上,我需要将文本
字符串
分类
为五个类
中
的
一个。我应该用哪一个来完成我
的
5路
分类
浏览 5
提问于2020-03-10
得票数 17
回答已采纳
2
回答
字符串
与
Python
+ Sqlite (Levenshtein距离/编辑距离)
的
相似
性
、
、
、
在
Python
+Sqlite
中
是否有可用
的
字符串
相似
性度量,例如sqlite3模块?是相同
的
,但它也允许
两个
相邻字符之间
的
换位;它也称为。*/从内容
匹配
的
enrondata1选择计数(*);/* 0.03秒*/从enrondata2选择计数(*),其中内容为'%linux%';/* 22.5秒*/ 但我没有发现
字符串
与这样
浏览 0
提问于2018-04-11
得票数 7
回答已采纳
1
回答
当
字符串
在
Python
语言中拼写错误时替代OneHotEncoder
、
、
在我
的
数据集中,我有一个代表国家名称
的
分类
特征,但有时其中一些拼写错误。 例如,'France‘也可以写成'Francz’和'Franc‘。你知道
python
中
是否有任何现有的算法可以将
字符串
转换为
具有
单词
相似
度
的
数值。因此,对于我上面的例子来说,值将非常
相似
?
浏览 2
提问于2017-10-24
得票数 1
3
回答
Python
列表文档
中
的
“同质性”是什么?
、
在
python
文档列表
中
,定义为: 那么
字符串
和int项也是同构
的
吗?
浏览 1
提问于2013-11-01
得票数 10
回答已采纳
1
回答
神经网络多重变分预测
、
、
、
我正在训练多个不同参数
的
神经网络。我试图平均他们
的
预测,但我真的不知道这意味着什么,我很困惑
的
是,要平均到底是什么。这里是我
的
意思:例如,对于二进制
分类
中
的
单个观察,最后一个节点将给p一个介于0到1之间
的
值(或者-1和1,如果您使用双曲正切激活函数),那么这个p将被舍入到1或0,如果它> 0.5,这取决于您
的
决策边界现在,我不明白
的
是,平均p1、p2和p3是在四舍五入前由模型生成
的
,还是应该将
浏览 0
提问于2019-10-07
得票数 2
回答已采纳
1
回答
Weka
中
的
堆叠
、
、
、
我在Weka中使用元
分类
器
“堆叠”来组合
两个
算法,如下图所示。
浏览 0
提问于2014-05-12
得票数 1
6
回答
重复文本检测/散列
我在数据库中有一组
字符串
。每个
集合
将有不到500个成员,将有数万个
集合
,并且
字符串
是自然语言。我想要检测每个
集合
中
的
重复
字符串
。新
字符串
将与现有的
字符串
进行比较,如果它们是唯一
的
,则会添加到数据库
中
。 是否有散列算法可以有效地找到(非常)
相似
的
字符串
?例如,
字符串
可能
具有
相同数量
的
单词,但编码
浏览 1
提问于2009-05-07
得票数 3
回答已采纳
1
回答
laravel
集合
合并没有像我预期
的
那样工作
、
我有类似但略有不同
的
雄辩模型类,名为Exam,Type,Custom。->get()); $recent = $recent->merge(Custom::orderBy('updated_at', 'desc')->take(3)->get()); 以上是我尝试过
的
方法最终
的
$recent
集合
仅包含Custom项。其他像Exam,Type这样
的
东西都消失了。 目前,我正在用push方法替换这一部分。它工作得很好,但即使在看到merge方
浏览 18
提问于2019-09-28
得票数 0
回答已采纳
1
回答
“模糊”Jaccard索引实现
的
性能
、
、
、
、
我试图计算
两个
集合
之间
的
一种模糊Jaccard指数,其基本原理如下:作为Jaccard指数,我想要计算
两个
集合
共有的项目数与
两个
集合
中
不同项
的
总数之间
的
比率。问题是,我想使用一个
具有
阈值
的
相似
函数来确定什么是“相同”项在
两个
集合
中
,这样就可以使类似的项: 都算在交叉口。,这在
集
浏览 2
提问于2014-06-13
得票数 0
回答已采纳
1
回答
在mongodb
集合
中
查找重复项
、
目标是在单个mongodb数据库
中
查找存在于多个
集合
中
的
字段值。假设每个
集合
根据其中
的
字段类型或数量
具有
相似
的文档模型。请注意。在每个
集合
中都有一个唯一
的
id
字段,其值在其他
集合
中
可能不同。目的是推导出
具有
这些唯一
id
值
的
所有
集合
。解决方案..逐个遍历整
浏览 4
提问于2017-08-22
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
云直播
活动推荐
运营活动
广告
关闭
领券