腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(378)
视频
沙龙
1
回答
NLP
分类
标
签有
多个
相似
项
,替
换为
只有
一个
、
、
、
、
我一直在尝试使用Python中的fuzzywuzzy库来查找标签中字符串之间的
相似
度百分比。我遇到的问题是,即使当我尝试查找和替换时,仍然有许多字符串非常
相似
。', 理想情况下,我希望能够找到并替
换为
一个
公共字符串,这样我们就
只有
一个
'closing as duplicate‘的实例。我们非常感谢您的任何想法或建议。 来提供
一个
更彻底的例子。', 73)] 嗯,也许我应该创建
一个
函数来替换
相似
度分数大于9
浏览 14
提问于2020-11-06
得票数 1
回答已采纳
1
回答
是否有可能找到spaCy POS机标签的不确定性?
、
、
、
我正在尝试构建
一个
非英语拼写检查器,它依赖于spaCy对句子的
分类
,这使得我的算法可以使用词性标签和单个标记的语法依赖性来确定拼写错误(在我的例子中,更具体地说:荷兰语复合词中的错误拆分)。正因为如此,我想知道是否有可能获得spaCy
分类
的不确定性,从而可以判断spaCy是否正在努力处理
一个
句子。有没有办法知道spaCy是否认为
一个
句子在语法上是正确的(而不必指定我的语言中所有正确句子结构的模式),或者获得
分类
确定性?Spacy tagger." doc =
nlp</
浏览 0
提问于2020-12-09
得票数 4
2
回答
创建特定领域的问答系统
、
、
、
我想要创建
一个
领域特定的QA系统。我正在考虑的一种方法是创建
一个
本体/知识库,然后使用它进行答案检索。
一个
QA模型可以用来覆盖不同的领域吗?还有其他机器学习和深度学习方法可以用于这一点吗?
浏览 0
提问于2016-06-16
得票数 5
1
回答
当使用子任务和两个不同的数据集时,您将如何实现模型组合?
、
、
、
、
我创建了原始标签的副本,并将目标列中的3个标签替
换为
另
一个
标签。例如,我有
一个
NLP
多
分类
问题,我需要将x
分类
为4个不同的标签,比如1,2,3,或者4.1,2,3标签是相关的,它们的标签可以替
换为
5,所以现在是
一个
二进制
分类
问题。目前,我正在使用SGDClassifier,在4到5之间的
分类
中获得了90%的准确率,但不确定如何将其用于1、2和3的
多个
分类
。 我认为这与Keras<e
浏览 1
提问于2020-05-11
得票数 0
回答已采纳
2
回答
为什么string.Format有几种风格?
、
、
、
.NET提供了四个非常
相似
的String.Format(...)版本(不包括接受IFormatProvider参数的版本):将指定字符串中的
一个
或
多个
格式
项
替
换为
指定对象的字符串表示形式Format(String, Object, Object)将指定字符串中的格式
项
替
浏览 0
提问于2009-08-09
得票数 2
回答已采纳
1
回答
多个
小数据集的迁移学习
、
、
上下文我做了什么,我目前的想法是使用
一个</em
浏览 0
提问于2020-09-24
得票数 1
3
回答
NLP
用于检测非常技术性语言的重复
项
、
、
、
我的模型需要考虑的是,技术名称可能使用不同的注释和缩写,数据条目中的文本错误、
相似
/不同的维度或特征可能仍然指向同一产品。因此,我认为在我的情况下,应用常规的模糊匹配或其他
NLP
文本匹配效果并不理想。我试着把这个问题作为
一个
学习/监督的模型来处理,但仍然不确定为什么任何建议/想法都会受到很大的赞赏。
浏览 0
提问于2019-09-05
得票数 0
1
回答
在文档项目上构建语料库有意义吗?
、
、
我正试图为云技术(如AWS、Google )构建
一个
参考站点。这样做的出发点是建立
一个
语料库吗?我试过了
分类
语料库生成器。在
多个
类别中包含
一个
特定的文档可以吗?例如,AWS中的实例可以是类别ec2和通用类别计算单元 总之,这个问题是我想要解决的,适合于一般
浏览 0
提问于2020-02-12
得票数 0
回答已采纳
2
回答
如何将HTML转
换为
文档形式?
、
、
、
我希望能够将HTML转
换为
或。有大量Ruby宝石用于创建docx和RTF文档,但它们只是用于创建
一个
空文档,然后可以通过编程方式向其中添加内容。这些宝石的问题是,无法准确地将网页的格式转
换为
可打印页面上的相同/
相似
格式。HTML标
签有
很多复杂的地方,这些标签的位置是因为它们的CSS属性。根据我目前对用于和创建的gems的了解,我必须编写
一个
HTML解析器,并将所有的openXML标记转
换为
类似的openXML标记,例如粗体和斜体,但是然后根据CSS定位东西,但
浏览 3
提问于2012-02-07
得票数 1
2
回答
如何允许单个节点具有
多个
父节点(菜单项)
如何使单个节点具有
多个
父节点(D7)?我可以设置如下结构吗?主页>第1节> SubSection A>‘我的节点’主页>第2节> SubSection B>‘我的节点’主页>第2节> SubSection B> 'my节点‘我在以前的
一个
项目中使用了节点层次,子特性‘允许
多个
父母’现在看起来有点小马车你有什么建议吗?
浏览 0
提问于2012-11-30
得票数 5
回答已采纳
1
回答
与SparkNLP的句子
相似
只在Google上使用一句,当提供
多个
句子时失败
、
、
、
、
将以下colab python代码(参见下面的链接)部署到Google上的Dataproc中,并且
只有
当input_list是
一个
包含
一个
项
的数组时,当input_list有两个
项
时,PySpark作业就会在下面的<---- works链接到colab以获得使用spark
nlp
:的句子
相似
性 de
浏览 4
提问于2020-11-18
得票数 3
2
回答
余弦
相似
性度量:
多个
结果
、
、
、
、
我的程序使用聚类来生成
相似
项
的子集,然后使用余弦
相似
性度量来确定聚类有多
相似
。我的问题是,基于这些结果,我如何才能将这些值转化为
一个
有形的结果来显示这两个用户有多
相似
?我提出了
一个
简单的方法,就是将所有的值除以比较的数量,并将它们相加到一起得到
一个
值,但这是
一个
非常简单的方法。到目前为止,我已经从用户书签的标记和每个标记的同时创建了集群,例如,
一个
集群可以是: fruit: (apple, 15), (orange,
浏览 3
提问于2010-04-15
得票数 0
1
回答
完全数据不平衡的文本
分类
与聚类
、
、
我有一套来自PUBMED的具有共同研究兴趣的作者的科学论文,我想:发展
一个
分类
算法,以确定
一个
给定的作者是否有类似的研究兴趣实际上,我正在努力寻找新的作者,并且能够判断出我发现的
一个
作者是否与我最初的一组作者
相似
。 不幸的是,因为我的数据只是
一个
类,我有
一个
极端的数据不平衡问题。我该怎么解决这个问题?我的一组论文和作者被认为有着
相似
的研究兴趣。为了建立
分类</e
浏览 0
提问于2018-03-02
得票数 1
1
回答
将一组短语归类为一组
相似
的短语
、
、
跟踪信息是典型的printf()样式-即有许多日志条目是
相似
的(与printf相同的格式参数),但不同的是格式字符串具有参数。什么是算法(url,书籍,文章,...)这将允许我分析日志条目并将它们
分类
到几个bin /container中,其中每个bin都有一种关联的格式?本质上,我想要的是将原始日志条目转
换为
(formatA,arg0 ...argN)实例,其中formatA在
多个
日志条目之间共享。此外,它还侧重于匹配一对(长)字符串,或单个bin输出(所有输入中的
一个
匹配)。我的情况略有不同,
浏览 0
提问于2010-12-26
得票数 0
回答已采纳
3
回答
流数据和主题识别的数据结构/算法
、
、
、
、
在
一个
典型的新闻来源中,
一个
将删除数据中的任何停止词。在我的系统中,我想通过在广泛的主题中识别最常用的单词来更新我的停止词列表。 一种可能是使用某种训练算法。但最好
浏览 2
提问于2010-01-22
得票数 2
回答已采纳
4
回答
是否有一种算法可以找到与某些属性相匹配的
项
,比如
一个
20个问题游戏?
、
、
一个
关于20个问题游戏的问题被问到 那么,是否有一种方法可以使用我不理解的二叉树,还是有不同的算法来解决这个问题呢?为了澄清,我只是用20个问题作为例子,所以我的问题是关于这类搜索问题,而不是在
一个
20个问题游戏中专门涉及的其他问题。
浏览 2
提问于2010-05-14
得票数 5
1
回答
如何检测python中的某个对象
、
、
所以我试着做
一个
yt的对象检测教程。我找到了
一个
叫murtaza的人我想试试他的密码。这是视频;;它没有什么问题;它能正常工作,但我想知道我是否只能检测到帧中的某个对象,而不是所有类型的对象;所以,我不希望它检测到"coco.names“文件中的所有东西,但
只有
一个
;我知道怎么做吗?因为他使用的编码策略非常先进,所以我不知道如何使代码做到这一点;因此:在视频流(网络摄像头) -"ssd_mobilenet_v3_large_coco_2020_01_14.pbtxt“文件中,.detect只使用
浏览 19
提问于2022-03-14
得票数 -2
回答已采纳
2
回答
图像识别服务
我现在正在制作
一个
移动应用程序。我想找到
一个
服务,我将上传我定义的对象的图像:飞机,计算机,...当用户使用应用程序时,他们拍摄我已经在服务中定义的对象的照片,服务将告诉他/她关于对象的信息,例如:Akai的电脑,Akai的笔记本电脑
浏览 1
提问于2016-09-11
得票数 2
3
回答
多元时间序列聚类
、
、
、
我有
一个
流数据和时间戳数据集,如下所示:1.png准确地说, 需要根据它们的
相似
点(Co
浏览 0
提问于2018-03-20
得票数 9
6
回答
重复文本检测/散列
是否有散列算法可以有效地找到(非常)
相似
的字符串?例如,字符串可能具有相同数量的单词,但编码可能略有不同(UTF-8与拉丁语-1)。
浏览 1
提问于2009-05-07
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
灵智互动带你一分钟入门NLP!
CNN与RNN对中文文本进行分类-基于TENSORFLOW实现
继BERT之后,这个新模型再一次在11项NLP基准上打破纪录
训练情感分类器很难?百行Python代码就能做到!
利用AllenNLP,百行Python代码训练情感分类器
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券