腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(930)
视频
沙龙
1
回答
在
分类
/
聚
类
任务
中将
文本
值更
改为
int
、
、
、
有一个
任务
是用数据集
在
R中进行
聚
类
,其中包含
分类
文本
值(如“蓝色”、“红色”)。虽然k-means算法只接受数值,因此我需要将
文本
类别转换为
int
类别。有没有1行代码的解决方案?Instance2 3 1 a[,1] <- sapply(a[,1],switch,"blue"=1,"red"=2,"green"=3) 生成
任务
浏览 20
提问于2020-01-21
得票数 0
1
回答
基于情感的
文本
数据
聚
类
?
、
、
、
、
现在我得到的数据将是
文本
和未标记的。1.)使用DBScan、HDBScan或KMeans等
聚
类
算法对数据进行标记。集群的数目显然是3。2.)对标签数据进行
分类
算法的训练。1.我的方法正确吗?2.对于基于
文本
的集群,我可以遵循任何文章/博客/教程,因为我对此还有点陌生吗? PS:我对NLP和分
浏览 0
提问于2021-12-25
得票数 1
回答已采纳
1
回答
文本
分类
:准确性
、
、
在
文本
中,有一些作者的引语。选中的列已手动填写。我想做的是按作者对
文本
进行分组。我已经用kmeans和TfidfVectorizer做了。然而,我想了解是否有可能测试这种方法的准确性。
浏览 0
提问于2020-05-23
得票数 1
1
回答
哪种
聚
类
算法可以与Word Mover与M. Kusner的论文的距离一起使用?
、
、
我是机器学习的新手,现在我对文档
聚
类
(不同长度的短
文本
)感兴趣,因为它们的语义相似(我只想超越标准的TF/下手方法)。我阅读了的论文,其中解释了单词移动器对单词嵌入的距离。
在
论文中,他们用它来
分类
。我现在的问题是-我能用它进行
聚
类
吗?如果是的话,是否有这样的用纸? P.S.:我基本上对考虑到语义相似性的
聚
类
感兴趣,所以即使是word2vec或doc2vec方法也能完成这一
任务
--我只是找不到
在</e
浏览 0
提问于2018-04-04
得票数 0
回答已采纳
1
回答
topic中word的“增强”(主题建模)
、
、
情况就是这样。假设我们有包含聊天消息的数据集,我们希望对其进行主题建模(例如,很少有主题)。我以为这可能是围绕着TF-以色列国防军做的,但也许有一种不同的方法?
浏览 1
提问于2020-12-16
得票数 0
1
回答
如何将
文本
和
分类
数据混合在一起的数据进行
聚
类
?
、
、
、
我有一组字符串,每个字符串都有与之相关的
分类
信息。但是,
分类
信息并不总是很好,所以我需要根据
文本
内容和类别对消息进行
聚
类
。做这件事最好的方法是什么?
浏览 0
提问于2015-05-18
得票数 3
2
回答
如何在没有训练数据的情况下对聊天
文本
进行
分类
?
、
、
我有一个要对聊天
文本
进行
分类
的用例。我想使用Apache OpenNLP中的DocumentCategorizer对聊天进行
分类
。但为此,我必须有训练数据,这些数据应该已经对聊天进行了
分类
。是否需要手动对数百个聊天记录进行
分类
才能准备训练和测试数据?我还能做什么?我打算聊天类别是服务相关的问题。然后,该类别列表将是特定于域的。此数据的提供商是否应向我提供
分类
的聊天数据?谢谢,提前说好。
浏览 0
提问于2013-05-13
得票数 2
回答已采纳
3
回答
特征选择
文本
挖掘
、
、
、
、
我们正在进行一项关于
文本
分类
的
任务
,我们使用了一种无监督的机器学习模型。
在
进行
文本
聚
类
之前,数据集必须经过几个步骤,如从停止词中清除数据集,从
文本
中提取词干词,然后得到特征选择。我想知道这些方法的性质,以及如何在编码部分实现它们,是否有任何库可以用来执行这些
任务
。
浏览 2
提问于2013-12-23
得票数 0
1
回答
基于R的
文本
情感
分类
、
、
、
、
我有大量的
文本
数据集,我将包含特定关键字/s的
文本
与之分开。这里是带有特定关键字的。现在我的下一个
任务
是根据8情绪和2种情感对这个数据集进行
分类
,总共会有10种不同的
类
。我从获得了这个想法,它包含了14182个不同的单词和它们的emotion+sentiment
类
。NRC的主要工作是
在
http://saifmohammad.com/WebPages/NRC-Emotion-Lexicon.htm。我知道朴素贝叶斯
浏览 3
提问于2016-02-13
得票数 0
1
回答
自然语言处理
任务
的
分类
我看到这方面的许多
任务
是为句子中的每个单词指定标签,包括POS标记、分块、命名实体识别和语义角色标记。是否有其他不涉及为句子中的每个单词指定标签的
任务
。是否有一些建议阅读的调查,总结自然语言处理的一般
任务
。
浏览 0
提问于2019-05-18
得票数 1
4
回答
用于
文本
处理(
文本
挖掘、信息检索、自然语言处理)的Python或Java
、
、
、
、
我很快就会开始一个新的项目,在这个项目中,我将执行大量的
文本
处理
任务
,如搜索、
分类
/
分类
、
聚
类
等。我可以使用Python来做这件事吗,或者Python太慢了?最好是使用Java吗?我曾经使用Python处理过一些只有几千个文档的小规模
文本
处理
任务
,但我不确定它的可扩展性如何。
浏览 2
提问于2011-05-17
得票数 10
2
回答
如何用预先训练好的BERT将单词表示为嵌入?
、
、
、
、
我没有足够的数据(也就是说,我没有足够的
文本
)--
在
我的字典里只有大约4k个单词。我需要比较给定的单词,然后我需要将它表示为嵌入。我知道,几乎任何
任务
都可以解决“内部”伯特,即使用微调在最后一层。加载给定的
类
(表示每个
类
的单词)。例如“时尚”、“自然”
浏览 0
提问于2021-04-13
得票数 0
1
回答
如何在无监督学习中使用特征选择和降维方法?
、
、
、
我一直在对两位作者的电子邮件进行
分类
。我成功地使用了监督学习和
文本
向量化、主成分分析和SelectPercentile特征选择来执行同样的
任务
。我用科学工具-学习包来实现同样的目标。现在,我也想尝试使用无监督学习KMeans算法将电子邮件
聚
类
成两组。我已经创建了dataset,其
中将
每个数据点作为python列表中的一行。因为我是一个新手,没有监督,所以我想问,我是否可以应用相同的降维工具,
在
监督(TFIDF和SelectPercentile)。如果不是,他们的对应方是
浏览 4
提问于2016-05-27
得票数 2
回答已采纳
3
回答
字节与字符对单词-n克的粒度是多少?
、
、
、
至少可以考虑3种类型的n-克来表示
文本
文档:
在
选择“正确”代表时,是否有其他标准可考虑?
浏览 4
提问于2014-02-09
得票数 8
回答已采纳
21
回答
数据挖掘中
分类
和
聚
类
的区别?
、
、
、
、
有人能解释一下数据挖掘中
分类
和
聚
类
的区别吗? 如果可以,请给出两者的例子,以了解主要思想。
浏览 1
提问于2011-02-21
得票数 199
1
回答
K-means,bag of word,Word嵌入
文本
分类
CSV文件和检索相关数据
、
、
、
我有两个
任务
要做。词袋可以识别单词,但它不会给我单词本身的位置,去抓取列并创建<
浏览 3
提问于2019-03-19
得票数 0
2
回答
如何更改一个java
类
中的变量,然后从第三个java
类
访问更改后的变量?
假设我有3个java
类
,A、B和C。A
类
有一个名为num的
int
变量,它等于3。我希望能够将num从B
类
更
改为
另一个数字(例如,45),然后从C
类
访问该变量,使其等于45。我该怎么做呢?<code>A0</code> 前两个print语句输出预期的3和45,但是C
类
中的print语句仍然输出3,即使我
在
B
类
中将
num的
值更
改为
45。
浏览 6
提问于2018-12-23
得票数 0
回答已采纳
5
回答
你如何根据
文本
内容进行
分类
?
、
、
、
如何根据内容自动查找
文本
类别?
浏览 0
提问于2008-09-15
得票数 3
3
回答
分类
器所需训练数据集
、
目前,我正试图使用朴素贝叶斯技术
在
python中开发一个
分类
器。我需要一个数据集,这样我才能训练它。我的
分类
器会把给它的新文档
分类
为四个类别之一:科学技术、体育、政治、娱乐。
浏览 0
提问于2015-04-24
得票数 2
回答已采纳
2
回答
新闻
分类
、
、
、
能给我推荐一些策略来完成这个
任务
吗?
浏览 0
提问于2016-08-12
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券