腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
文本分类:
多
文本分类与
多
类文本分类
、
、
由于单个
标签
问题可以被描述为二进制分类(如果有两个
标签
)或
多
类分类问题(如果有多个
标签
,即labels>2),目前的转换方法似乎都将
多
标签
问题转化为多个二进制问题。但这将导致数据不平衡的问题,因为负类可能比正类有更多的
文档
。 因此,我的问题,为什么不转化为
多
类问题,然后应用直接
多
类分类算法,以避免数据不平衡问题。在这种情况下,对于一个测试
文档
,每个经过训练的单
标签
多
类分类器将
浏览 5
提问于2016-03-02
得票数 1
3
回答
多
标签
文档
分类
、
、
、
我有一个数据库,我在其中存储基于以下三个字段的数据: id,文本,{
标签
}。请注意,每个文本都已分配给多个
标签
\标记\类。我想构建一个模型(weka \ rapidminer \ mahout),它将能够推荐\分类一堆
标签
\
标签
\类到给定的文本。 我听说过SVM和朴素贝叶斯分类器,但不确定它们是否支持
多
标签
分类。
浏览 3
提问于2013-05-21
得票数 7
5
回答
scikit-learn中文本数据的有监督降维
、
、
、
高级问题描述是,我有一个
文档
集合,每个
文档
上都可以有多个
标签
,我想根据
文档
的内容预测这些
标签
中的哪些
标签
将被贴到新
文档
上。 本质上,这是一个使用BoW向量的稀疏表示的有监督的、
多
标签
的、
多
类的问题。
浏览 6
提问于2013-11-01
得票数 12
2
回答
机器学习-单级、二元类和
多
类分类的区别在哪里?
、
、
、
单类、二元类和
多
类分类的区别是什么?我就不能用上面提到的所有方法来达到我的目标吗?
浏览 0
提问于2014-10-20
得票数 6
1
回答
什么是
多
标签
二进制分类?
、
、
阅读PyTorch
文档
什么是
多
标签
二进制分类?二进制假设只有两个
标签
浏览 1
提问于2020-03-19
得票数 3
回答已采纳
2
回答
主题建模和
文档
聚类之间的关系是什么?
、
、
主题建模识别
文档
集合中主题的分布,从而有效地识别集合中的集群。那么,说主题建模是一种进行
文档
聚类的技术是正确的吗?
浏览 0
提问于2013-03-19
得票数 10
回答已采纳
1
回答
我需要将名义变量转换为sklearn随机森林的不同字段吗?
、
、
、
这是我用来查看失效客户的数据集的一个示例。我已经将分类值转换为数字。然而,我相信sklearn随机森林会将这些字段视为离散的数字,例如,假设客户编号4是客户编号2的两倍?在应用我的随机森林模型之前,我是否需要对这些值进行交叉表或向量化? Lapse_Flag,客户,销售,客户年龄,州,主要销售区域0,1,28.46,3,1,1 0,2,46.07,3,2,10,3,108.48,3,3,2 1,4,26,3,4,3 0,5,54.42,3,5,4,4,0,5,54.42,3,371.93,7,5 1,8,35.6,3,8,6,6 1,9,357.95,2,9,7 0,10,5584.14,3,
浏览 3
提问于2014-10-07
得票数 0
1
回答
NLTK -
多
标记分类
、
、
、
我使用NLTK对
文档
进行分类--每个
文档
有一个
标签
,其中有10种类型的
文档
。对于我的
文档
特性,我将查看所有50k
文档
,并按频率( frequency_words )收集前2k单词,然后对每个
文档
标识
文档
中也在全局frequency_words中的单词。我遇到的问题是: 这个由NLTK提供的分类器是否适用于多个
标签
数据?-我看到的所有例子都是关于2类分类的,例如是否将某物声明为。这些
文档
应该有一套关键技能--不幸的
浏览 1
提问于2014-05-09
得票数 7
回答已采纳
1
回答
基于LIBLINEAR的
多
标号预测
、
、
我正在使用LIBLINEAR,我需要知道windows中的
多
标签
预测是否可行。我希望输出按以下方式生成 我训练了大约10个带有三个类
标签
1、2、3的
文档
,现在当我将测试
文档
提供给分类器时,如果
文档
属于
标签
1和2,那么它应该产生1,2或其他的东西,表明该
文档
属于1和2-两个类
标签
。
浏览 1
提问于2014-07-10
得票数 0
1
回答
交叉熵和Softmax是否适用于
多
标签
分类?
、
、
正如提到的,对于
多
标签
分类,交叉熵不是一个合适的损失函数。我的问题是“这一事实是否也适用于softmax的交叉熵?”如果是,它如何与
文档
的匹配。 我应该提一下,我的问题的范围是cntk。
浏览 20
提问于2017-01-17
得票数 5
回答已采纳
1
回答
XGboost目标:有没有办法进行
多
标签
(而不是
多
类)分类?
、
、
、
、
查看xgboost的目标
文档
,我看到了"multi:softmax“和"multi:softprob",但这两个都是只输出一个类的
多
类。有没有办法使用xgboost预测多个
标签
,或者我是否更好地为每个单独的
标签
训练多个模型。例如,在sklearn上,RandomForestClassifier支持
多
标签
,在拟合时,目标数组的输入可以是n个采样x n个
标签
的形状。澄清一下:
多
类别是指你想要预测一个学生是得了A、B还是C,而<
浏览 145
提问于2020-08-06
得票数 3
2
回答
文档
的监督
标签
建议
、
、
、
我有成千上万的
文档
和相关的
标签
信息。但是,我也有很多没有标记的
文档
。我知道NLTK、gensim、word2vec和其他库对解决这个问题会很有用。 我将使用Python对该项目进行编码。
浏览 0
提问于2017-06-26
得票数 0
3
回答
sklearn-具有
多
标签
的KNearestNeighbors
、
、
我有一个包含要素及其
标签
的数据集。X1, X2, X3, X4, X5 .. Xn L1, L2, L3..看起来sklearn不接受
多
标签
。Y, verbose =1, cv=3, n_jobs=3, scoring='f1_macro')有没有办法在sklearn中运行
多
标签
分类器
浏览 3
提问于2015-08-17
得票数 0
1
回答
如何计算tensorflow中的
多
类数据?
、
、
的
文档
说,当估计
多
类数据(即multi_label=False)的AUC时, model.compile(loss="binary_crossentropy", metrics我知道在
多
类问题中使用二进制交叉熵损失会告诉tensorflow设置一个
多
标签
分类问
浏览 9
提问于2021-08-02
得票数 2
回答已采纳
1
回答
多
类逻辑回归在SciKit学习中的应用
、
、
、
对于
多
类情况,我对Scikit的Logistic回归的正确调用有问题。我使用的是lbgfs解算器,并且将multi_class参数设置为multinomial。我不清楚如何在拟合模型时传递真实的类
标签
。我曾假设它与随机森林分类器
多
类类似/相同,其中您可以传递n_samples、m_classes数据帧。在检查时,fit方法的
文档
说真值作为n_samples传递--这与我得到的错误相匹配--然而,我不知道如何使用多个类训练模型。因此,这是我的问题:如何将完整的类
标签
集传递给fit函数?
浏览 0
提问于2016-04-10
得票数 4
回答已采纳
1
回答
sLDA。响应变量可能有多少值?
、
与LDA不同,它具有“与每个
文档
关联的响应变量”。在培训集中,每个
文档
都是由一个主题标记的,还是由多个主题标记的?如果必须只使用一个主题作为一个
文档
的
标签
,那么是否存在另一个LDA模型,它为培训集中的每个
文档
使用多个
标签
作为输入?如果sLDA可能使用一个以上的主题作为
标签
,那么有什么实现(在Python、C/C++、Matlab中)用于
多
标签
的sLDA吗?
浏览 1
提问于2014-03-18
得票数 0
回答已采纳
2
回答
用NLTK、scikit learn和OneVsRestClassifier启动
多
标签
分类
、
、
、
、
我试图训练一个分类器来将一组
文档
分类为一组
标签
。这种策略也可用于
多
标签
学习,其中一个分类器被用来预测多个
标签
,例如,如果样本I有<em
浏览 5
提问于2016-03-24
得票数 2
回答已采纳
1
回答
多
标签
和
多
标签
-
多
类分类的区别是什么?
、
、
然而,我对上述术语(
多
标签
和
多
标签
-
多
类)感到困惑。我的数据集由2个csv文件组成。第一个文件包含新闻文章的内容。同一对应行号中的第二个文件由与其关联的
标签
组成。下面是第二个文件(即
标签
文件)中的示例条目:因此,对于第1行,第一个csv文件包含了标题为体育和足球的新闻文章。同样,对于第2行,第一csv中的文章有运动和媒体的
标签
。我的问题是,这是数据集
多
标签
还是
多
标签
多
浏览 0
提问于2019-06-11
得票数 2
回答已采纳
3
回答
如何使用Python和Prometheus Pushgateway推送指标
、
、
我希望使用Pushgateway将
多
标签
指标推送到Prometheus中。
文档
提供了一个curl示例,但我需要通过Python发送它。此外,我还想在指标中嵌入多个
标签
。
浏览 1
提问于2016-12-06
得票数 9
回答已采纳
1
回答
文档
分类:预处理和
多
标签
、
、
、
正如在this thread中所讨论的,doc2vec与word2vec的选择是
文档
长度的问题。至于Tf-Idf与word嵌入,这更多的是文本表示的问题。我的另一个问题是,如果对于同一个语料库,我有多个
标签
链接到其中的句子,该怎么办?如果我为同一个句子创建了多个条目/
标签
,它会影响最终分类算法的决策。我如何告诉模型
文档
中的每一句话每个
标签
都是相等的?
浏览 12
提问于2020-03-27
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
标签软件如何批量打印多排条码标签
word多文档合并技巧
多排条码标签制作打印教程
基于多标签SVM的DNS隧道分类
RFID电子标签助力档案管理 让文档管理更简单
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券