腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
用于
多
标签
文本
分类
的
数据
集
变换
、
、
、
、
我正在通过深度学习模型进行一些关于
多
标签
分类
的
实验。但是我在
数据
集
上遇到了一个问题。 我使用Keras,TensorFlow 2.0,numpy,pandas。我有一个格式为:Dataset in the form that I have it
的
数据
集
要应用
多
标签
分类
(6个
标签
),我需要
数据
集
采用以下形式:Dataset in
浏览 48
提问于2021-09-08
得票数 0
回答已采纳
1
回答
多
标签
多
类
分类
的
激活方法及损失函数
、
、
、
、
我正在使用Yoonkim
的
用于
句子
分类
的
CNN代码。这
用于
文本
分类
。我注意到他使用了softmax层和负日志似然误差。这对于单
标签
多
类
分类
是最优
的
。我现在有一个
数据
集
,
用于
多
标签
-
多
类
分类
。理想
的
激活方法和错误函数是什么? 我认为,使用softmax层会给出
浏览 0
提问于2016-09-12
得票数 3
2
回答
如何在Apache Spark中进行
多
标签
分类
、
我想在大
数据
集
上进行
多
标签
文本
分类
,似乎Apache Mahout或Spark MLLib等大
数据
机器学习工具目前还不支持这一点。我想知道以前有没有人做过大
数据
集
的
多
标签
分类
?在不久
的
将来,是否有计划在Mahout或Spark中集成
多
标签
分类
?
浏览 13
提问于2015-06-26
得票数 5
1
回答
文本
分类
问题:这类
分类
的
名称和方法
、
、
、
、
我有一个由
文本
片段和相应
标签
组成
的
带
标签
的
数据
集
。每个
标签
由三个部分组成,可以有多个或零个
标签
分配给给定
的
文本
段。N/A N/A N/A 该任务是为任何给定
的
文本
片段预测
标签
,其中每个
标签
由三个部分(动作、执行、人员)组成,并且一个
文本
片
浏览 16
提问于2019-12-07
得票数 0
3
回答
谷歌AutoML自然语言
多
标签
文本
分类
的
输入
数据
集
的
格式
、
、
对于谷歌AutoML自然语言
多
标签
文本
分类
,输入
数据
集
的
格式应该是什么?我知道对于
多
类
分类
,我需要一列
文本
和另一列
标签
。
标签
列每行包含一个
标签
。 我对每个
文本
都有多个
标签
,并且我想进行
多
标签
分类
。我试着为每个
标签
设置一列和一次热编码,但是我得到了这个错误消息
浏览 6
提问于2018-09-28
得票数 3
1
回答
是否有使用强化学习进行
多
标签
文本
分类
的
例子?
、
、
我有一个有
标签
的
数据
集
,我将为
多
标签
分类
问题(例如:5个
标签
)开发一个
分类
器。我已经开发了伯特和CNN,但我想知道我是否也可以使用RL进行
文本
分类
。 据我所知,使用RL我们可以使用更小
的
训练
数据
集
。我正在寻找RL
的
python代码。
浏览 2
提问于2022-04-26
得票数 0
回答已采纳
1
回答
为
多
标签
分类
准备训练
数据
集
、
、
、
我只是遵循了代码 (对sklearn 0.17做了一些小
的
修改)。在该示例中,
数据
只是列表或numpy数组。现在我想在磁盘上准备一个玩具训练
数据
集
,并使用datasets.load_files加载它以进行
多
标签
分类
。然而,简单地遵循约定,然后将相同
的
文件复制到多个文件夹中,并不会生成列表列表(也就是。
标签
集
)
用于
dataset.target。 那么,为
多
标签
<em
浏览 0
提问于2016-05-02
得票数 2
1
回答
如何对
多
类
数据
集
进行二进制
分类
?
、
、
、
、
我想对
多
类
数据
集
(由来自多个科学文章文件
的
标记句子组成)进行两种类型
的
分类
。我想要做
的
类似于这个。因此,第一种是二进制
分类
,从一个名为"others“
的
标签
中去掉句子。剩下
的
将
用于
第二个
分类
,这是一个
多
类
分类
。 目前,我被困在“如何对
多
类
数据
集
进行二进制
分类
浏览 19
提问于2021-03-03
得票数 0
回答已采纳
1
回答
使用j48树处理
分类
中
的
多
标签
数据
集
我正在尝试使用j48树来执行
文本
分类
任务。我读了很多论文和网站,它们解释了如何使用
数据
集
为单
标签
的
分类
。在我
的
例子中,我
的
训练集中只有
多
标签
数据
,我可以在单个决策树中处理这些
数据
吗?或者唯一
的
解决方案是生成与
标签
数量一样
多
的
树?
浏览 0
提问于2012-11-18
得票数 1
2
回答
多
标签
分类
、
、
我有一个有77个不同
标签
的
数据
集
。每个样本都有一个或多个这些
标签
。 我做了一些
数据
分析,发现
数据
集
是高度不平衡
的
--有大量有特定
标签
的
示例,而其他
标签
在
数据
样本中并不经常出现。我试图使用SMOTE为少数族裔
标签
合成新
的
数据
样本,但很明显,imblearn
的
SMOTE不支持
多
<
浏览 0
提问于2020-02-06
得票数 5
回答已采纳
1
回答
TPOT是否支持
多
标签
文本
分类
?
、
、
、
、
如何运行TPOT来为
多
标签
文本
分类
提供建议?我
的
数据
已经被清理并划分为训练
集
和测试
集
。
浏览 8
提问于2020-09-24
得票数 0
1
回答
使用AUC指标进行
多
标签
分类
的
预测
、
、
、
我使用AUC指标来进行
多
标签
分类
。由于keras删除了
用于
获取预测类
的
prediction_classes,所以我只使用0.5
的
阈值来获得输出类。然而,据我理解,对于AUC来说,对于不平衡
的
数据
集
来说,阈值不应该是0.5。如何获得
用于
训练模型
的
阈值? 此外,我知道AUC
用于
二进制
分类
。我能用它来解决
多
标签
问题吗?如何计算阈值?不
浏览 1
提问于2021-04-26
得票数 1
回答已采纳
3
回答
构建一个能够处理它从未见过
的
类
的
多
类
分类
器?
、
、
给我一个
数据
集
,它有一个自由形式
的
文本
和一个与它相关
的
类别。每个类别有100种不同
的
分类
和3000条记录。目标是建立一个
多
类
分类
模型。我建立了一个简单
的
神经网络,输入10,000个特征/字,结果相当好(~88%)。 我面临
的
问题是我有一个未标记
的
数据
集
,该
数据
集
缺少类别
标签
。此<em
浏览 0
提问于2021-04-13
得票数 1
1
回答
用于
多
标签
数据
分类
的
新闻文章及其关联类别的公共
数据
集
、
、
、
我想知道是否有公开
的
新闻
数据
集
,如“纽约时报”,或类似于各种新闻类别,如政治,娱乐,生活方式,一般新闻,体育等。我想使用这样
的
数据
集
对不同句子或段落进行
多
标签
数据
分类
,即一个句子可以属于政治、娱乐、体育或所有的,所以我需要
数据
集
将
数据
分类
为多个
标签
。我计划用这样
的
数据
集训练
分类</em
浏览 0
提问于2020-10-29
得票数 1
1
回答
文本
分类
:
多
文本
分类
与
多
类
文本
分类
、
、
我有一个关于处理
多
标签
分类
问题
的
方法
的
问题。但这将导致
数据
不平衡
的
问题,因为负类可能比正类有更多
的
文档。 因此,我
的
问题,为什么不转化为
多
类问题,然后应用直接
多
类
分类
算法,以避免
数据
不平衡问题。在这种情况下,对于一个测试文档,每个经过训练
的
单
标签
多
类
分类
器将预测是否分配
标签
,
浏览 5
提问于2016-03-02
得票数 1
1
回答
scikit学习:交叉验证分数是否评估日志丢失功能?
、
、
、
在python中,我使用随机梯度下降来执行
多
类
分类
,以最小化日志损失函数。clf = SGDClassifier(loss="log", penalty="l2")score = clf.fit(X_train, y_train).score(X_test, y_test) 是评价损失函数
的
分数?对于每一个交叉验证分割,我
的
分数总是0.0。那么,这是否意味着我
的<
浏览 5
提问于2015-10-20
得票数 3
回答已采纳
1
回答
在Rapidminer中应用
多
标签
转换?
、
、
、
、
我在快速矿工
的
文本
分类
工作,并要求实现一个问题转换方法,以转换
多
标签
数据
集
为单
标签
,即
标签
功率
集
等,但找不到一个在快速矿工,我确信我错过了什么或可能是快速矿工提供了另一个名称或什么?1)我搜索并找到了Rapidminer
的
“多项式”运算符,我认为它在内部使用了二进制相关性进行问题转换,但我如何应用其他运算符,即
标签
幂
集
或
分类
器链?2)其次,“二项
浏览 3
提问于2014-11-29
得票数 0
3
回答
具有大量类别的
分类
、
假设我有一个包含1000万张图像
的
训练
数据
集
,其中包含100,000个不同人
的
图像。我想创建一个ML模型,它可以识别给定图像中
的
哪个人。考虑到大量的人(类),最好
的
方法是什么?
浏览 1
提问于2019-12-12
得票数 3
1
回答
必须使用复杂
的
还是几个简单
的
模型?
我不明白模型是如何组织起来
的
。Category (name, null parent) |Product (name+description)我使用
的
模型将对产品进行顶级
分类
,在我使用另一个模型对属于
分类
的
顶级类别的产品进行训练后(这样我就可以对二级类别进行
分类
)。对于下一步,我将为par
浏览 2
提问于2018-07-05
得票数 0
2
回答
空间TextCat评分在MultiLabel
分类
中
的
应用
、
、
在spacy
的
文本
分类
示例中,有两个
标签
指定了正和阴性。因此,猫
的
得分被表示为我正在使用
多
标签
分类
,这意味着我有两个以上
的
标签
标记在一个
文本
中我增加了我
的
标签
textcat.ad
浏览 5
提问于2020-06-12
得票数 4
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
基于多标签SVM的DNS隧道分类
基于transformer一步一步训练一个多标签文本分类的BERT模型
深度学习用于文本分类的论文及代码集锦
腾讯AI Lab开源业内最大规模多标签图像数据集
基于非常深的卷积神经网络用于文本分类
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券