用于多标签文本分类的数据集变换

、、、、

我正在通过深度学习模型进行一些关于多标签分类的实验。但是我在数据集上遇到了一个问题。我使用Keras，TensorFlow 2.0，numpy，pandas。我有一个格式为：Dataset in the form that I have it的数据集要应用多标签分类(6个标签)，我需要数据集采用以下形式：Dataset in

浏览 48提问于2021-09-08得票数 0

回答已采纳

1回答

多标签多类分类的激活方法及损失函数

、、、、

我正在使用Yoonkim的用于句子分类的CNN代码。这用于文本分类。我注意到他使用了softmax层和负日志似然误差。这对于单标签多类分类是最优的。我现在有一个数据集，用于多标签-多类分类。理想的激活方法和错误函数是什么？我认为，使用softmax层会给出

浏览 0提问于2016-09-12得票数 3

2回答

如何在Apache Spark中进行多标签分类

、

我想在大数据集上进行多标签文本分类，似乎Apache Mahout或Spark MLLib等大数据机器学习工具目前还不支持这一点。我想知道以前有没有人做过大数据集的多标签分类？在不久的将来，是否有计划在Mahout或Spark中集成多标签分类？

浏览 13提问于2015-06-26得票数 5

1回答

文本分类问题:这类分类的名称和方法

、、、、

我有一个由文本片段和相应标签组成的带标签的数据集。每个标签由三个部分组成，可以有多个或零个标签分配给给定的文本段。N/A N/A N/A 该任务是为任何给定的文本片段预测标签，其中每个标签由三个部分(动作、执行、人员)组成，并且一个文本片

浏览 16提问于2019-12-07得票数 0

3回答

谷歌AutoML自然语言多标签文本分类的输入数据集的格式

、、

对于谷歌AutoML自然语言多标签文本分类，输入数据集的格式应该是什么？我知道对于多类分类，我需要一列文本和另一列标签。标签列每行包含一个标签。我对每个文本都有多个标签，并且我想进行多标签分类。我试着为每个标签设置一列和一次热编码，但是我得到了这个错误消息

浏览 6提问于2018-09-28得票数 3

1回答

是否有使用强化学习进行多标签文本分类的例子？

、、

我有一个有标签的数据集，我将为多标签分类问题(例如:5个标签)开发一个分类器。我已经开发了伯特和CNN，但我想知道我是否也可以使用RL进行文本分类。据我所知，使用RL我们可以使用更小的训练数据集。我正在寻找RL的python代码。

浏览 2提问于2022-04-26得票数 0

回答已采纳

1回答

为多标签分类准备训练数据集

、、、

我只是遵循了代码 (对sklearn 0.17做了一些小的修改)。在该示例中，数据只是列表或numpy数组。现在我想在磁盘上准备一个玩具训练数据集，并使用datasets.load_files加载它以进行多标签分类。然而，简单地遵循约定，然后将相同的文件复制到多个文件夹中，并不会生成列表列表(也就是。标签集)用于dataset.target。那么，为多标签<em

浏览 0提问于2016-05-02得票数 2

1回答

如何对多类数据集进行二进制分类？

、、、、

我想对多类数据集(由来自多个科学文章文件的标记句子组成)进行两种类型的分类。我想要做的类似于这个。因此，第一种是二进制分类，从一个名为"others“的标签中去掉句子。剩下的将用于第二个分类，这是一个多类分类。目前，我被困在“如何对多类数据集进行二进制分类

浏览 19提问于2021-03-03得票数 0

回答已采纳

1回答

使用j48树处理分类中的多标签数据集

我正在尝试使用j48树来执行文本分类任务。我读了很多论文和网站，它们解释了如何使用数据集为单标签的分类。在我的例子中，我的训练集中只有多标签数据，我可以在单个决策树中处理这些数据吗？或者唯一的解决方案是生成与标签数量一样多的树？

浏览 0提问于2012-11-18得票数 1

2回答

多标签分类

、、

我有一个有77个不同标签的数据集。每个样本都有一个或多个这些标签。我做了一些数据分析，发现数据集是高度不平衡的--有大量有特定标签的示例，而其他标签在数据样本中并不经常出现。我试图使用SMOTE为少数族裔标签合成新的数据样本，但很明显，imblearn的SMOTE不支持多<

浏览 0提问于2020-02-06得票数 5

回答已采纳

1回答

TPOT是否支持多标签文本分类？

、、、、

如何运行TPOT来为多标签文本分类提供建议？我的数据已经被清理并划分为训练集和测试集。

浏览 8提问于2020-09-24得票数 0

1回答

使用AUC指标进行多标签分类的预测

、、、

我使用AUC指标来进行多标签分类。由于keras删除了用于获取预测类的prediction_classes，所以我只使用0.5的阈值来获得输出类。然而，据我理解，对于AUC来说，对于不平衡的数据集来说，阈值不应该是0.5。如何获得用于训练模型的阈值？此外，我知道AUC用于二进制分类。我能用它来解决多标签问题吗？如何计算阈值？不

浏览 1提问于2021-04-26得票数 1

回答已采纳

3回答

构建一个能够处理它从未见过的类的多类分类器？

、、

给我一个数据集，它有一个自由形式的文本和一个与它相关的类别。每个类别有100种不同的分类和3000条记录。目标是建立一个多类分类模型。我建立了一个简单的神经网络，输入10,000个特征/字，结果相当好(~88%)。我面临的问题是我有一个未标记的数据集，该数据集缺少类别标签。此<em

浏览 0提问于2021-04-13得票数 1

1回答

用于多标签数据分类的新闻文章及其关联类别的公共数据集

、、、

我想知道是否有公开的新闻数据集，如“纽约时报”，或类似于各种新闻类别，如政治，娱乐，生活方式，一般新闻，体育等。我想使用这样的数据集对不同句子或段落进行多标签数据分类，即一个句子可以属于政治、娱乐、体育或所有的，所以我需要数据集将数据分类为多个标签。我计划用这样的数据集训练分类</em

浏览 0提问于2020-10-29得票数 1

1回答

文本分类:多文本分类与多类文本分类

、、

我有一个关于处理多标签分类问题的方法的问题。但这将导致数据不平衡的问题，因为负类可能比正类有更多的文档。因此，我的问题，为什么不转化为多类问题，然后应用直接多类分类算法，以避免数据不平衡问题。在这种情况下，对于一个测试文档，每个经过训练的单标签多类分类器将预测是否分配标签，

浏览 5提问于2016-03-02得票数 1

1回答

scikit学习:交叉验证分数是否评估日志丢失功能？

、、、

在python中，我使用随机梯度下降来执行多类分类，以最小化日志损失函数。clf = SGDClassifier(loss="log", penalty="l2")score = clf.fit(X_train, y_train).score(X_test, y_test) 是评价损失函数的分数？对于每一个交叉验证分割，我的分数总是0.0。那么，这是否意味着我的<

浏览 5提问于2015-10-20得票数 3

回答已采纳

1回答

在Rapidminer中应用多标签转换？

、、、、

我在快速矿工的文本分类工作，并要求实现一个问题转换方法，以转换多标签数据集为单标签，即标签功率集等，但找不到一个在快速矿工，我确信我错过了什么或可能是快速矿工提供了另一个名称或什么？1)我搜索并找到了Rapidminer的“多项式”运算符，我认为它在内部使用了二进制相关性进行问题转换，但我如何应用其他运算符，即标签幂集或分类器链？2)其次，“二项

浏览 3提问于2014-11-29得票数 0

3回答

具有大量类别的分类

、

假设我有一个包含1000万张图像的训练数据集，其中包含100,000个不同人的图像。我想创建一个ML模型，它可以识别给定图像中的哪个人。考虑到大量的人(类)，最好的方法是什么？

浏览 1提问于2019-12-12得票数 3

1回答

必须使用复杂的还是几个简单的模型？

我不明白模型是如何组织起来的。Category (name, null parent) |Product (name+description)我使用的模型将对产品进行顶级分类，在我使用另一个模型对属于分类的顶级类别的产品进行训练后(这样我就可以对二级类别进行分类)。对于下一步，我将为par

浏览 2提问于2018-07-05得票数 0

2回答

空间TextCat评分在MultiLabel分类中的应用

、、

在spacy的文本分类示例中，有两个标签指定了正和阴性。因此，猫的得分被表示为我正在使用多标签分类，这意味着我有两个以上的标签标记在一个文本中我增加了我的标签 textcat.ad

浏览 5提问于2020-06-12得票数 4

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

多标签多类分类的激活方法及损失函数

如何在Apache Spark中进行多标签分类

文本分类问题:这类分类的名称和方法

谷歌AutoML自然语言多标签文本分类的输入数据集的格式

是否有使用强化学习进行多标签文本分类的例子？

为多标签分类准备训练数据集

如何对多类数据集进行二进制分类？

使用j48树处理分类中的多标签数据集

多标签分类

TPOT是否支持多标签文本分类？

使用AUC指标进行多标签分类的预测

构建一个能够处理它从未见过的类的多类分类器？

用于多标签数据分类的新闻文章及其关联类别的公共数据集

文本分类:多文本分类与多类文本分类

scikit学习:交叉验证分数是否评估日志丢失功能？

在Rapidminer中应用多标签转换？

具有大量类别的分类

必须使用复杂的还是几个简单的模型？

空间TextCat评分在MultiLabel分类中的应用

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐