ValueError:分类指标不能处理多标签指示器和连续多输出目标的混合_分类指标不能处理连续多输出和多标签指标目标的混合_ValueError:分类指标不能处理未知和多类目标的混合 - 腾讯云开发者社区

cross-validation、multiclass-classification

我正在研究由4类组成的多类分类。我正在应用5倍交叉验证，并希望得到的敏感性(回忆)和特异性评分的每一个褶皱。我发现使用cross_validate函数，我可以为每个折叠提供一个评分参数列表。 scoring = {'accuracy' : make_scorer(accuracy), 'precision' : make_scorer(precision_score), 'recall' : make_scorer(recall_score),

浏览 0提问于2019-12-25得票数 2

回答已采纳

1回答

如何对R中的范畴变量和连续变量进行潜剖面分析？

我有4个连续变量(男性，女性，伴侣的男性气质，伴侣的女性气质)和2个分类变量(性别认同，伴侣的性别认同)，我想执行一个LPA。在我的阅读资料中，似乎可以对LPA同时使用分类指标和连续指示器，但我还没有找到实际使用LPA的资源。我尝试使用包tidyLPA，但它不允许我指定哪些变量是绝对的。我是否正确地假设LPA既可用于分类指标，也可用于连续指标？ R中是否有一个可以处理此分析的包？谢谢!

浏览 2提问于2020-06-04得票数 0

1回答

检查模型输出和标签之间的相关性/互信息

machine-learning、deep-learning、statistics

我正在训练一些具有监督学习环境的网络。输入是向量，输出(和标签)是数字。我正在使用MSE损失，损失随着时间的推移而减少(在训练和测试集上)，但我仍然不确定网络实际上是学习从输入预测标签，还是简单地学习输出更接近标签分布的数字。如果我将每个时期的标签向量和输出向量，并检查它们之间的相关性/互信息，它能让我感觉到网络是否真的改进了？我不熟悉这样的工作，做这样的事情是不是很常见？

浏览 22提问于2020-01-05得票数 1

2回答

涉及作为标签的数字范围的多标签分类

machine-learning、scikit-learn、classification、corpus、multilabel-classification

我有一个分类问题，我的标签是评分，0- 100，增量为1(例如1，2，3，4 )。我有一个数据集，其中每一行都有一个名称、文本语料库和一个评级(0-100)。从文本语料库中，我试图提取可以输入到分类器中的特征，分类器将输出相应的每行评分(0-100)。对于特征选择，我正在考虑从基本的文字包开始。然而，我的问题在于分类算法。在sci学习中是否有支持这类问题的分类算法？我当时正在阅读，但是所描述的算法似乎支持完全离散的标签，而我有一组连续的标签。编辑:那我把我的收视率放进去的情况呢？例如，我可以有10个标签，每一个1-10。

浏览 0提问于2014-11-04得票数 0

回答已采纳

1回答

使用一个热编码器时出现的gridsearchCV错误

python、machine-learning、scikit-learn、deep-learning

我在使用网格搜索cv时遇到了这个错误：“分类度量不能处理多标签指示符和多类目标的混合”。我的y_train形状是：(64345，37)，我的X_train形状是：(64345，14)。我不知道我去了哪里，wrong.Any指导/帮助将是非常感谢的。它在不使用固定参数的gridsearchCV的情况下为我的模型正确执行。如果不使用一种热编码，我将从绑定错误中获取索引。该帖子的链接在这里：下面是我如何拆分数据集： from sklearn.preprocessing import LabelEncoder, OneHotEncoder onehotencoder = OneHotEnco

浏览 1提问于2019-10-04得票数 0

回答已采纳

2回答

如何使用标签概率进行文本分类？

machine-learning、classification、mahout、text-mining

我正在尝试解决一个用于学术目的的文本分类问题。我需要将推文分类为“云”、“冷”、“干”、“热”、“湿”、“飓风”、“冰”、“雨”、“雪”、“风暴”、“风”和“其他”等标签。训练数据中的每个推文都有针对所有标签的概率。说这条消息“已经可以告诉你这将是一个艰难的得分的日子。现在和昨天下午一样有风。”有21%的几率是热的，79%的几率是风的。我一直致力于分类问题，它预测它是风还是热或其他。但在这个问题中，每个训练数据都有针对所有标签的概率。我之前使用过mahout naive bayes分类器，它对给定的文本采用特定的标签来构建模型。如何将这些不同标签的输入概率转换为任何分类器的输入？

浏览 3提问于2013-10-07得票数 0

1回答

反转XGBoost中的一个热编码标签？

python、xgboost

我试图打印XGBoost多标签分类器的精度分数。但是，我仍然坚持这个错误： ValueError:分类指标不能处理多标签指示器和二进制目标的混合。我认为y_test在传递给accuracy_score()时不需要一次热编码？但我尝试过的每一件事都会产生更多的错误。你知道我是怎么让这件事起作用的吗？代码： X = X.reshape(X.shape[0], -1) print(X.shape) # Split the dataset x_train, x_test, y_train, y_test = train_tes

浏览 7提问于2020-06-18得票数 1

回答已采纳

5回答

多类多标签分类的精度/召回率

machine-learning、classification、multilabel-classification、precision-recall

我想知道如何计算多类多标签分类的精度和召回率，即有两个以上标签的分类，以及每个实例可以有多个标签的分类？

浏览 1提问于2012-01-25得票数 29

1回答

数据不平衡的多标记图像分类，如何分割？

python、machine-learning、scikit-learn、data-analysis、imbalanced-data

我正在进行多标记图像分类。这是我的数据框架：已更新你可以看到有26个特征标记的图像。"1“表示存在，"0”表示不存在。我的问题是在很多标签上都有不平衡的数据。例如： [1] train_df.value_counts('Eyeglasses') Output: Eyeglasses 0 54735 1 1265 dtype: int64 [2] train_df.value_counts('Double_Chin') Output: Double_Chin 0 55464 1 536 dtype:

浏览 2提问于2020-11-14得票数 1

1回答

ValueError:分类指标不能处理未知和多类目标的混合

classification、knn

我得到这个错误:ValueError:分类指标不能处理未知和多类目标的混合 knn = KNeighborsClassifier() knn.fit(x_train,y_train) pred = knn.predict(x_test) print(accuracy_score(y_test,pred)) print(classification_report((y_test,pred))) print(confusion_matrix(y_test,pred) 我没有弄清楚其中的错误，为什么它会出现？

浏览 21提问于2019-04-17得票数 0

4回答

如何设置ExpandableListView的指示器图标的宽度和高度？

android、expandablelistview

我已经使用选择器为我的ExpandableListView设置了指示器图标，但我的折叠和展开图标的大小被调整为与原始指示器图标的大小相匹配(它比我的图标大)。有人知道如何设置指示器图标的大小(宽度和高度)吗？谢谢!

浏览 0提问于2011-05-19得票数 3

3回答

OneVsRestClassifier和MultiOutputClassifier在scikit学习中有什么区别？

python、scikit-learn、classification、multilabel-classification、multiclass-classification

请有人解释一下(例如，也许)什么是科学知识中的，和之间的区别？我读过文档，我理解我们使用： OneVsRestClassifier -当我们想要进行多类或多标签分类时，它的策略包括拟合每类一个分类器。对于每个分类器，类与所有其他类相匹配。(这很清楚，这意味着多类/多标签分类问题被分解为多个二进制分类问题)。 MultiOutputClassifier -当我们想做多目标分类时(这是什么？)它的策略包括拟合每个目标的一个分类器(目标在那里意味着什么？) 我已经将OneVsRestClassifier用于多标签分类，我可以理解它是如何工作的，但是我找到了MultiOutputCl

浏览 3提问于2017-03-15得票数 36

回答已采纳

1回答

scikit 0.14多标签指标

python、scikit-learn

我刚刚安装了scikit 0.14，这样我就可以探索多标签指标的改进。我使用hamming损失度量和分类报告获得了一些积极的结果，但无法使混淆矩阵工作。同样在分类报告中，我无法传递标签数组并在报告中打印标签。下面是代码。是我做错了什么，还是它还在开发中？ import numpy as np import pandas as pd import random from sklearn import datasets from sklearn.pipeline import Pipeline from sklearn.multiclass import OneVsOneClassifier f

浏览 4提问于2013-07-07得票数 2

1回答

使用线性/增量主题对文本文档进行分类

classification、scikit-learn

我试图使用几个不同的维度对文本文档进行分类。我试图创建任意的主题来分类，比如大小和相关性，它们是线性的或渐进的。例如：尺寸:小，小，中，大，大。相关性:坏的，好的，太棒了我正在用手训练分类器。例如，这个文档代表一个“小”的东西，另一个文档正在讨论一个‘大’的东西。当我尝试多标签或多类支持向量机时，它不能很好地工作，而且逻辑上也不合理。我应该使用哪种模型来帮助我预测这种线性类型的数据？我现在用的是一个单词的tfidf向量来学习。

浏览 0提问于2015-09-17得票数 0

回答已采纳

1回答

序数神经网络多类分类问题的编码

machine-learning、neural-network、classification、multiclass-classification

我希望以一种特定的方式对我的多类分类输出变量进行编码，以考虑到重要性。我想在带有乙状结肠目标的NN中使用这个。我对此有几个问题：我怎么能用这种方式对我的类进行编码？这不会改变问题从多类到多标签分类，对吗？这是我所依据的论文的。下面是一个数字，表示从正常NN到它们的地址的变化：

浏览 2提问于2021-03-02得票数 0

1回答

火花1.5.1:训练许多二进制分类器，保存它们，然后在新的数据上使用它们

classification、multiclass-classification、multilabel-classification

我有一个DataFrame，表示带300个标签的带注释的数据集。 DataFrame看起来如下(第一行只是解释列)： binary Vector column for labeling, feature column [0, 1, 1, 0, 0 , 0.... ], featureVec [0, 0, 1, 0, 1 , 0.... ], featureVec ...... 标签列，将每个标签的存在或不存在表示为特征向量的注释(我们在第二列中可以看到)。如果我错了，请纠正我:我不能训练一个多类分类器，因为标签不是排他性的，所以我想在每个标签上训练一个二进制分类器。因为我有300个标签，所

浏览 0提问于2015-11-04得票数 2

1回答

TensorFlow Keras实现下的“精度”度量

python、tensorflow、machine-learning、deep-learning、tf.keras

在使用TensorFlow Keras构建分类器时，通常通过在编译步骤中指定metrics=['accuracy']来监视模型的准确性： model = tf.keras.Model(...) model.compile(optimizer=..., loss=..., metrics=['accuracy']) 无论模型是否输出逻辑或类概率，以及模型是否期望地面真相标签为一个热编码向量或整数索引(即区间[0, n_classes)中的整数)，这一行为都是正确的。如果要使用交叉熵损失，则不是这样:上述四种情况的每一种组合都需要在编译过程中传递不同的loss值：

浏览 2提问于2019-09-18得票数 3

回答已采纳

2回答

多个模型在评估过程中存在极大的差异。

machine-learning、decision-trees、accuracy、model-evaluations、sgd

我的数据集有大约100 k个条目，6个特征，标签是简单的二进制分类(大约65%的0，35%的0)。当我在不同的模型上训练数据集时:随机森林模型、决策树模型、额外树模型、k近邻模型、logistic回归模型、sgd模型、稠密神经网络模型等。树分类器:准确率和精度约为80%。 K近邻:精度56%，精度36% . 线性svm: 65%的准确度和0的正数猜测 sgd :准确性63%，真阳性2例+假阳性4例我不明白这种差别有什么区别。有人能解释一下为什么会这样吗？我做错什么了吗？也找不到答案我的问题，所以请链接，如果有人已经问了。真的很感激你的帮助！

浏览 0提问于2021-10-07得票数 1

回答已采纳

1回答

多标号分类中Hamming损失的梯度计算

machine-learning、neural-network、gradient-descent、hamming-distance、multilabel-classification

我正在使用一些递归的神经网络结构进行多标签分类。我的问题是关于丢失函数:我的输出将是true/false (1/0)值的向量，以指示每个标签的类。许多资源都说哈明损失是合适的目标。然而，汉明损耗在梯度计算中存在一个问题：H =平均值(y_true XOR y_pred)，XOR不能求出损耗的梯度。那么，还有其他损失函数来训练多标签分类吗？我试过用MSE和二进制交叉熵来输入乙状结肠。

浏览 1提问于2017-02-08得票数 5

回答已采纳

2回答

ValueError:分类指标不能处理多类和多标签指标的混合。

python、machine-learning、lstm、data-science、text-classification

我有2000种不同标签的多类标签文本分类问题。使用带有手套嵌入的LSTM进行分类。目标变量的标签编码器嵌入层LSTM层误差度量是F2分数 LabelEncoded目标变量： le = LabelEncoder() le.fit(y) train_y = le.transform(y_train) test_y = le.transform(y_test) LSTM网络与下面的手套嵌入类似 np.random.seed(seed) K.clear_session() model = Sequential() model.add(Embedding(max_featu

浏览 0提问于2019-06-07得票数 1

2回答

SVR sklearn python，Y的混合类型错误

svm、python、scikit-learn

我是ML及其概念的新手，我正在尝试使用sklearn实现SVR来解决房价问题。当我拟合模型时，我收到了这个错误 'type 'exceptions.ValueError'>, ValueError("Mix type of y not allowed, got types set(['continuous', 'multiclass'])",), <traceback object at 0x000000001493E388>v' 这是我的简单尝试： import numpy as np impo

浏览 0提问于2015-11-06得票数 0

1回答

TensorFlow多标签精度度量

tensorflow、keras

我目前正在使用TensorFlow来解决多标签分类问题(总共有9个标签)，这是模型编译行： model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy']) my模型的y_true标号由2的1's和7的0's (例如0，1，0，0，0，1 0，0，0，0)组成。我用TensorFlow尝试了几种模型，但是不管模型有多复杂，精度都很低，精度在0.3左右。我想知道Keras的准确性指标是否也适用于多标签分类。例如，如果y_pred的概

浏览 4提问于2021-11-05得票数 2

回答已采纳

1回答

多标签分类中每个样本的回忆得分

classification、multilabel-classification、metric

在一个多标签分类问题中，计算每个样本的召回是否有意义？假设我有3个数据样本，每个样本都有自己的真实标签集和预测的标签集。 📷 我想看到真正的标签集和预测的标签集之间的匹配。在每个预测中，我都不关心真实的负数或假阳性，所以这意味着对我的回忆得分。在编程上，我将在y_predicted和y_true之间执行一个AND操作，以获得真正数并除以每个样例的真标签<#>for的总数。(换句话说，真正数/(真positives+false负数)) 我的问题是- 计算每个样品的召回量(不是每个标签)，通常都是这样吗？我的思维过程正确吗？我看过一些文章，其中一次召回是为y_true和y_pred

浏览 0提问于2020-02-22得票数 0

回答已采纳

1回答

显示相应标签的列表，以便以聚合方式悬停

r、ggplot2、plotly、r-plotly、ggplotly

我想要在交互式框图中显示来自数据框的信息。对应的代码为： p=ggplot(data = data, aes(x = GeoAreaName, fill= cat, text= Indicator)) + geom_bar() ggplotly(p) "cat“是描述数据质量的分类变量，"GeoAreaName”是国家名称，"Indicator“是"cat”描述的数据集名称。我得到的结果几乎就是我想要的： ? 但是，我想让指示器的标签只在我悬停在其上方时显示，即与类别"cat“相对应的名称列表应该出现，而不是条形图中每个单独

浏览 13提问于2021-07-13得票数 0

回答已采纳

1回答

无法处理多类和连续的混合

machine-learning、scikit-learn、classification

输出分为四类: 0,1,2,3预测在中是连续数我尝试了sklearn中的混淆矩阵f1_score，但两种情况下都有错误： ValueError: Can't handle mix of multiclass and continuous 如果我将其简化为二进制分类器，并使用AUC对其进行评估，则没有错误，这意味着AUC可以处理连续输入。我的问题是在sklearn中哪里可以找到评估，这样不仅可以处理多类，还可以处理连续的输入。

浏览 0提问于2017-01-22得票数 1

回答已采纳

1回答

sklearn.neural_networks.MLPRegressor -无法计算精度分数

python、scikit-learn、mlp

这是我在StackOverflow上的第一篇文章！我正在使用MLPRegressor为我的问题生成一个二进制类多输出预测。一旦得到了我的预测，我就使用numpy.round()对所有的值进行舍入，这样我就可以使用accuracy_score(因为准确性评分只适用于分类问题)。在此之后，当我得到以下错误时，我尝试使用sklearn.metrics.accuracy_score： ValueError: Classification metrics can't handle a mix of multilabel-indicator and multiclass-multioutput t

浏览 4提问于2020-10-07得票数 0

回答已采纳

1回答

不同多类分类器的python - Plot精度召回率曲线

python、pandas、matplotlib

我已经预测了验证数据的输出，它是单标签多类分类器。我已经运行了多个分类器。我想在一个单独的图中画出它们每一个的PR曲线。我不能那样做。有什么建议吗？ For a single classifier, the dataframe with results look like this : label predictedAns predictedProb 1 2 0.999281 2 2 0.999754 2 2 0.999754 3 3

浏览 0提问于2019-08-05得票数 2

2回答

多标签分类Keras指标

machine-learning、keras、classification、multilabel-classification

在Keras中，哪个指标更适合多标签分类：accuracy还是categorical_accuracy？显然，在这种情况下，最后一个激活函数是sigmoid，as损失函数是binary_crossentropy。

浏览 75提问于2018-12-21得票数 5

回答已采纳

2回答

用于多类分类的校准预测

calibration

我们如何对多类分类进行校准预测？我尝试遵循，但这不适用于多类问题，因为当我使用sklearn.calibration.calibration_curve时，我得到以下错误： ValueError:仅支持二进制分类。提供了标签'x‘'y’'z‘'a’'b‘。

浏览 5提问于2019-11-15得票数 0

1回答

多输出模型的编译选项:多重损失和损失加权

python、keras、deep-learning

正如Keras手册-Deep中所描述的，对于多输出模型，我们需要为不同的网络负责人指定不同的损失函数。但是，由于梯度下降要求最小化标量，所以必须将这些损失合并为单个值，以便训练模型。非常不平衡的损失贡献将导致模型表示优先为最大的个人损失的任务优化，而牺牲其他任务。为了弥补这一点，您可以在损失值对最终损失的贡献中，对损失值指定不同的重要级别。如果损失的数值使用不同的尺度，这是非常有用的。有谁能在以下方面提供帮助：我有一个具有以下输出的五输出模型：情感(多类、多标签分类) 价(回归) 觉醒(回归) 优势(回归) 年龄(多等级分类) 我使用的方法如下： losse

浏览 2提问于2018-05-28得票数 3

2回答

多标签和多类数据标签的评估

python、scikit-learn、kaggle

是否有可用于多类多标签分类的评估指标？例如，我参加了kaggle的以下比赛，它需要ROC AUC作为评估指标。：使用sklearn可以做到这一点吗？

浏览 3提问于2013-08-07得票数 0

1回答

只使用范畴变量的SMOTE-NC

python-3.x、machine-learning、imbalanced-data、imblearn、smote

我正在处理一个只包含绝对特性的数据文件。为了重现我所面临的问题，我将举下面的例子： d = {'col1':['a','b','c','a','c','c','c','c','c','c'], 'col2':['a1','b1','c1','a1','c1','c1','c1',

浏览 2提问于2020-11-18得票数 1

回答已采纳

1回答

多类多目标分类问题的最佳损失函数

pytorch、classification、multilabel-classification、multiclass-classification

我有一个分类问题，我不知道如何分类这个分类问题。根据我的理解，多类分类问题是指有多个互斥类，数据集中的每个数据点只能由一个类标记。例如，在水果图像分类任务中，标记为苹果的水果数据点不能是橘子，橘子不能是香蕉等等。在这种情况下，每个数据点只能是水果类的任何一个结果，因此会相应地进行标记。就像..。多标签分类是一个问题，在这个问题中，有多组相互排斥的类，其中数据点可以同时标记。例如，在汽车图像分类任务中，标记为轿车的汽车数据点不能是掀背车，掀背车不能是SUV等等。同时，同一辆车的数据点可以标为大众、福特、梅赛德斯等汽车制造商。因此，在这种情况下，car数据点由两组不同的互斥类标记。

浏览 4提问于2020-11-01得票数 3

回答已采纳

2回答

宏与微VS加权VS样本F1评分

python、python-3.x、machine-learning、scikit-learn、metrics

在sklearn.metrics.f1_score中，f1分数有一个名为“平均”的参数。宏观、微观、加权和样本意味着什么？请详细说明，因为在文件中没有适当解释。或者简单地回答如下：为什么“样本”是多标签分类的最佳参数？为什么微观对于不平衡的数据集是最好的？加权和宏观有什么区别？

浏览 0提问于2019-04-18得票数 33

回答已采纳

1回答

我可以通过对类进行编码来将分类问题转换为回归问题吗？

machine-learning、regression、classification

如果所有分类标签都可以用数值表示，这是否意味着我可以通过将分类标签编码为数字来在任何分类任务中使用回归模型？我最近正在研究一个二进制分类问题，它有两种输出类型：'0‘代表正面，'1’代表负面。我使用随机森林分类器来解决这个问题，但我看到其他人使用随机森林回归来解决同样的问题。经过思考，这对我来说是有意义的--最终的期望输出是连续值，我可以训练一个回归模型来获得表示输出类别的预测连续值。这让我思考是否可以在其他分类任务中使用回归模型。例如：为了对“猫”和“狗”这两个图像进行分类，我使用LabelEncoder将其编码为0和1，然后它就变成了一个回归问题。希望我的问题清楚了

浏览 23提问于2019-07-30得票数 0

回答已采纳

2回答

如何管理多个数据集-机器学习Azure

azure-machine-learning-studio、data-transform

是否存在接受多个数据集进行处理的模块？例如，“拆分数据”、“编辑元数据”和“选择数据集中的列”不接受多个数据集作为输入。这就是我所做的:在我的模型中有几个数字和分类变量。我使用“转换为指示器变量”模块为我的数据创建虚拟变量。如何将指标变量和数值变量包含到一个数据集中，以便拆分模型的数据？到目前为止，我正在使用Python进行数据处理，并在Azure MLS中移动数据集以进行建模。理想情况下，我需要在Azure MLS中处理数据争论。我希望有一个模块来整合Azure MLS中的分类绑定变量和数值变量

浏览 28提问于2019-04-11得票数 0

2回答

朴素贝叶斯多类预测的评价结果

matlab、machine-learning、artificial-intelligence

我在MATLAB中使用了朴素贝叶斯(内置)来预测我的数据的类别标签值。我的类标签可以是{1,2,3,4,5}中的任何值。我也有testLabels。如何衡量testLabels和predictedLabels的差异是否好？我试着使用RMSE。但看起来它给了我1.87124的价值我DOnt知道如何解释这个RMSE值吗？此外，对于朴素贝叶斯多类结果的评估，是否有标准的评估方法？我知道对于二进制标签分类，我可以使用TPR，FPR，Precision，Accuracy等。

浏览 2提问于2012-12-05得票数 2

1回答

如何使用sklearn.metrics计算多标签分类任务的微观/宏观度量？

python、scikit-learn、precision-recall

我有一个多标签分类器产生的结果，我想要计算微观和宏观精度，回忆和F1分数使用sklearn.metrics在python，但不太清楚如何。我有两个二进制稀疏矩阵，dataOUT和dataGT，它们分别代表同一数据集的分类结果和基本真理。这两个矩阵都是nLabels X nSamples大小的。每个样本都可以用一个或多个标签标记，所以如果分类器用dataOUT[i,j]标记jth样本，则为0，则为0。对于任何给定的类i，我可以通过从dataOUT中提取i第四行来轻松地计算规则精度、召回和F-得分，而dataGT可以将这些数据提供给sklearn.metrics.precision_recal

浏览 3提问于2015-11-02得票数 2

回答已采纳

1回答

Keras将类别预测与标签合并

python、tensorflow、keras

在训练我的网络时，我遇到了一个多标签分类问题，在这个问题中，我将类标签转换为一个热编码。在训练模型并生成预测- keras之后，只需输出值的数组，而不指定类标签。合并这些内容的最佳实践是什么，这样我的API才能向用户返回有意义的结果？示例 y = pd.get_dummies(df_merged.eventId) y 2CBC9h3uple1SXxEVy8W GiiFxmfrUwBNMGgFuoHo e06onPbpyCucAGXw01mM 12 1 0 0 13 1

浏览 27提问于2019-06-24得票数 1

1回答

如何使用“使用中的指示符”

usb、hid

我正在尝试RTFM的和第14节(电话设备页)的第二段有这样的说法：手机上的指示器是通过用LED:和LED:包装来处理的。例如，消息指示器LED将由电话:消息使用声明为功能或输出在LED:使用指示符集合中识别。我认为这意味着有一些方法可以获得输出报告中的电话状态(在他们的示例中是“消息指示符”)，但是我不知道如何在HID报告描述符中实现这一点。有人能提供一个HID报表描述符的示例部分来使用所描述的使用指示符吗？

浏览 2提问于2021-08-11得票数 0

1回答

Python scikit学习多类多标签性能指标？

python、machine-learning、scikit-learn、precision、multilabel-classification

我为我的多类多标签输出变量运行了随机森林分类器。我得到了低于输出。 My y_test values Degree Nature 762721 1 7 548912 0 6 727126 1 12 14880 1 12 189505 1 12 657486 1 12 461004 1 0 31548 0 6 296674

浏览 17提问于2016-08-01得票数 8

1回答

将多标号问题转化为多类问题

multiclass-classification、multilabel-classification

用单个分类器将多标签问题建模为多类问题的缺点是什么？让我澄清我的意思。至少有两种方法可以将一个多标签问题转化为一个单分类器的多类问题(假设我们的问题上有N个标签)： 1) 为标签的powerset的每个元素创建一个类。因此，每个标签组合的每个元素。在这种情况下，输出向量将具有2^N长度。 2) 有一个N长度的输出向量(向量的每个元素都是一个标签)，但是这个问题将被视为一个分类器的多类问题。在本例中，假设输出概率大于0.2的类将被视为此实例/观察的类/标签。显然，所有类的输出概率之和应为1。在每一种情况下，将多标签问题转化为多类问题意味着什么？

浏览 0提问于2019-07-22得票数 3

2回答

交叉验证如何用于回归？

machine-learning、python、scikit-learn

对于回归型问题，我们知道结果是一个连续的值，那么如何交叉验证呢？在分类类型问题中，我们知道类标签很容易比较，但是在回归类型问题中如何比较呢？

浏览 0提问于2018-02-21得票数 1

回答已采纳

1回答

基于两个特征和事件时间序列的客户分类

classification、clustering、time-series

我需要帮助，在我正在设计的算法中，下一步应该是什么。由于NDA，我不能透露太多，但我会尝试成为通用和可理解的。基本上，在算法中的几个步骤之后，我有以下内容：对于我拥有的每个客户，以及他们在一个月内所做的事件，在第一步中，我已经将事件聚为几个类别(每个客户将事件分成从1到x为1到25之间的类别，通常第一类事件的密度比其他类别要高)。对于每个类别和客户，我创建了一个时间序列，聚合每个小时的每月事件(获取这些事件何时完成的模式)。另外，我使用了几个规范化变量，这些变量基于一个月(30天)执行至少一个事件的天数，以及包含至少一个事件的总天数(聚合所有集群)。第一个给出了客户在这个月中的活跃程度

浏览 0提问于2016-01-07得票数 13

1回答

我如何使用一个热编码标签与一些滑雪分类器？

machine-learning、scikit-learn

我有一个有10个类的多类分类任务。因此，我使用sklearn的将单列标签转换为10列标签。我在试着适应训练数据。虽然我能够在中做到这一点，但在与进行匹配时，我得到了以下错误消息 ValueError: bad input shape (1203L, 10L) 我知道在这两个分类器中，y的允许形状是不同的： GaussianNB： y : array-like, shape (n_samples,) RandomForest： y : array-like, shape = [n_samples] or [n_samples, n_outputs] 问题是，这是为什么？这难道不是与相矛盾吗？有办

浏览 3提问于2016-11-13得票数 3

回答已采纳

3回答

机器学习文本分类，其中一个文本属于1到N类

machine-learning、statistics、text-classification、naivebayes

因此，我试图(只是为了好玩)根据电影的描述对电影进行分类，其想法是“标记”电影，因此给定的电影可能同时是“动作”和“幽默”。通常，当使用文本分类器时，您得到的是给定文本所属的类，但在我的示例中，我希望将文本分配给1到N标记。目前，我的训练集应该是这样的 +--------------------------+---------+ | TEXT | TAG | +--------------------------+---------+ | Some text from a movie | action | +--------------

浏览 5提问于2016-04-13得票数 0

回答已采纳

2回答

如何实现精确匹配/子集精度作为Keras的度量标准？

python、tensorflow、machine-learning、keras、deep-learning

我正在尝试使用精确匹配/子集精度作为我的Keras模型的度量标准。我基本上理解它是如何工作的，但我在张量操作上遇到了困难。我正在做一个多标签分类任务，有55个可能的标签。我认为输出大于0.5就是对该标签的肯定。我想要一个度量标准，描述输出与真实标签精确匹配的频率。我的方法是将y_true转换为tf.bool，将y_pred > 0.5转换为tf.bool，如果它们完全匹配，则返回包含True的张量，否则返回False。当我进行基本测试时，它似乎可以工作，但当我训练模型时，它停留在0.0000中，没有任何变化。 def subset_accuracy(y_true, y_pred):

浏览 26提问于2019-06-24得票数 0

回答已采纳

2回答

如何在Apache Spark中进行多标签分类

apache-spark、mahout

我想在大数据集上进行多标签文本分类，似乎Apache Mahout或Spark MLLib等大数据机器学习工具目前还不支持这一点。我想知道以前有没有人做过大数据集的多标签分类？在不久的将来，是否有计划在Mahout或Spark中集成多标签分类？

浏览 13提问于2015-06-26得票数 5

2回答

ValueError:应用随机森林时未知的标签类型：'continuous‘

python、pandas、dataframe、scikit-learn

我有一个数据集df_train和它的一些标签df_train_labels。 print(df_train.shape) print(df_train_labels.shape) 输出： (1460, 6) (1460,) 和 print(df_train[0:4]) print(df_train_labels[0:4]) 输出 OverallQual GrLivArea GarageCars TotalBsmtSF FullBath YearBuilt 0 1 0.000000 1 1 1

浏览 7提问于2017-12-22得票数 0

2回答

空间TextCat评分在MultiLabel分类中的应用

spacy、text-classification、multilabel-classification

在spacy的文本分类示例中，有两个标签指定了正和阴性。因此，猫的得分被表示为 cats = [{"POSITIVE": bool(y), "NEGATIVE": not bool(y)} for y in labels] 我正在使用多标签分类，这意味着我有两个以上的标签标记在一个文本中。我增加了我的标签 textcat.add_label("CONSTRUCTION") 为了指定我用过的猫分数 cats = [{"POSITIVE": bool(y), "NEGATIVE": not bool(y)} for y

浏览 5提问于2020-06-12得票数 4