MultiLabelBinarizer不适用于包含多个数组的列

腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

1回答

、

我有一个包含15000个数组的列。请在15000条记录中找到2条样本。我想为under Genres_relevant中的值创建虚拟对象。user Genres_relevant 2 [3.0,2.0,1.0] 代码： from sklearn.preprocessing import MultiLabelBinarizerdf=pd.DataFrame(users_list['Genres_relevant'])

浏览 16提问于2019-04-24得票数 1

1回答

随机森林编码标签

、、、

我有以下数据集：我想使用属性标记和作者将每个记录分类为他们各自的评级。为了做到这一点，我想使用随机森林分类器。我关心的是如何处理标记属性。每个条目都有一个由逗号分隔的标签数目未定。总共有4412个唯一的标签，而带有更多标签的条目包含20个标签。第一个条目有标记“罗德岛”、“经济”、“税收”、“林肯查菲”。

浏览 0提问于2020-11-16得票数 1

回答已采纳

1回答

将CSV读入Pandas后MultiLabelBinarizer()的格式化问题

、、、、

我想使用MultiLabelBinarizer()准备一个列，其中包含应用于文本的标签。例如，根据title预测一部电影可能属于哪种类型。例如，如果我创建一个具有相同结构的简单CSV： ? 并将其读入Pandas +使用MultiLabelBinarizer()： df = pd.read_csv(filepath) print(mlb.fit_transform(df["Tag

浏览 47提问于2019-09-19得票数 2

回答已采纳

2回答

文本数据的多标签外核学习:部分拟合的ValueError

、、、

我试图建立一个多标签的核心文本分类器。正如所描述的，其思想是读取(大规模的)文本数据集，并将其部分地与分类器相匹配。此外，当您有描述的多标签实例时，想法是以一种单一的方式，将许多二进制分类器构建为数据集中的类数。当将MultiLabelBinarizer和OneVsRestClassifier类与部分拟合结合起来时，我得到以下错误： ValueError:包含多个元素的数组的真值

浏览 13提问于2017-02-16得票数 5

回答已采纳

2回答

将数组存储为Pandas列中的值

、、、、

我有一个有两列分类标签数据(NBA球队名称)的数据集。我想要做的是使用一个热编码来生成一个二进制的一维向量作为一个数组来代表每个团队。这是我的代码：one_hot_encoder = MultiLabelBinarizer()table["Teams"] = one_hot_encoder.fit_transform(tab

浏览 0提问于2018-07-13得票数 1

回答已采纳

1回答

将MultiLabelBinarizer封装到scikit学习管道中，以便对新数据进行推断。

、、、、

我正在构建一个基于文本字段的多标签分类器来预测标签。例如，根据电影标题预测类型。我想使用MultiLabelBinarizer()对包含所有适用的体裁标签的列进行二进制化。例如，['action','comedy','drama']被分成三列，值为0/1。我使用MultiLabelBinarizer()的原因是为了能够使用内置的inverse_tr

浏览 4提问于2019-09-13得票数 3

1回答

如何获得字符串数组数据的计数矢量化

、

words_separated1 [dolor, sit, amet]因此，每一行都包含一个单词数组1, 1, 1因此，df2将为df1中出现的每一个惟一的单词设置一列。df2的行将对应于df1中的行，并记录单词在相应的df1行中出现的次

浏览 3提问于2022-06-30得票数 0

1回答

学习字符串列表的f1_score

、、、

是否有任何方法可以将标签列表的f1_score计算为字符串，而不管它们的顺序如何？我知道我可以将标签向量化，但在我的例子中，这个语法要容易得多，因为我正在处理许多标签。

浏览 7提问于2017-04-04得票数 1

回答已采纳

1回答

为什么多标签模型的预测为空？

、、、、

我正在尝试做多标签分类；数据集主要是标题列包含帖子的标题，标签列包含标签。一篇文章的标签数量是不固定的。数据集如下所示： ? X_train)X_val=tfidf.transform(X_val) from sklearn.preprocessing import MultiLabelBinarizermlb = MultiLabelBinarizer(class

浏览 44提问于2020-04-10得票数 1

1回答

我可以对numpy结构化数组中的多个字段进行排序吗？

、、、

我已经将来自SQL (MySQLdb)查询的结果加载到numpy结构化数组中。现在我想以各种方式对数组进行排序。字段是字符串、ints、floats和python对象的混合包(对于随NULLS返回的列)。我看过，但正如askewchan在回答的底部提到的，它不适用于字符串，也不适用于python对象(例如，in，而是来自带有NULLS的列)。是否

浏览 6提问于2013-08-17得票数 0

回答已采纳

1回答

LSTM多功能、多类、多输出

、、、、

我正在尝试使用LSTM分类器来生成基于midi的音乐。labels = [[x,y] for x in all_pitches for y in all_durations] mlb_value = mlb.fit_t

浏览 0提问于2018-07-15得票数 0

回答已采纳

1回答

Dask one-hot-编码，不知道类别

、、

from sklearn.preprocessing import MultiLabelBinarizermlb = MultiLabelBinarizer() df_tmp = pd.DataFrame(mlb.fit_transform(df['CatData']), columns=mlb.classes_, index=df.index) 其中，我的CatData列包含类别列表。为了处理更大的数据集，我尝试使用dask。大多数pandas功能都有一

浏览 8提问于2019-09-20得票数 1

1回答

如何使用PipeLine转换FeatureUnion中的多个特性？

、、、、

我有一个熊猫数据框架，包含有关用户发送信息的信息。对于我的模型，我感兴趣的是预测一个消息的丢失收件人，我给收件人A，B，C的消息，我想预测谁应该是收件人的一部分。对于功能，我想使用邮件的收件人。主体和身体。由于收件人是用户列表，所以我希望使用MultiLabelBinarizer转换该列。对于主体和身体，我想使用TFIDF。我的输入泡菜文件的数据如下所示:除了接收者之外，所有值都

浏览 1提问于2017-11-30得票数 4

回答已采纳

4回答

以编程方式将Excel文档中的数字左对齐

、、

如何在VB中以编程方式使Excel中的列保持对齐？我有一个VB程序，是写一个excel文件的基础上的某些信息。我尝试过使用：这适用于包含文本的列。我有多个严格意义上的数字列。此函数不适用于包含数值单元格的列。下面是我不断得到<

浏览 0提问于2011-09-28得票数 0

回答已采纳

1回答

sklearn ()的问题

、

从我的dataframe x_train开始，我想对专栏“类型”进行热读。有超过1000个独特的不同类型，但是当我使用函数multilabelbinarizer时，它只报告31列，并且查看类--它们并不真正有意义，查看它建议不要使用list而是使用数组的帮助页，就像我在示例中所做的那样gen = np.array(x_train['genres'])(1388,) from sklearn.prepro

浏览 2提问于2020-09-23得票数 1

回答已采纳

1回答

如何在Matlab中基于正则表达式的变量表头索引表？

、

我正在尝试读取CSV文件，该文件在多个列中包含不适用于我正在尝试运行的程序的数据。我只想从表中读取包含'CX‘的列。有没有办法在表中做到这一点？实际上，我正在尝试使用正则表达式对表进行索引。

浏览 15提问于2019-09-10得票数 0

1回答

在ColumnTransformer变换过程中将行合并在scikit中

、

drop') column_trans.get_feature_names()将输出的我试图得到的是一种编码，在这种编码中，给定type的所有行都被组合在一起。其中，给定type的所有type都被打开，但每个feat只有一行。ColumnTransformer是正确的方法吗？我只能用OneHotEncoder做吗？我不关心左边的身份矩阵。真的我想要的</

浏览 0提问于2021-09-15得票数 1

回答已采纳

1回答

热编码:缺少列

、、

我有1000000份记录和100份测试记录的训练集。P06]0000005 [P06, P09]# Create a matrix for the transactions from sklearn.preprocessing import MultiLa

浏览 4提问于2017-07-30得票数 1

回答已采纳

1回答

在不起作用的数组中使用查询、索引和拆分

我有一个表，它有一个列(D)，其中的值由"-“分隔，我试图拆分值并得到后半部分，并在查询中使用它来查找和获取另一个值。|XYZ0001.jpg | | test.com |当它在牢房里被自己使用的时候A:F,"Select E where C contains '"& index(SPLIT(D2,"-"),0,2) &"&#

浏览 1提问于2018-08-30得票数 1

2回答

如何从包含CLOB类型的列的表中删除重复项？

、、

我有一个表，其中有一个或多个CLOB类型的列。此表包含重复行。像distinct和group by这样的正常机制不适用于DB2中的CLOB。如何删除这些表上的重复项？

浏览 3提问于2015-08-28得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云