腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
Keras.to_Categorical在dataFrame中一次
对
多
列
进行
热
编码
?
、
、
、
、
我想
使用
Keras to_categorical一次
对
我的
数据
框
中的多
列
进行
单
热
编码
。该怎么做呢?Item_Fat_Content', 'Outlet_Location_Type', 'Outlet_Type', 'Outlet_Size', 'Item_Type_Combined', 'Outlet'] 这些是我需要
进行
一次
浏览 19
提问于2019-05-06
得票数 4
回答已采纳
3
回答
字符串
分类特征的一种
热
编码
、
、
、
我正在尝试
对
一个普通
数据
集执行一个
热
编码
。data = [['a', 'dog', 'red']
使用
Scikit-Learn
对
这些
数据
进行
预处理的最佳方法是什么?但是一个
热
编码
器不支持
字符串
作为特性,它只对整数
浏览 8
提问于2016-01-30
得票数 37
2
回答
一种
热
编码
分类特征-只限于稀疏形式
、
、
、
分类特性有两种类型:数字和
字符串
。 由于dataframe是巨大的,具有很高的基数,所以我只想将它转换为稀疏的形式。我更喜欢
使用
from sklearn.preproc
浏览 0
提问于2017-03-28
得票数 4
回答已采纳
5
回答
如何
在一次
热
编码
后给出列名?
、
、
、
为了解释,在我的
数据
集中有10
多个
分类
列
,每个分类
列
都有200-300个类别。我想把它们转换成二进制值。为此,我
使用
第一个标签
编码
器将
字符串
类别转换为数字。标签
编码
器代码和输出如下所示。 在标签
编码
器之后,我
使用
了一个来自scikit的
热
编码
器-重新学习,它是工作的。但问题是,我需要一个
热
编码
器后的列名。例如,A
列
在<e
浏览 2
提问于2019-05-28
得票数 29
回答已采纳
1
回答
如何
使用
多个
字符串
对
数据
框
列
进行
热
编码
?
、
、
、
这是包含一些观察结果的
数据
框架 ? 如果您注意到Cuisines列有许多
字符串
。
使用
了代码 pd.get_dummies(data.Cuisines.str.split(',',expand=True),prefix='c') 这帮助我拆分
字符串
和
热
编码
,然而,有一个新的问题需要处理已合并
数据
帧和虚拟对象。快餐出现在第一行和第三行。预期输出是第一行和第三行的值为1的单个快餐
列
,但是,创建了两个快餐
浏览 11
提问于2019-12-03
得票数 0
2
回答
如何
在一次
热
编码
后给出列名?
、
、
为了解释,在我的
数据
集中有10
多个
分类
列
,每个分类
列
都有200-300个类别。我想把它们转换成二进制值。为此,我
使用
第一个标签
编码
器将
字符串
类别转换为数字。标签
编码
器代码和输出如下所示。 在标签
编码
器之后,我
使用
了一个来自scikit的
热
编码
器-重新学习,它是工作的。但问题是,我需要列名后一个
热
编码
器。,例如,
列
A与分类
浏览 4
提问于2017-07-13
得票数 6
1
回答
如何
对
包含几个单词的
字符串
的
列
进行
单
热
编码
以
进行
分类?
、
、
我正在
使用
Python解决一个分类问题。我想
对
当前结果为
字符串
的
列
进行
一次
热
编码
。下面是我正在寻找的一个例子。如果该
列
中的一行包含包含"bleu奶酪“的
字符串
,我希望将其
编码
为0。对于所有其他结果,我希望将其
编码
为1。我不想要
多个
列
。我只想保留一个专栏。
浏览 31
提问于2021-07-02
得票数 0
2
回答
如何
在Pandas DataFrame的多
列
中
进行
一次
热
编码
,以便以后与Scikit一起
使用
-学习
、
、
假设我有以下
数据
data = { 'Brand': ['Volkswagen', '品牌”和“城镇”两栏做一次
热
编码
,以训练一个分类器(比如与Scikit学习)并预测年份。一旦对分类器
进行
了训练,我将希望
对
新输入的
数据
进行
预测(而不是在培训中
使用
),在那里我需要重新应
浏览 4
提问于2017-10-10
得票数 3
1
回答
sci-kit库中某些整数的one-hot
编码
、
、
我正在尝试
使用
以下代码
对
第一
列
进行
一次性
编码
:enc = OneHotEncoder(categories= 'auto',sparse = False)但我得到了错误,这表明我必须重塑我的
数据
。
如何
对
第一
列
进
浏览 0
提问于2020-03-18
得票数 1
1
回答
处理包含
多个
非序数分类功能的Pandas
数据
帧
、
、
、
我目前正试图分析一个包含
多个
非序数分类特征和一个二进制目标变量的
数据
集。| cat 50 | cat 450 | 1 |整个表是400.000行x15
列
,其中最后一
列
是目标变量。每个特性都有
多个
非序数类别,从9个类别到数百个类别不等。 我的第一反应是
对
所有的分类变量
进行
一次
热
编码
。然而,我害怕这样做会使任何模型都会变得过于
浏览 0
提问于2020-06-03
得票数 1
回答已采纳
1
回答
任意类型
数据
集的
热
编码
、
、
如何
为未知
数据
集
进行
一次
热
编码
,该
数据
集可以迭代和检查
数据
集的类型,并通过检查
列
的唯一值来执行一次
热
编码
,以及
如何
用原始
数据
集跟踪新的
热
编码
数据
?
浏览 0
提问于2020-07-10
得票数 5
回答已采纳
2
回答
利用Pandas DataFrame
进行
不平衡学习
、
、
、
、
我的
数据
集非常不平衡。两个少数类各包含多数类中的一半样本。我的RNN模型无法了解人口最少的类。如果train.drop(['label]只包含
使用
的特性的值问题是,我的DataFrame包含一个额外的
列
,其中包含
字符串
作为值:我不能删除它,因为这些
浏览 0
提问于2019-09-02
得票数 4
回答已采纳
1
回答
Python Scikit学习OneHotEncoder仅对选择值
进行
编码
、
、
我是否可以
使用
OneHotEncoder
对
类别
列
中的select值
进行
一次
热
编码
,而不是构建密集的ndarray,然后删除不必要的
列
?例如,如果名为color的分类列有三种颜色,分别表示红色、绿色和蓝色,而我只想
对
其中的两个值
进行
热
编码
,表示为“红色”和“绿色”,我该
如何
使用
OneHotEncoder
进行
编码
呢?我是ML的新手,
浏览 29
提问于2020-09-04
得票数 1
回答已采纳
1
回答
如何
使用
H2OGeneralizedLowRankEstimator ( GLRM)转换新
数据
?
我以前经常转换训练集的
数据
。我当时的想法是根据新的特征(原型)构建一个分类器。不清楚的是(在查看了文档和示例之后),
如何
将经过训练的GLRM模型应用于新的
数据
,以获得新的
数据
框架以传递给经过原型
数据
训练的分类器模型。试图以一种明显的方式
使用
GLRM预测似乎不起作用。基于线性代数方程(其中A是原始
数据
,X是新原型的矩阵,Y是变换矩阵):所以对不起,我没有足够的点数添加GLRM作为标记 glrm = h2o.estimators.glrm.H
浏览 3
提问于2017-07-19
得票数 0
回答已采纳
1
回答
如何
对
不同属性有
多个
相同值的
数据
进行
一次
热
编码
?
、
、
我有包含求职求职者的
数据
。我得到的原始
数据
是一团糟,但我设法增强了它。现在,我面临着一个我无法解决的问题。 我设法
对
它
进行
编码
,以获得比我需要的更多的属性,这导致了一个不准确的模型。
浏览 1
提问于2019-05-09
得票数 1
3
回答
用于机器学习的
数据
编码
、
、
、
、
I有一个交通
数据
集,其中包含6个分类变量(即发送者、收件人、卡车司机名称、发件人、目的地城市、车辆类型)和一个连续变量(即权重).i想要预测销售(这是连续变量)。我在
数据
集中有13000条记录。我已经尝试了一种
热
编码
,但每个变量中有300
多个
类别,这意味着(300*6 = 1800个变量).so
如何
对
列
进行
编码
,或者是否有其他解决方案? 您可以在这里看到示例
数据
集:
浏览 2
提问于2019-10-17
得票数 0
1
回答
一个
热
编码
标签返回到DataFrame
、
、
、
我想对
数据
帧应用一些分类器,因此必须
对
df
进行
一次
热
编码
。我现在有标签了,但不知道
如何
继续?
如何
将标签恢复为df类型,以及
如何
使用
新的df?oneho
浏览 10
提问于2019-07-09
得票数 0
4
回答
将单
热
编码
的
数据
帧
列
转换为一
列
、
、
、
在pandas
数据
帧中,一
热
编码
向量以
列
的形式出现,即:1 0 0 1 0 03 0 0 0 1 04 0 0 0 0 1Row
浏览 3
提问于2020-08-01
得票数 8
3
回答
是否需要对此
数据
集
进行
热
编码
?
、
、
、
、
下面是来自UCI
数据
存储库的
数据
集。我想要建立一个回归模型,将血小板计数作为因变量(Y),其余作为特性/输入。我的问题是: 在建立回归模型之前,应该
对
这些变量
进行
“一次
热
编码
”吗?,我还观察到值在不同的范围内,所以在应用回归模型之前,我是否应该缩放
数据
集?。
浏览 4
提问于2020-07-06
得票数 1
1
回答
如何
“一个
热
编码
”一个Tensorflow
数据
集?
、
、
我按以下方式加载了TF
数据
集:dataset.map(extract_fn) 为此创建一个单一<
浏览 0
提问于2018-11-30
得票数 8
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券