腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如
何在
python
中
以基于行
的
方式
对
列表值
进行
热
编码
?
、
首先,我
的
数据
是这样
的
。 Data1) A栏: 0,1,2(共3类) B栏: 0,1,2(共3类) A B0 0 2 1 然后我
对
列
A和B
进行
了
一次
热
编码
。在
一次
热
编码
之后,我
的
数据
如下所示。然后,我想对
数据
帧
data2
进行
热
编码
。在这种情况下,
浏览 38
提问于2020-03-27
得票数 0
回答已采纳
1
回答
使用一个
热
编码
和向量汇编器与向量索引器解决分类特征
、
、
、
、
假设我在
数据
帧
中有分类特征。为了在
数据
帧
上执行ML,我使用OneHotEncoderEstimator()对分类
列
进行
了
一次
热
编码
,然后使用VectorAssembler()将所有特性组装到一个
列
中
。在阅读Spark 时,我看到了如何使用VectorIndexer()在特征向量
列
中
索引分类特征。如果我在形成特征向量
列
之前已经在分类列上执行了<em
浏览 0
提问于2019-01-17
得票数 2
1
回答
如何使用相同
的
处理管线来处理训练和测试
数据
,当它们产生不同
的
最终特征时
、
、
、
、
我正在执行
的
处理步骤如下:['col1', 'col2', '**col3**', 'col4', '
浏览 4
提问于2020-07-19
得票数 0
回答已采纳
1
回答
一个
热
编码
标签返回到DataFrame
、
、
、
我想对
数据
帧
应用一些分类器,因此必须
对
df
进行
一次
热
编码
。我现在有标签了,但不知道如何继续?如何将标签恢复为df类型,以及如何使用新
的
df?oneho
浏览 10
提问于2019-07-09
得票数 0
4
回答
将单
热
编码
的
数据
帧
列
转换为一
列
、
、
、
在pandas
数据
帧
中
,一
热
编码
向量以
列
的
形式出现,即:1 0 0 1 0 03 0 0 0 1 04 0 0 0 0 1 如
何在
python
中
通过标签
编码
将这些
列</
浏览 3
提问于2020-08-01
得票数 8
2
回答
从其他熊猫栏创建新栏目
、
、
、
我想从
列
创建一个新
的
列
。“类型”
列
包含一个或多个类型,我希望为每个类型名称创建一个
列
。然后,我想在每个专栏
中
填写1和0,这取决于它们是否有这种类型。 我对此毫无头绪。 我不需要这样
的
东西
浏览 6
提问于2022-05-12
得票数 0
回答已采纳
1
回答
如
何在
对分类变量
进行
编码
后跟踪
列
?
、
、
、
、
我想知道如
何在
对
数据
集执行
数据
预处理之后跟踪
数据
集
的
原始
列
?df_dummies = np.array(ct.fit_t
浏览 0
提问于2020-02-06
得票数 3
回答已采纳
1
回答
分类特征
编码
、
、
、
、
我有明确和连续
的
数据
。分类
列
包括两个类
的
列
,
如
性别(男性、女性)和多类
列
(
如
位置)。 我需要将这些
编码
成数值。我会做一个
热
编码
和删除第一
列
,但这是不现实
的
,一个看不见
的
测试
数据
,可能有看不见
的
值。因此,我计划用句柄_ignore=‘ignore’
进行
一次
热
<
浏览 0
提问于2022-01-20
得票数 1
1
回答
批处理
的
one_hot
编码
将是不完整
的
、
、
如
您所知,tf.one_hot可以执行
一次
热
编码
。但是,当我
的
数据
集非常大时,我需要
进行
批处理培训。这样,当我使用for循环在所有批上循环时,在每次迭代
中
,当我执行tf.one_hot时,一个
热
矩阵
的
维数将比我预期
的
要小。例如,对于'a‘
列
,我们有47个类别,但是在一个批处理
中
,它们可能只显示了20个,当我
对
这个批处理执行one_hot
浏览 0
提问于2018-04-27
得票数 0
回答已采纳
2
回答
python
中二进制单热点(一K)
编码
的
问题
、
、
、
例如,如果有一个颜色
列
(分类变量),其值为“红色”、“蓝色”、“黄色”和“未知”,那么二进制人
的
热
编码
将颜色
列
替换为' color =red‘、' color =blue’和‘color=黄色’。我从熊猫
数据
框架
中
的
数据
开始,我想用这些
数据
来训练一个与科学知识相关
的
模型。我知道两种方法来做二进制一
热
编码
,其中没有一种让我满意。 Pandas
浏览 1
提问于2015-08-27
得票数 7
回答已采纳
3
回答
One-使用不在
列
中
的
元素
对
Pandas上
的
列
进行
热
编码
、
、
、
我
的
数据
帧
: Index letters1 B3 Z 在
Python
中
,我想获得上面字母
列
的
一次
热
编码
数据
帧
,其中元素不在该
列
中
,如下所示: Index
浏览 7
提问于2020-11-04
得票数 0
回答已采纳
2
回答
Xgboost -如果整数仅为0和1,我们是否必须将它们转换为因子
、
、
我在一个
数据
帧
中有许多
列
,它们是标志"0“和"1”。当我导入
数据
帧
时,它们属于"integer“类。我需要将它们转换为因子吗?Xgboost只适用于数字
列
,所以如果我将
列
转换为factor
的
列
,那么我将需要对它们
进行
一次
热
编码
,以将它们转换为数字。(附带问题:如果我们
进
浏览 38
提问于2017-02-19
得票数 1
回答已采纳
1
回答
如何使用Keras.to_Categorical在dataFrame中
一次
对
多
列
进行
热
编码
?
、
、
、
、
我想使用Keras to_categorical
一次
对
我
的
数据
框
中
的
多
列
进行
单
热
编码
。该怎么做呢?Item_Fat_Content', 'Outlet_Location_Type', 'Outlet_Type', 'Outlet_Size', 'Item_Type_Combined', 'Outlet'] 这
浏览 19
提问于2019-05-06
得票数 4
回答已采纳
1
回答
分类
数据
的
编码
概念-在同一df
中
为所有
列
选择一个或为不同类型选择一个
、
、
这里
的
初学者如果
数据
集包含序数、非序数(少数类别)和非序数(多个类别> 30)。一个人应该挑选一个来封装所有这样
的
情况,还是用不同
的
编码
器
对
每一种类型
进行
预处理? 最终目标是训练一个ML模型。
浏览 0
提问于2021-08-15
得票数 0
2
回答
如
何在
python
中
对
数据
帧
中
的
列
进行
一次
热
编码
、
、
我有一个
数据
集,其中包括教育水平
的
类别
列
初始值是0,nan,高中,研究生院,大学我已经清理了
数据
并将其转换为以下值 0->其他1->高中2->研究生院3->大学 在同一
列
中
,现在我想将此列
热
编码
为4
列
浏览 41
提问于2020-11-21
得票数 0
回答已采纳
1
回答
正确使用一个
热
编码
,出现意外
的
值错误
、
、
我正在尝试通过
对
sklearn库
中
的
一些分类
数据
进行
热
编码
来预处理一些
数据
。为了说明一下
数据
集:我有十
列
,我只想
对
国家
的
分类值
进行
热
编码
(有三
列
:法国、德国和西班牙),其余
的
列
则保存数值。我想知道
的
一件事是,对于参数类别,是应该传递希望
编码
浏览 9
提问于2020-03-19
得票数 0
1
回答
在部分Dataframe上使用PCA
、
、
、
我想使用一种聚类算法来实现包含许多特性(32
列
)
的
数据
帧
。我希望使用主成分分析( PCA )来减少维数,使机器学习过程更容易。是否可以仅对
数据
帧
的
某些
列
使用PCA,而保留其他
列
,然后使用机器学习模型。 或者,在聚类之前,必须
对
所有
数据
使用PCA。
浏览 3
提问于2022-07-04
得票数 -1
回答已采纳
1
回答
1-
热
编码
验证
数据
、
、
我有一个单一
热
编码
的
特征矩阵,其中特征是训练
数据
的
子串。 我只有一个包含rows = samples, columns = substrings (one-hot-encoded)
的
最终
数据
帧
。现在我想
对
一组新
的
数据
进行
一次
热
编码
。
数据
由rows = samples, columns = String组成,我需
浏览 15
提问于2020-07-10
得票数 0
回答已采纳
2
回答
将单
热
编码
的
数据
帧
转换为计数
、
我有一个名为行业
的
专栏,我
对
其
进行
了
热
编码
,如下所示:一些观察值可以属于多个行业,并且有重复
的
if,如果它是重复
的
,我只想计数
一次
。0 1 06 0 1 1 0 如何将这个单
热
编码
的
数据
帧
转换为可以绘制每个单
热<
浏览 36
提问于2021-03-30
得票数 0
2
回答
将逗号分隔字符串
的
DataFrame
列
转换为一个
热
编码
、
、
我有一个大
的
dataframe (‘data’)由一个
列
组成。
列
中
的
每一行由一个字符串组成,每个字符串由逗号分隔
的
类别组成。我想
对
这一
数据
进行
一次
热
编码
。例如,由此,我想得到一个由以下内容组成
的
数
浏览 4
提问于2017-10-21
得票数 16
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何在Excel表格中快速的进行两列数据的互换?
Python数据分析中如何对符合条件的数据进行标注
70个NumPy分级练习:用Python一举搞定机器学习矩阵运算
70个NumPy练习:在Python下一举搞定机器学习矩阵运算
如何用Python轻松取代Excel
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券