腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
使用
pd.get_dummies
的
One-hot
编码
-
对于
所选
行
,
仅
显示
值
为
1
的
列
、
在
使用
X =
pd.get_dummies
(data=X)对我
的
二手汽车数据集进行一次性
编码
之后,我需要查看保存特定
行
的
1
值
的
列
。因此,如果我像这样选择
行
: X.iloc[0,:] 我会得到(我只粘贴输出
的
一部分): model_106 0model_207 0
浏览 11
提问于2019-10-11
得票数 0
回答已采纳
2
回答
pd.get_dummies
是独一无二
的
编码
吗?
、
、
one-hot
编码
和虚拟
编码
的
区别,当
使用
默认参数(即drop_first=False)时,pandas.get_dummies方法是
one-hot
编码
吗?sklearn.linear_model import LogisticRegression X =
pd.get_dummies
浏览 2
提问于2018-01-09
得票数 15
回答已采纳
2
回答
熊猫df.get_dummies()返回"ValueError:无法将字符串转换为浮动“
、
、
我正在尝试
使用
Pandas‘df.get_dummies()对几个分类
列
进行一次热
编码
,它正在返回一个我不理解
的
错误。造成此问题
的
原因是什么,以及如何成功地用dtype == object对所有
列
进行一次性热
编码
。 'X', 'Y
浏览 5
提问于2019-12-05
得票数 0
回答已采纳
2
回答
如何
使用
DictVectorizer转换分类
列
、
、
、
我有一些数据帧,它
的
一些
列
(C
1
、C2、C3)是分类(字符串)变量。数据和数据类型如下:4 b'02e197c5'' b'bbaea
1
c0' 13 b'7ffd46c3' b'710103fd' b'a1407382' b'
浏览 0
提问于2018-06-10
得票数 0
0
回答
如何对大文件应用
one-hot
编码
?
、
、
、
、
encodingtrain.drop([11,'Semana'],axis=
1
, inplace = True) train
浏览 1
提问于2016-07-06
得票数 2
回答已采纳
1
回答
对于
决策树
的
多类分类,特征必须是浮点数吗?
、
、
、
、
--------
1
y_train | OBI |0 | B-ADR |2 | O |... ...我正在尝试
使用
决策树来进行命名实体识别()。我
的
特性、dataframe和label dataframe看起来与上面的类似。我<e
浏览 3
提问于2020-12-30
得票数 1
回答已采纳
2
回答
一次热
编码
后测试数据
的
预处理
、
、
我在这里有点困惑,我有一个对所有<10个唯一
值
low_cardinality_cols
的
分类
列
进行了热
编码
,并删除了用于训练和验证数据
的
其余分类
列
。我担心
的
是:
对于
这些
列
,Test_data.csv当然会有不同
的
基数。如果我
使用
训练中
的
低基数列对测试数据进行热
编码
,我将得到Input contains NaN,但是我
的
训练、有效和测试
浏览 7
提问于2019-12-23
得票数 2
回答已采纳
1
回答
多属性
列
的
H2O处理
H2O如何处理多属性分类特征(即带有逗号分隔
值
的
列
,如('
1
,2,3','
1
,4','
1
,2')?我是否需要手动将它们拆分成多
列
(一次热
编码
)?更具体地说,假设数据是一个制表符分隔
的
文件,如下所示: col
1
col2
1
1
,2,3 2
1
,4
1
1<
浏览 6
提问于2017-08-08
得票数 0
回答已采纳
2
回答
从csv馈送Torch对象以学习
、
、
、
我正在尝试给PyTorch提供输入,以构建一个非常简单
的
神经网络。这是我
的
问题:我有我想要在csv中
使用
的
所有数据,并且我正在
使用
Panda来读取它。主要
的
问题是,在我
的
csv中有一些
列
不能转换为int或float,因为它们基本上是String,例如,customer-ID将类似于: AAABBBCCC;而我不能将其转换为float或int。one_hot =
pd.get_dummies
(data[column]) # dr
浏览 0
提问于2019-07-10
得票数 1
2
回答
基于符号、日期、AveragePrice
的
股票预测
、
、
、
我正在尝试根据过去5年
的
数据来预测未来7天
的
股票价格。数据如下所示我正在尝试对此数据集应用支持向量回归。我已经
使用
data.Date = pd.to_datetime(data.Date)将date
列
转换为pandas datetime,但仍然收到以下错误from sklearn.svm import SVR fro
浏览 0
提问于2018-11-15
得票数 0
2
回答
“一热”
编码
因变量在随机森林中
的
应用
、
、
、
、
我
使用
sklearn-learn在python中构建了一个随机森林,并对所有分类变量应用了“一热”
编码
。问:如果我将"one hot“应用到我
的
DV,我是将它
的
所有虚拟
列
都作为DV应用,还是应该以不同
的
方式处理DV?
浏览 4
提问于2018-12-03
得票数 3
3
回答
绝对
的
二进制-我做错什么了?
、
、
、
我正在从成人收入数据集(<50K和>=50K)转换目标
列
,我希望<50K
为
零,大于或等于50K时
为
1
。当我运行下面的代码时,它会创建两个
列
,当我在
列
中希望看到
的
只是列出<50K
的
位置时,将其替换为
1
,而列出>50K时,将其替换为0。cols_to_transform = [ 'Target' ] df_with_dummies =
pd.get_dummies
(col
浏览 1
提问于2017-05-23
得票数 1
回答已采纳
21
回答
如何在Python中进行热
编码
?
、
、
、
我有一个包含80%分类变量
的
机器学习分类问题。如果我想
使用
某个分类器进行分类,我必须
使用
一个热
编码
吗?我可以在没有
编码
的
情况下将数据传递给分类器吗?
对于
功能选择,我尝试执行以下操作:nrows=num_rows_to_read)I = 10000 num_rows_to_read = train_small = pd.read_csv'cnt’:如果categorical_feature不在non_categorial_features中:
浏览 172
提问于2016-05-18
得票数 194
2
回答
在python pandas中将分类属性转换为多个属性
、
例如,性别属性将被转换为两个属性,"Genre=M“和"Genre=F",I需要两个
列
Male和Female,分配对应于该属性存在与否
的
二进制
值
浏览 0
提问于2019-02-23
得票数 1
1
回答
在创建虚拟变量之后,我如何分裂成训练和测试集?
、
、
、
、
我已经
为
我
的
所有分类
列
创建了虚拟变量,但是我需要将我
的
数据分成训练和测试集,我
的
目标是"Loan_Status“。我很困惑,因为在创建虚拟变量之后,它为"Loan_Status“创建了两个新
列
,那么我何时或如何拆分数据并创建目标?df_dummies =
pd.get_dummies
(df
1
, columns=['Gender', 'Married', 'Dependents
浏览 2
提问于2022-08-13
得票数 0
1
回答
如何
使用
多个字符串对数据框
列
进行热
编码
?
、
、
、
这是包含一些观察结果
的
数据框架 ? 如果您注意到Cuisines列有许多字符串。
使用
了代码
pd.get_dummies
(data.Cuisines.str.split(',',expand=True),prefix='c') 这帮助我拆分字符串和热
编码
,然而,有一个新
的
问题需要处理快餐出现在第一
行
和第三
行
。预期输出是第一
行
和第三
行
的
值
为</e
浏览 11
提问于2019-12-03
得票数 0
1
回答
单个要素
的
多个分类
值
如何
使用
python将其转换为二进制
、
、
、
我有一个有28
列
的
电影数据集。其中之一就是流派。
对于
此数据集中
的
每一
行
,
列
类型
的
值
的
形式
为
"Action|Animation|Comedy|Family|Fantasy“。我想
使用
pandas.get_dummies()对它们进行
编码
,但是由于列有多个
值
,如何处理这些条件呢? 我已经附上了样本数据,但只有相关
的
列
。我期
浏览 1
提问于2016-10-31
得票数 0
1
回答
如果我传递了以前从未传递过
的
ML.Net预测
的
分类
值
,该怎么办?
例如,如果我
为
这些
值
训练模型Column
1
= D , Column2 = E , Column3= F , Label = 20如果我想要预测呢?Column
1
= A , Column2 = B , Column3 = Z 模型对此做了什么?
浏览 1
提问于2018-08-13
得票数 0
3
回答
为什么一种热
编码
可以提高机器学习性能?
、
、
、
我注意到,当在特定
的
数据集(矩阵)上
使用
一种热
编码
并用作学习算法
的
训练数据时,与
使用
原始矩阵本身作为训练数据相比,它在预测准确性方面提供了明显更好
的
结果。这种性能提升是如何实现
的
?
浏览 6
提问于2013-07-04
得票数 132
回答已采纳
1
回答
如何与熊猫或丹苏尔花一起对类别特征进行一次热
编码
?
、
、
数据如下:
1
1
563
1
[[
1
,563,
1
], [missing,145,
1
]
浏览 5
提问于2017-04-27
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据预处理之One-Hot
one-hot encoding不是万能的,这些分类变量编码方法你值得拥有
Smultron for Mac(网页文本编辑器)v12.2.5
TensorFlow 指标列,嵌入列
词向量之DNN模型
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券