腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
一种
对
未
观察到
的
级
别的
字符
列表
进行
热
编码
、
我正在尝试创建一个
字符
列表
的
一个
热
编码
(ohe),允许
未
观察到
的
级别。indices to 1-hot encoded numpy array和Finding the index of an item given a list containing it in Python
的
答案,以下是我想要
的
: # example data # this is the full list including unobserved
浏览 18
提问于2019-10-14
得票数 0
回答已采纳
1
回答
标签
编码
是否足以输出标签?
、
、
、
、
对于序数特性,使用标签
编码
是有意义
的
。但是对于分类特征,我们使用了一个
热
编码
。但这些是输入特性
的
约定。但是对于输出变量,如果输出标签是绝对
的
,是否需要使用
一种
热
编码
?或者我也可以使用标签
编码
?哪
一种
更好? 我正在训练一个水果分类器,有120个班。我使用ResNet50模型作为特征提取器
对
ImageNet
进行
预训练,并使用这些特性训练Logistic回归分类器(转移
浏览 0
提问于2020-05-11
得票数 2
回答已采纳
1
回答
如何从csv文件输入
进行
一次
热
编码
、
、
、
让我们调用一个数值列'num'和一个
字符
串列'col'。我想做以下几点: 如果输入在字典
列表
中,这是很容易做到
的</em
浏览 6
提问于2016-09-02
得票数 3
3
回答
字符
串分类特征
的
一种
热
编码
、
、
、
我正在尝试
对
一个普通数据集执行一个
热
编码
。data = [['a', 'dog', 'red']使用Scikit-Learn
对
这些数据
进行
预处理
的
最佳方法是什么?在第一反应中,你会看到科学学习
的
。但是一个
热
编码
器不支持
字符
串作为特性,它
浏览 8
提问于2016-01-30
得票数 37
2
回答
一个功能太多
的
热
编码
(~ 10,000)
我正在建立一个模型来预测特定员工
的
休假和病假。我正在考虑使用员工id作为一个功能来训练模型。有些用户有明显
的
模式,例如周一连续几周休假。另一方面,我觉得我没有足够
的
资料,让每个雇员都有一个模型,特别是如果他们最近被雇用了。 经过一番研究,似乎唯一
对
员工身份有意义
的
编码
就是“一个
热</em
浏览 0
提问于2019-07-21
得票数 3
回答已采纳
2
回答
提供输入标签
的
单
热
编码
标签
、
、
我试图应用一个
热
编码
的
熊猫数据,但我不能给出一个类
别的
论点。我
的
想法是在类别和
编码
之间
进行
对应,例如:Y = pd.get_dummies(data['Article_Topic_1']).values 例如,Y将是类别'A'
的
[0,0,1],但我想规定'A'
的
浏览 1
提问于2019-12-09
得票数 1
回答已采纳
2
回答
一种
热
编码
分类特征-只限于稀疏形式
、
、
、
我有一个具有int和绝对特性
的
dataframe。分类特性有两种类型:数字和
字符
串。 由于dataframe是巨大
的
,具有很高
的
基数,所以我只想将它转
浏览 0
提问于2017-03-28
得票数 4
回答已采纳
1
回答
如何使用子
字符
串匹配或正则表达式将
字符
串类型Target变量
编码
为数字类型
、
、
、
、
我使用CTU-13数据集,包括13种检测僵尸网络
的
场景.在这里,目标变量标签是一个
字符
串类型变量。标签
编码
对
这个变量,简单地创建大约52-60个独特
的
数值,数字不同
的
情况下。但我
观察到
,如果可以使用子
字符
串匹配或正则表达式
进行
标签
编码
,那么我们可以简单地
对
3个数字
进行
编码
。然后问题将是三
级
分类(三
级
)问题。然后绘制ROC,auc
浏览 2
提问于2019-11-04
得票数 0
回答已采纳
3
回答
是否需要对此数据集
进行
热
编码
?
、
、
、
、
下面是来自UCI数据存储库
的
数据集。我想要建立一个回归模型,将血小板计数作为因变量(Y),其余作为特性/输入。我
的
问题是: 在建立回归模型之前,应该
对
这些变量
进行
“一次
热
编码
”吗?,我还
观察到
值在不同
的
范围内,所以在应用回归模型之前,我是否应该缩放数据集?。
浏览 4
提问于2020-07-06
得票数 1
2
回答
Pandas中
的
自定义虚拟
编码
、
、
我有一个带有事件数据
的
数据。我有两栏:一
级
和二
级
。第一栏和第二栏均载有标签
列表
(例如,“有趣
的
活动”、“舞会”)。singing', 'dance']我想对数据
进行
虚拟
编码</
浏览 2
提问于2017-10-24
得票数 0
回答已采纳
1
回答
忽略GLM中
的
h2o因子
当您对分类变量
进行
一次性
编码
时,通常会在建模之前删除其中一个变量。这样,您就没有一个与其他特性线性相关
的
冗余特性。 是否有
一种
方法可以指定不应该用于拟合
的
范畴变量
的
级别?:“我们强烈建议避免
对
任意级
别的
分类列
进行
一次
热
编码
,因为这样做效率很低,对于习惯于为其他框架手动扩展分类变量
的
用户来说尤其如此。
浏览 4
提问于2018-02-23
得票数 1
回答已采纳
1
回答
1-
热
编码
验证数据
、
、
我有一个单一
热
编码
的
特征矩阵,其中特征是训练数据
的
子串。 我只有一个包含rows = samples, columns = substrings (one-hot-encoded)
的
最终数据帧。现在我想
对
一组新
的
数据
进行
一次
热
编码
。数据由rows = samples, columns = String组成,我需要检查每个样本
的
字符
串是否包含任何子
字符
串(特性),并
浏览 15
提问于2020-07-10
得票数 0
回答已采纳
1
回答
对于相同输入特征
的
不同目标标签
编码
,随机Forrest Sklearn给出了不同
的
精度。
、
、
、
我用滑雪随机福雷斯特来训练我
的
模型。使用模型
的
相同输入特性,我尝试首先使用label_binarize传递目标标签,以创建目标标签
的
一个
热
编码
,然后尝试使用label_encoder
对
目标标签
进行
编码
。在这两种情况下,我得到了不同
的
准确性分数。有什么特
别的
原因导致这种情况发生,因为我只是使用另
一种
方法来
编码
标签,而不更改任何输入特性。
浏览 0
提问于2020-05-17
得票数 2
回答已采纳
2
回答
一类变量
的
单
热
向量表示与标签
编码
我
的
数据集中有一个
字符
串类型
的
分类变量。我需要把它转换成数值,以便进一步处理。我知道表示分类数据
的
标准方法是使用
一种
热
编码
。但这将把变量
的
每个条目转换为一个向量。sklearn
的
LabelEncoder将每个条目转换为标量值。我意识到这是一个非常天真,可能也很愚蠢
的
问题,但哪种表达方式更常用,是否有理由产生这种偏见?
浏览 0
提问于2016-01-13
得票数 3
2
回答
随机森林分类器中
的
单
热
编码
、
、
是否需要对python中
的
随机森林分类器
进行
一次
热
编码
?我想从逻辑上理解,随机林中是否可以用标签
编码
来处理分类特性,而不是单
热
编码
。
浏览 4
提问于2021-01-14
得票数 0
1
回答
如何有效地减少一个
热
编码
的
分类值
的
维数?
、
、
、
因此,我最初
的
方法是用一个表示其类
别的
热
向量
对
每个x
进行
编码
。所以,我
的
问题是,用低维向量表示类
别的</e
浏览 0
提问于2023-02-28
得票数 0
1
回答
树与非树(knn)方法中
的
一个
热
编码
目标变量
、
、
、
、
我正在学习标签
编码
器,一个
热
编码
等应用于数据集,通过KNN和XGBoost类型树
进行
分类。但是,对于目标变量是否应该是一个
热
编码
变量,我感到有点困惑。在我
的
例子中,我有一个500x10大小
的
dataframe,最后一列是目标(用于预测) country列,而其余
的
499列包含浮点值。....... 40.1 Germany8.1 ......... 98,7
浏览 0
提问于2021-04-19
得票数 1
1
回答
学习标签
编码
器:如何保持批间
的
映射?
、
为了准备我
的
数据集,我将需要对许多特性
进行
一次
热
编码
,之后我将获得超过15,000个特性。第二批可能有巴黎,伦敦。但最终,我需要让巴黎、东京、罗马、伦敦同时映射成一个
编码
。 假设我不能
浏览 3
提问于2017-05-15
得票数 0
回答已采纳
1
回答
如何将Pandas Dataframe中
的
字符
串转换为
列表
或
字符
数组?
、
、
、
、
我有一个名为data
的
dataframe,其中
的
一个列包含
字符
串。我想从
字符
串中提取
字符
,因为我
的
目标是
对
它们
进行
一次
热
编码
,并使这些
字符
可用于分类。包含
字符
串
的
列存储在预测器中,如下所示:印刷
的</e
浏览 4
提问于2020-05-17
得票数 3
回答已采纳
2
回答
随机森林分类中
字符
串标称变量权值
的
标签
编码
、
、
、
、
我想要构建一个随机森林分类器,它将获取关于投诉
的
分类输入特性并确定投诉类型。'Incident Zip', 'Street Name', 所有这些特性都是名义变量(分类),我需要将
字符
串变量转换为浮点变量我不愿意使用一个
热
标签
编码
,因为一些功能有超过1000个类别,进一步
的
计算可能超出我
的
笔记本电
浏览 3
提问于2020-12-16
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
十二张图带你了解 Redis 的数据结构和对象系统
Day1:html和css
python 3.5入门(4)文件类型
Web开发者应该掌握的编码和解码知识
Redis核心剖析:为什么这么“快”的秘密
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券