腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
一个
ML
模型
的
类别
值
的
热
编码
输出
、
、
在我
的
一个
.py文件中,我创建了
一个
模型
,并保存了它
的
.pkl文件,以便以后用于分析。
模型
是使用这个kaggle情感数据集https://www.kaggle.com/shivamburnwal/speech-emotion-recognition中
的
代码形成
的
,问题是当我使用这个代码
的
模型
来检测新音频
的
情感时,
输出
是一种热门
的</e
浏览 30
提问于2021-07-19
得票数 0
回答已采纳
2
回答
单标签多类分类随机森林蟒蛇
、
、
、
、
我是机器学习
的
新手,目前正在处理由分类数据组成
的
csv文件格式
的
数据集。作为预处理
的
一种手段,我对数据集中
的
所有变量进行了
热
编码
。 目前,我正在尝试应用随机森林算法将条目分类为4个
类别
中
的
一个
。我
的
问题是,我不知道这
一个
热
编码
变量到底发生了什么。我如何将它们提供给算法?它能区分buying_price_high、buying_price_low
浏览 19
提问于2019-10-02
得票数 0
回答已采纳
1
回答
输出
标签
的
一种
热
编码
、
、
虽然我知道需要对输入数据中
的
功能进行
热
编码
,但
输出
标签
的
热
编码
实际上有什么帮助呢?张量流MNIST教程鼓励对
输出
标签进行一种
热
编码
。然而,CS231n(斯坦福大学)
的
第
一个
任务并没有建议使用一种
热
编码
。选择/不选择
一个
热
编码
输出
标签
的
理由是什么?编
浏览 1
提问于2018-07-17
得票数 3
1
回答
数据集
的
编码
和缩放特性
、
、
我有
一个
带有非序数分类特征
的
数据集。在训练机器学习
模型
(线性SVC)之前,转换它们(
编码
+缩放)
的
最佳方法是什么?标签
编码
-这是有效
的
。但是缩放没有意义,因为特性中
的
不同
类别
没有任何特定
的
顺序。 One--
热
编码
--特性中有上千种独特
的
类别
,这使得
ML
模型
通过创建数千列而变得
浏览 0
提问于2020-11-26
得票数 0
2
回答
为什么单
热
编码
器可以避免这样
的
情况:如果数据是标签
编码
的话,
模型
会误解数据
的
某种顺序。
、
、
、
我们知道,在处理非序数数据时,我们更喜欢使用单
热
编码
而不是标签
编码
。 提前谢谢。
浏览 0
提问于2019-04-25
得票数 3
1
回答
Python Scikit学习OneHotEncoder仅对选择
值
进行
编码
、
、
我是否可以使用OneHotEncoder对
类别
列中
的
select
值
进行一次
热
编码
,而不是构建密集
的
ndarray,然后删除不必要
的
列?例如,如果名为color
的
分类列有三种颜色,分别表示红色、绿色和蓝色,而我只想对其中
的
两个
值
进行
热
编码
,表示为“红色”和“绿色”,我该如何使用OneHotEncoder进行
编码
呢?我是
ML
的
新手,
浏览 29
提问于2020-09-04
得票数 1
回答已采纳
1
回答
如何处理
ML
生产中
的
分类特征工程?
、
我有
一个
分类数据集,其中有很多分类列。我有
一个
热
编码
的
.我训练中
的
虚拟变量。如何在
ML
的
生产端处理这个问题。有些情况下,未来数据集中存在数据漂移,这些数据集可以在训练
模型
期间引入新
的
外部
类别
变量。我所做
的
是,在对所有特性进行
热
编码
之后,我保存了分类列,并将这些列保存为泡菜文件,然后加载了泡菜文件,以匹配部署期间
的
生产设置特性,并
浏览 0
提问于2022-04-06
得票数 1
1
回答
使用元数据而不是图像训练
模型
、
、
我想做
一个
只有元数据(年龄,性别)作为输入
的
多层感知器。经过一些研究,我决定了
一个
由500个神经元组成
的
完全连接层,然后是大小为8
的
softmax层(有8个
类别
)。我已经使用一种
热
编码
将元数据排列在数组中。
一个
数组
的
大小为6。前两列与性别相关,其他4列与年龄相关。下面是
一个
示例:[[0 1 0 0 1 0 ], #female, age 15 [1
浏览 0
提问于2021-05-07
得票数 0
1
回答
为什么我要在cv循环中进行目标
编码
?
、
、
、
我希望使用目标
编码
,使用
类别
编码
器学习库。我真的不明白为什么有必要在交叉验证循环中将其作为sklearn管道中
的
一个
步骤吗?然而,看看我下面的结果,这不说明是否过份合适吗? 📷
浏览 0
提问于2020-12-07
得票数 0
1
回答
保存
的
随机森林
模型
在同一数据集上产生不同
的
结果。
、
、
、
、
在磁盘上保存
的
随机森林
模型
以及使用完全相同
的
数据集进行预测时,我在复制结果时遇到困难。换句话说,我用dataset A训练
一个
模型
,并将它保存在我
的
本地机器上,然后加载它并用于预测dataset B,每次我预测dataset B时都会得到不同
的
结果。我知道随机森林分类器涉及
的
随机性,但据我所知,这种随机性是在训练期间,一旦
模型
创建,预测不应该改变,如果您使用相同
的
数据进行预测。== 0").count()
浏览 3
提问于2020-08-07
得票数 1
回答已采纳
1
回答
不同损失函数
的
TensorFlow自定义训练步骤
、
、
、
、
model.trainable_weights)loss_fn = tf.keras.lossees.get("categorical_crossentropy")optimizer.apply_gradien
浏览 2
提问于2020-11-09
得票数 2
回答已采纳
1
回答
从同一特征空间
编码
多个观测
值
、
、
我
的
数据包含了多个分类feature.The特征空间是医学症状,因此这个特征
的
数据如下:“发烧”,“疼痛”,“黄色皮肤”。 .The
的
症状观察量每个样本是不固定
的
,我有大约50个不同
的
症状。我如何将这个特性
编码
成
ML
模型
可以处理
的
东西?数组中症状
的
顺序并不重要。 我尝试了
一个
热
编码
,但将50个
类别
级别的特征空间投影到50个指标中意味着丢失信息(有
浏览 0
提问于2019-01-10
得票数 1
回答已采纳
2
回答
对许多分类变量进行
编码
、
、
我有1000万个分类变量(每个变量有3个
类别
)。对这1000万个变量进行
编码
以训练深度学习
模型
的
最佳方法是什么?(如果我使用
一个
热
编码
,那么我最终将拥有3000万个变量。此外,只有
一个
输出
的
嵌入层没有任何意义(它类似于整数
编码
,并且这些
类别
之间没有顺序),而有两个
输出
的
嵌入层也没有太大区别。通常,当
类别
数较多时,我们使用嵌入层)
浏览 6
提问于2020-10-17
得票数 0
1
回答
关于
一个
热
编码
的
两个问题:先放下?和成千上万个
类别
的特性
、
、
关于
一个
热门
的
特性
编码
,我有两个问题:(2)处理具有数千个特征
的
范畴变量(大约6000)
的
一次
热
编码
是最
浏览 0
提问于2021-06-11
得票数 2
1
回答
电火花OneHotEncoded向量似乎缺少
类别
?
、
当试图使用pyspark
的
OneHotEncoder ()为分类特性生成
一个
热
编码
向量时,会发现
一个
奇怪
的
问题,在这种情况下,单个
热
向量似乎缺少某些
类别
(或者显示时格式可能很奇怪?)。在对数据进行其他预处理之后,尝试通过以下方法将分类和二进制(只是为了实践)特性
编码
为1
热
向量。,SparseVector(S, {i1: v1}, {i2: v2}, ..., {in: vn})意味着
一个
长度S<em
浏览 0
提问于2018-07-31
得票数 1
回答已采纳
1
回答
'ValueError: logits和labels必须具有相同
的
形状((None,2) vs (None,1))‘
、
、
、
我在tensorflow中有
一个
具有6个隐藏层
的
卷积神经网络,目前我有两个分类类,但在最后
的
密集层(softmax激活函数)。因为我有两个类,所以我在
输出
层需要两个神经元,但每当我放入两个神经元时,我就会得到错误: ‘ValueError: logits和labels必须具有相同
的
形状((None,2) vs (None,1))’ 然而,它在
一个
神经元上工作得很好。这是我创建
模型
的
代码: import tensorflow as tf import t
浏览 18
提问于2021-08-28
得票数 0
1
回答
ML
.NET CategoricalOneHotVectorizer也对测试数据进行
编码
吗?
、
、
我不知道
ML
.NET CategoricalOneHotVectorizer是如何工作
的
,从它们
的
示例代码来看,{};通常,在Pytho
浏览 0
提问于2018-10-11
得票数 1
回答已采纳
1
回答
如何为多
输出
数据集创建分类
模型
?
、
、
、
、
📷两个目标变量都是有序
的
,因此我想在这两个目标变量上建立
一个
多类分类
模型
。但是,我不知道在
模型
创建过程中从哪里开始。
浏览 0
提问于2020-08-04
得票数 0
2
回答
在机器学习中,如何有效地处理一列中
的
大量
类别
?
、
、
在我
的
dataset中,有
一个
列有较大
的
no
类别
。对于
模型
培训或构建,我们需要将这些
类别
转换为数字。我们可以使用几种方法将标签转换为数字
编码
、单
热
编码
和标签
编码
器,但在这里,我
的
问题是
类别
不是序号(不需要保留顺序)。我们可以使用
一个
热
编码
,但它创造了大量
的
维度。在这种情况下,要有效地将
类别
转换
浏览 0
提问于2021-07-14
得票数 1
5
回答
如果有15个以上
的
唯一
值
,我如何
编码
分类列?
、
、
、
、
因为回归只允许数字类型,所以我需要对分类数据进行
编码
。然而,其中大多数具有15种以上
的
独特价值,如国家。 我还在使用一种
热
编码
吗?还是有别的选择?在此数据集上使用回归是个好主意吗?
浏览 0
提问于2020-12-24
得票数 8
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
百度推出EZDL,一个不需要编码经验的AI模型培训平台
机器学习中的独热编码
实用机器学习笔记八:特征工程
特征工程(一)
机器学习-数据预处理
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券