腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
一次
热
编码
返回
最后
一个
分类
值
的
全
0
向量
、
、
、
、
tf.one_hot()正在为第三类可能
的
分类
值
生成[
0
,
0
,
0
]
向量
。 我希望是
一个
[1,
0
,
0
]。我在这个函数中做错了什么? 有3个可能
的
分类
类,我想要
一个
-
热
编码
。labels = tf.one_hot(labels1, 3) print("\nOne Hot labels \n", labels[25
浏览 7
提问于2021-02-03
得票数 1
回答已采纳
1
回答
在导出语义相似性
的
同时,与文本特征一起使用时,是否需要对
一个
热
编码
的
分类
特征进行缩放?
、
、
我
的
目标是使用多个特征导出文本相似性。其中一些特性是文本特性,我使用
的
是(TfHub2.0)通用句子
编码
器。还有其他
分类
特征,它们使用
一个
热
编码
器进行
编码
。例如,对于数据集中
的
单个记录,特征
向量
如下所示:
分类
(无序)特征
向量
-1×500 (因为特征中有500个唯一
值
) 我
的</
浏览 0
提问于2020-09-21
得票数 1
1
回答
在KNN或SVM等基于距离
的
算法中,如何考虑
分类
变量?
、
、
例如,假设我有
一个
具有独立特征
的
数据集--年龄、性别、姓名和收入。而我
的
因变量是加载审批状态。 如果我想使用KNN或SVM,是否需要将性别转换成
一个
数值变量?如果是,如何在KNN或SVM等基于距离
的
算法中使用?
浏览 0
提问于2020-04-22
得票数 0
2
回答
如何处理决策树,随机森林
的
分类
特征?
、
、
我试图在UCI银行营销数据-> 上建立决策树和随机森林
分类
器。数据集中有许多
分类
特性(具有字符串
值
)。在spark文档中,可以通过使用StringIndexer或VectorIndexer索引将
分类
变量转换为数字变量。我选择使用StringIndexer (
向量
索引需要
向量
特征和
向量
汇编程序,它将特征转换为
向量
特征,只接受数字类型)。使用这种方法,将根据
分类
特征
的
频率(类别特征
的
最频繁标记为<
浏览 6
提问于2017-07-06
得票数 5
回答已采纳
6
回答
字符串作为决策树/随机林中
的
特征
、
、
、
、
在
一个
决策树/随机森林
的
应用中,我正在做一些问题。我试图适应
一个
问题,它有数字和字符串(如国家名称)作为功能。现在,科学知识-学习只使用数字作为参数,但是我想注入字符串,因为它们携带了大量
的
知识。我可以通过某种机制(如Python中
的
散列)将字符串转换为数字。但是我想知道在决策树问题中如何处理字符串
的
最佳实践。
浏览 0
提问于2015-02-25
得票数 85
回答已采纳
1
回答
转换为
一个
热
向量
的
字符串索引对于某些行是否为空(没有将索引设置为1)?
我有
一个
有
一个
分类
列
的
pyspark,该列正在通过.df = si.transformOneHotEncoderEstimator(inputCols=["LABEL_IDX"], outputCols=["LABEL_OH"]).fit(df)当我看数据后,我看
浏览 3
提问于2020-01-17
得票数 1
回答已采纳
1
回答
dense_20应具有形状(None,18827),但获得具有形状(316491,1)
的
数组
我在为keras (tensorflow后端)正确格式化我
的
标签时遇到了一些困难。我
的
模型接受
一个
嵌入( 128个数字
的
列表)作为输入,并输出18827个不同
的
数字(范围从1到20284)中
的
一个
,如下所示: [0.0344733819366,...,0.153029859066]categorical_crossentropy
的
one-hot
向量
时,我收到了
一个
MemoryError。似乎sparse_catego
浏览 0
提问于2018-01-13
得票数 0
2
回答
一种不存在测试
值
的
热
编码
序列
、
、
我有
一个
火车和测试集,作为数据存储。我正在尝试在我
的
数据集上对名义特征进行
一次
热
编码
。但我有以下问题: 总共有3个
分类
特性,但我不知道每个特性
的
值
是多少,因为数据集很大。测试集
的
值
不存在于火车集中,所以当我进行
一次
热
编码
时,训练集应该将未见
值
的
向量
标记为
0
。但正如我在1中提到
的</
浏览 1
提问于2019-09-15
得票数 11
回答已采纳
2
回答
一个
热
编码
与单词嵌入-什么时候选择
一个
或另
一个
?
、
、
、
我
的
一个
同事有
一个
有趣
的
情况,他有相当多
的
可能性来定义
一个
分类
特性(+/- 300不同
的
值
)。 通常
的
数据科学方法是执行
一个
单一
的
热
编码
。然而,用
一个
相当大
的
字典(+/- 300
值
)执行一些单一
的
热
编码
难道不是有点极端吗
浏览 0
提问于2018-04-03
得票数 16
回答已采纳
2
回答
如何建立
一个
神经网络,使它
的
输出只有
0
或1?
、
我有
一个
数据集(它有10000行): 我必须建立
一个
神经网络来预测列#1
的
值
(可以是
0
或
浏览 1
提问于2019-06-02
得票数 0
回答已采纳
2
回答
如果我
的
目标变量在使用决策树时是绝对
的
,我该怎么办?(许多范畴变量)
、
、
、
全
,我正在培训
的
数据集是标有标签
的
数据,标签是公司(附属变量)。我不知道该如何处理我
的
因变量,我是否应该对整个数据集使用
一个
热
编码
,然后将其分成训练和测试? 我不知道在我进入腐朽树之前是否要进行
一次
热
编码
。
浏览 0
提问于2020-04-06
得票数 1
1
回答
如何在人工神经网络中处理多个
分类
列?
、
、
、
、
目前,我在下面的中工作,其中有多个具有不同
值
的
列,我希望将每一行
分类
为正确
的
类别--在本例中,是正确
的
工程师。目标:基于类别、问题类别、受影响
的
设备、创建原因、发布状态和优先级,确定票属于哪个工程师。这是
一个
分类
问题,我用人工神经网络来解决这个问题。Feature scaling 问题 除了优先级列之外,所有列都已<e
浏览 0
提问于2018-06-23
得票数 0
回答已采纳
1
回答
在Keras中嵌入单词也是一种降维技术吗?
、
、
、
、
我想了解embedding_dim与使用整个vocab_size
的
一个
热
向量
的
目的,它是从vocab_size dim降到embedding_dim维度
的
一个
热
向量
,还是直觉上还有其他
的
效用?____________________________________________ flatten (Flatten) (None, 1920)
0
====
浏览 2
提问于2020-09-05
得票数 1
回答已采纳
2
回答
R与滑雪板中
的
随机森林
、
、
、
、
非常方便
的
是,R中
的
RandomForest接受输入(X)
的
因素。如果从带有
值
(a,b,c)
的
因子变量中构建
一个
节点,将其分解为(a,c)和(b),我假设这样做可以使构建树更容易。在sklearn中,我需要将所有内容
编码
为虚码(
0
,1),以便丢失a、b、c
向量
之间
的
任何关系。 我
的
解释正确吗?在滑雪板中有一种连接输入
向量
的
方法吗?如果我将变量
编码
浏览 6
提问于2017-08-10
得票数 3
2
回答
ImageDataGenerator.flow_from_directory无法对数据进行
一次
热
编码
。
、
、
我正在使用ImageDataGenerator (tensorflow Version2.5.0)加载许多用于
分类
系统
的
jpg文件。我已经指定了class_mode='categorical'。我
的
图像最初是RGB,但即使我将它们转换为灰度,我也不认为这应该重要。然而,当我调用train_set.classes时,我得到
的
数据不是
一个
热
编码
的
数据,而是稀疏
的
数值数据。调用train_set.classes时,将<e
浏览 6
提问于2021-08-06
得票数 1
回答已采纳
1
回答
LinearSVC是否接受定性数据?
、
、
我
的
输入数据:我已经将产品列
编码
为1s和
0
(如果没有打开
0
,则为1)。 像上下文这样
的
东西会对产品类型产生影响。我想知道是否需要使所有的
分类
变量都是数字
的
,以便LinearSVC来处理它们。
浏览 3
提问于2016-12-31
得票数 0
回答已采纳
2
回答
滑雪OneHotEncoder到底是如何工作
的
?
、
、
、
我正在尝试在泰坦尼克号数据集(熊猫数据集)
的
一个
子集上使用sklearns。默认情况下,
编码
器根据每个特性中
的
唯一
值
导出类别。或者,您也可以手动指定类别。并且声明我不需要指定类别,因为它是自动完成
的
。 [1.
0
.
0
. ...
0
.
0
. 1.] [
0
.
0
. 1. ...
0
.
0</e
浏览 1
提问于2020-12-30
得票数 0
回答已采纳
1
回答
如何解释星火OneHotEncoder
的
结果
、
、
、
我从星火博士那里读了OHE
的
条目, (
0
, "a"),(2, "c"),
浏览 2
提问于2017-02-17
得票数 15
回答已采纳
2
回答
在字符
向量
中查找由逗号分隔
的
唯一
值
,然后进行
一次
热
编码
。
、
、
基本上,我有
一个
由逗号分隔
的
字符串
向量
。我希望使用字符串
的
唯一
值
进行
一个
热
编码
。我认为我必须首先找到唯一
的
值
(用逗号分隔),以便在
一次
热
编码
之前作为列使用,但我不确定。例如,假设我有以下字符
向量
:Bob,Megan,Mike,SarahMegan,Sarah我希望创建
一个</e
浏览 0
提问于2018-10-03
得票数 2
回答已采纳
2
回答
Keras目标
向量
自动转换为单一
热
?
、
、
、
y_train
的
形状就是(60000,),这表明它是
一个
包含数字目标标签(
0
-9)
的
一维
向量
。 为了进行数字
分类
,神经网络一般输出
一个
热
编码
向量
,该矢量具有十个维数。我认为我需要使用to_categorical将y目标从数字转换为
分类
,以便使神经网络
的
形状输出与训练样本相匹配,这可能是(60000, 10)。当神经网络
的
输出层为y_train.shape时,(60
浏览 8
提问于2020-06-20
得票数 5
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
特征工程(一)
Hsigmoid加速词向量训练
Tensorflow2.1实践-IMDB影评文本分类(Kears
机器学习中的独热编码
《Deep Learning with Python》第三章 3.5 走进神经网络之新闻多分类
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券