腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
基于PySpark数据的自定义
聚合
、
、
、
、
我有
一个
PySpark DataFrame,它有
一个
列作为
一个
热
编码
向量。我想在群后通过矢量加法来
聚合
不同的
热
编码
向量。PySpark和
聚合
操作不支持向量加法。
浏览 4
提问于2016-12-07
得票数 12
3
回答
聚合
一个
热
编码
、
我在考虑对每个小时的“weather_forecast”特征进行一次
热
编码
,然后将这些值相加。sunny10:00 sunny12:00 rain在
一个
热
编码
中这个
编码
有名字吗(我在网上找不到)。
浏览 24
提问于2019-07-25
得票数 1
回答已采纳
1
回答
用不同的agg方法对不同的栏进行分组
、
、
下面是
一个
场景: 我希望按列X分组,并将数字列按“平均值”
聚合
,一些列按“最后”进行
聚合
,而将
热
编码
的列按“和”进行
聚合
。所有的方法都是一样的。由于我们讨论的是314列数据集,所以我不能只创建
一个
浏览 1
提问于2019-05-03
得票数 0
1
回答
绘制英国邮编到地理边界的地图
、
、
、
我有
一个
带有(英国)邮政
编码
列和
一个
计数列的dataframe。postcode countPO167GZ 22L18JQ 38 我希望使用folium创建这个数据的
热
图,其中计数按照较大的(例如县级)地理多边形进行
聚合
。有几个将邮政
编码
映射到lat/long的,但是是否有将邮政
编码
映射到更大的英国地理区域(例如县级)的python库或资源?
浏览 2
提问于2020-04-11
得票数 0
回答已采纳
1
回答
混合特征的Sklearn管道:数值和(倾斜)分类
、
、
我已经对数据做了一些预处理(缺少值、类别
聚合
、选择序号和单
热
)。我正在尝试实现
一个
管道,以简化代码。管道由
一个
包含两个组件的ColumnTransformer组成:
一个
组件包含
一个
应用于数值和序号特征的标准定标器;第二个组件有
一个
用于其余特征集的
一个
热
编码
器。我将这个转换器传递给
一个
GridSearchCV对象来调优超参数。在这种情况下,它是
一个
套索模型。所以,我试着调整惩罚项的系
浏览 0
提问于2020-03-18
得票数 2
回答已采纳
2
回答
聚合
多个
编码
的分类值
、
、
、
我目前正在使用
一个
具有特征类别的数据集,其基数为20,000。一次
热
编码
没有意义,它会增加太多的特征空间。我已经成功地对特性中的每个单独值进行了
编码
,但不确定如何为每一行
聚合
这些值。 如何组合这些
编码
值?
浏览 0
提问于2020-03-26
得票数 1
2
回答
降维在OneHotEncoded阵列中的应用
、
、
我有
一个
包含混合变量的非常大的数据集。我已经使用OneHotEncoding将分类变量转换为数值变量,它产生了超过几千个不同的特性,即组合。
浏览 0
提问于2018-02-19
得票数 8
回答已采纳
1
回答
合适的集合(均值、中值或其他什么)来生成特征?
、
、
我使用相同信号(n值)的多个
聚合
(m值)来创建一组相对较大的~100特征集(m*n值)。谢谢。
浏览 0
提问于2017-05-15
得票数 -1
1
回答
分类器
编码
、
、
、
、
我对
编码
(我不熟悉这些任务)的分类变量有一些疑问,以便将它们作为像logistic回归或支持向量机这样的模型中的参数。由于要使用分类器,我需要对分类字段进行
编码
,通过在sklearn中使用MultiColumnLabelEncoder,我已经尝试如下: MultiColumnLabelEncoder(columns =然而,我明白,同样
一个
编码
器应该更好。我还包括帐户,因为可能有更多的评论来自同
一个
帐户,所以如果我把
一个
帐户归类为假的,并且从同
一个
帐户收到
一个<
浏览 0
提问于2020-08-24
得票数 1
回答已采纳
2
回答
在
一个
热
编码
的数据上进行
聚合
、
、
假设我有
一个
在中包含10000部电影的数据集,其中包含数据集的
一个
ercerpt我有
一个
代码要点,它加载我的数据集并对其执行一些更改。这里只使用
一个
类型列的子集。关于第
一个
问题,我在想Action 7.837500 103237
浏览 0
提问于2018-10-11
得票数 1
回答已采纳
1
回答
聚合
目标
编码
的类似数组的分类特征?
、
、
一次
热
编码
会导致很高的维度。我使用的方法是目标
编码
/均值
编码
。我理解如何使用这个分类功能是
一个
单一的选择(如当前的邮政
编码
)。但是,当这个功能可以从
一个
大的列表中获得多个值(例如最喜欢的爱好、疾病症状、大学课程)时,我不知道如何将这些价值观结合起来。我的直觉说,错误的方法是把每
一个
独特的组合作为自己的因素,并
编码
它,因为它会导致过度适应。想到的其他事情是简单的
聚合
,如sum/avg/积&
浏览 0
提问于2019-04-09
得票数 3
1
回答
目标/输出标签的一种
热
编码
与标签
编码
的区别
、
、
、
我遇到了
一个
问题,那里有20节课。我设计了
一个
神经网络,并使用损失作为categorical_crossentropy。y_train_le = le.fit_transform(y_train) y_t
浏览 4
提问于2022-08-07
得票数 -1
1
回答
一种
热
编码
和pandas.categorical.code有什么区别?
、
、
、
、
我正在处理一些问题,并对以下几点表示怀疑:array(['1 bath', 'na', '1 shared bath', '1.5 baths', '1 privateshared baths', '8 baths',如果我使用计数Vectorize将它们转换为
浏览 4
提问于2021-01-10
得票数 1
回答已采纳
1
回答
聚合
时获取
一个
热
编码
值的比例- Pandas
、
、
我有
一个
这样的df,1 2019-04-01 13 2019-10-01
浏览 0
提问于2020-06-03
得票数 0
1
回答
输出标签的一种
热
编码
、
、
虽然我知道需要对输入数据中的功能进行
热
编码
,但输出标签的
热
编码
实际上有什么帮助呢?张量流MNIST教程鼓励对输出标签进行一种
热
编码
。然而,CS231n(斯坦福大学)的第
一个
任务并没有建议使用一种
热
编码
。选择/不选择
一个
热
编码
输出标签的理由是什么?话虽如此,即使没有对输出标签进行
热
编码
,也可以计算损失。
浏览 1
提问于2018-07-17
得票数 3
2
回答
变换
热
编码
、
、
、
、
August我希望结果是这样的:001 1 1 1我尝试过one-hot
编码
浏览 38
提问于2021-07-14
得票数 1
1
回答
一种具有稀疏分类熵抛出错误的
热
编码
、
、
、
、
在我为它编写的程序中,我不需要使用"to_categorical“来对我的数据进行
热
编码
,它仍然有效。当我尝试对它进行
热
编码
时,它不起作用。我搞不懂为什么会发生这种情况,因为通常
一个
人应该对他们的输出进行正确的
编码
?如果有人能帮助澄清这一点,那就太好了!
浏览 7
提问于2020-06-16
得票数 0
回答已采纳
1
回答
Skitlearn ValueError:无法处理多类和多标签指示符的混合
、
、
我想用Skitlearn训练和测试我的数据,但是我得到了ValueError:无法处理多类和多标签指示符错误的混合。这是我的代码: activation="logistic", max_iter=EPOCH_COUNT, learn
浏览 2
提问于2017-04-27
得票数 0
回答已采纳
1
回答
只有两个值的范畴变量
、
、
、
、
我不确定是否使用“单
热
编码
”或标签
编码
“方法”来训练我的模型。我正在研究
一个
分类问题,并使用一些有监督的机器学习算法。对于只有两个值的范畴变量,应该使用哪种方法来转换变量?
浏览 5
提问于2019-12-05
得票数 0
2
回答
为什么单
热
编码
器可以避免这样的情况:如果数据是标签
编码
的话,模型会误解数据的某种顺序。
、
、
、
我们知道,在处理非序数数据时,我们更喜欢使用单
热
编码
而不是标签
编码
。 提前谢谢。
浏览 0
提问于2019-04-25
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习中的独热编码
邓白氏编码只办理一个编码流程
核心交换机的链路聚合、冗余、堆叠、热备份
如何发起一个“编码女孩部落”
“攥指成拳”凝聚合力 “品牌出海”成为义乌热词
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券