腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
基于
来自
单
热
编码
列
的
多个
条件
的
子集
数据
帧
、
1 07 1 1 1 1 我希望获得is_happy、is_sad和is_sorry等于1
的
行预期输出: id is_happy is_sad is_mad is_sorry 7 1 1 1 1 如果不像下面这样使用切片器设置
多个
条件
,我如何做到这一点呢
浏览 21
提问于2021-03-31
得票数 1
2
回答
将
单
热
编码
的
数据
帧
转换为计数
、
我有一个名为行业
的
专栏,我对其进行了
热
编码
,如下所示:一些观察值可以属于
多个
行业,并且有重复
的
if,如果它是重复
的
,我只想计数一次。0 1 06 0 1 1 0 如何将这个
单
热
编码
的
数据
帧
转换为可以绘制每个
单
热<
浏览 36
提问于2021-03-30
得票数 0
1
回答
根据列名将一个
热
编码
列
滚动到不同
的
列
中
、
我有一个
数据
帧
已经是
单
热
编码
的
。
热
编码
列
的
列名,以主列名加_开头,然后是该
列
的
特定类。例如,如果某一
列
是性别
列
,并且该
列
中
的
值是男性和女性,则
热
编码
列
是gender_male、gender_female。所以现在我想把它回滚到主
列
,在那里我
浏览 14
提问于2021-09-10
得票数 1
2
回答
从其他熊猫栏创建新栏目
、
、
、
我想从
列
创建一个新
的
列
。“类型”
列
包含一个或
多个
类型,我希望为每个类型名称创建一个
列
。然后,我想在每个专栏中填写1和0,这取决于它们是否有这种类型。 我对此毫无头绪。 我不需要这样
的
东西
浏览 6
提问于2022-05-12
得票数 0
回答已采纳
1
回答
如何使用
编码
的
特征来预测sklearn中
的
值?
、
、
、
、
我当前
的
数据
框如下所示: salary job title Raiting Company_Name Location Seniority Excel_needed2 230 QA 5 google sd Sr 1 现在,在对
多个
类别应用sklearn
的
Onehotencoding后,我得到了一个令人满意
的
模型分数,并希望根据它们<em
浏览 6
提问于2020-08-20
得票数 0
回答已采纳
2
回答
在pandas
数据
帧
上按
列
应用seaborn
热
图
、
、
、
我试着在旋转
的
熊猫
数据
框上使用
热
图表单海运,就像在超链接中一样。','B']sns.heatmap(df, annot=True, fmt="d", linewidths=.5,cmap="RdYlGn") 输出选择45作为最小值,86作为最大值,并对整个
数据
帧
进行颜色
编码
但我无法做到
的
是按
列
应用
热
图,例如逐
列
应用
条件
格式
浏览 3
提问于2017-05-17
得票数 5
2
回答
如何在python中转换为整洁
的
格式?
、
我
的
pandas
数据
帧
有单独
的
列
,这些
列
是一
热
编码
的
,最后有一个合计列(total = val1+val2)。对于
多个
val
列
,某些行具有1: | name | val1 | val2 | total | | bob | 0 | 1| 1 | | dan | 1 | 1 | 2 | 我想要
的
浏览 19
提问于2019-06-20
得票数 0
1
回答
调用
多个
dataframe列名以生成新
的
dataframe键错误
、
、
经过一次
热
编码
2种不同
的
功能,然后将得到
的
一次
热
编码
列
与Pandas中
的
原始
数据
have连接起来,我就有了3个
数据
格式。 第一个是OneHotZips (它包含我
的
一个
热
编码
特性#1)。第二个是OneHotYearBuilt (相同
的
东西,也就是我
的
特性#2作为
数据
帧
中
的
一个
浏览 0
提问于2019-03-11
得票数 0
回答已采纳
1
回答
通过get_dummies和pivot_table在熔体上连接后
的
One-Hot
编码
、
我有一些
数据
,我希望在添加一些标签后进行一次
热
编码
。下面的代码适用于玩具示例,并且是我在类似上下文中采用
的
方法。然而,它并不具有伸缩性。例如,使用此
数据
帧
:import numpy as np df = pd.DataFrame({'id' : [1, 2],因此,直接pd.get_dummies(df, prefix = '', prefix_sep = '', columns =
浏览 2
提问于2018-08-10
得票数 0
回答已采纳
1
回答
在
单
热
编码
ML工作负载中,何时使用暗阵列与dask
数据
帧
、
我有一个
数据
集,它是一个巨大
的
、短
的
、胖
的
矩阵(大约4000 x 20,000,000)。我认为dask对我来说可能是一个很好
的
解决方案。但是,我希望确保可以将其
编码
为一个
单
热
矩阵。我查看了dask-ml中
的
选项,它们似乎总是需要一个dask
数据
帧
。然而,创建一个有2000万
列
的
数据
帧
似乎真的很奇怪,而且可能会导致大量开销。使用
浏览 9
提问于2018-02-14
得票数 2
1
回答
一次
热
编码
-将多列
编码
为一
列
、
我想
编码
一个
数据
帧
,它有
多个
相同“类型”
的
列
,例如:1 Italy Frankfurt France Naples 如何通过传入应视为一
列
的
索引,使
浏览 22
提问于2018-02-08
得票数 3
1
回答
R语言:方括号表示法
对于一个研究项目,我有一个相对较大
的
代码块,需要相当长
的
时间才能运行。需要缩短此程序运行所需
的
时间,因此运行profr来查看哪些函数占用
的
时间最多。问题是,我不理解这个符号。我意识到它们一定是R中用于创建新
数据
帧
和
子集
数据
帧
的
某种内部结构,我只是不知道是哪种。 谢谢。
浏览 3
提问于2012-07-10
得票数 1
回答已采纳
2
回答
一类变量
的
单
热
向量表示与标签
编码
我
的
数据
集中有一个字符串类型
的
分类变量。我需要把它转换成数值,以便进一步处理。我知道表示分类
数据
的
标准方法是使用一种
热
编码
。但这将把变量
的
每个条目转换为一个向量。sklearn
的
LabelEncoder将每个条目转换为标量值。我意识到这是一个非常天真,可能也很愚蠢
的
问题,但哪种表达方式更常用,是否有理由产生这种偏见?
浏览 0
提问于2016-01-13
得票数 3
1
回答
如何使用Keras.to_Categorical在dataFrame中一次对多
列
进行
热
编码
?
、
、
、
、
我想使用Keras to_categorical一次对我
的
数据
框中
的
多
列
进行
单
热
编码
。该怎么做呢?Item_Fat_Content', 'Outlet_Location_Type', 'Outlet_Type', 'Outlet_Size', 'Item_Type_Combined', 'Outlet'] 这些是我需要进行一次
热
编码</
浏览 19
提问于2019-05-06
得票数 4
回答已采纳
3
回答
子集
数据
仅包含名称与使用data.table
的
多个
条件
匹配
的
列
、
、
这是
基于
这个。问题是: 我如何仅
基于
包含上述文本部分(例如,ABC或XYZ)
的
列
来
子集
我
的
df?我可以使用索引,但是
列
在
数据
中太分散了,而且变得太难
编码
了。另外,我希望只
浏览 7
提问于2022-07-08
得票数 0
回答已采纳
1
回答
python中
的
单
变量回归
、
、
在python中,需要在
数据
帧
中
的
一
列
和同一
数据
帧
中
的
其他几列之间运行
多个
单
因素(
单
变量)回归模型 因此,
基于
图像,我想运行x1 & dep、x2 & dep等等之间
的
回归模型 想要输出-beta,intercept,R-sq,p-value,SSE,AIC,BIC,残差
的
正态性检验等
浏览 13
提问于2019-07-08
得票数 1
回答已采纳
3
回答
根据
条件
获取行,并将它们分成
子集
、
、
、
、
我尝试根据
条件
设置
数据
集
的
子集
,并选择行,直到它看到
基于
条件
的
值
条件
,如果A
列
== 0,则B
列
应以'a‘开头。
数据
集: A B1 ss3 ff1 ff3 gg1 hh0 jj 1 ll期望值: [0:{'A':[0,1,2,3], '
浏览 8
提问于2020-11-05
得票数 0
1
回答
如何使用值多次存在
的
条件
编写
子集
(就像SQL操作符一样)
、
我正在尝试对
数据
帧
进行
子集
,
条件
是特定
列
包含很少特定
的
userID。subset(df, df$userID===100 & df$userID===101 & df$userID===104 & df$userID===106) 现在,我不想用
多个
条件
编写这样
的
语句,稍后,我
的
目标是有这样
的
东西:userID<-c(100,101,104,106),并将其集成到<em
浏览 2
提问于2014-06-02
得票数 0
回答已采纳
1
回答
基于
多个
条件
的
数据
帧
的
多个
子集
、
目前,我有一个有18
列
的
数据
帧
。我想根据
数据
框中其他六
列
中
的
数据
组合,对其中一
列
"present“中
的
数据
进行
子集
,然后将其保存到文本文件中。我想用来设置"present“
子集
的
列有:*p.num (1:18) *session (1:2)
浏览 3
提问于2013-04-07
得票数 2
回答已采纳
1
回答
如何使用相同
的
处理管线来处理训练和测试
数据
,当它们产生不同
的
最终特征时
、
、
、
、
我正试图建立一个回归模型来预测一些房屋销售,我面临着同样
的
处理火车
数据
和测试
数据
(这不是从培训集本身获取
的
验证
数据
)
的
问题。我正在执行
的
处理步骤如下: 删除空值>50%
的
列
,将其余包含空值
的
列
归为,对分类
列
进行一次
热
编码
。假设我
的
列车
数据
有以下列(标签提取后)(*中
的
列
浏览 4
提问于2020-07-19
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
云直播
活动推荐
运营活动
广告
关闭
领券