腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
基于
多个
二进制
列
创建
新
的
分类
变量
、
、
、
、
我有一个包含许多
二进制
变量
的
数据框,我想
创建
一个
新
变量
,其中包含
基于
这些
二进制
变量
的
分类
值 我
的
数据帧如下所示 gov_winner corp_winner in part0 0 0 0 1 我要
创建</em
浏览 22
提问于2020-01-13
得票数 1
回答已采纳
2
回答
盲特征工程
、
、
、
我收到了一个分析数据集,其中有~100个带有匿名列名
的
数字
列
(X1、X2、X3等.)并要求进行
二进制
分类
。
基于
SVM
的
分类
算法具有较好
的
分类
精度(> 95%),但由于对
列
没有直觉,除了标准标度、零值替换等外,我无法在特征工程或特征生成方面做更多
的
工作。对于如何进行某种自动特性生成,即各种
列
的
简单数学组合以
创建
新
的<
浏览 0
提问于2019-07-30
得票数 3
1
回答
在多列上使用grep
创建
R中
的
新
变量
、
我正在尝试跨
多个
列
运行grep,以便在我
的
数据集中
创建
一个
新
的
二进制
变量
。中
创建
一个
新
的
二进制
变量
,如果”早餐“或”午餐“
列
包含"apple”,则为1;如果没有包含“apple”,则为0。(grepl("apple", df$lunch), 1, 0)) 然而,在我
的
真实数据集中,我需要扫描
浏览 11
提问于2022-09-07
得票数 0
回答已采纳
1
回答
降维与特征工程
的
现代方法
、
、
、
、
我正在用Python训练
二进制
分类
器,以估计信用申请者
的
风险水平。我提取了一千
多个
自
变量
来模拟四百万人
的
观察行为。我
的
目标是一个
二进制
列
,它告诉我一个人是否拖欠贷款(1用于事件,0用于非事件)。我想知道一些常用
的
和现代
的
方法:在其他功能组合
的
基础上
创建
新功能(功能工程) 到目前为止,我删除了
基于
它们
的
信息值<
浏览 0
提问于2020-12-05
得票数 1
回答已采纳
1
回答
什么是sklearn category_encoders中
的
TargetEncoder和BinaryEncoder?
、
、
、
我一直在寻找一种向量化
分类
变量
的
方法,然后我遇到了category_encoders。它支持多种
分类
方式。我尝试过TargetEncoder和BinaryEncoder,但文档中并没有详细解释它
的
工作原理?如果有人能解释一下目标编码器和
二进制
编码器是如何工作
的
,以及它们与一个热门编码有什么不同,我真的很感激。
浏览 0
提问于2019-03-28
得票数 0
2
回答
寻找数字编码
的
分类
变量
之间
的
相关性?
、
、
、
所以我有一个包含
分类
变量
的
数据集。我已经根据类别x
的
数量从0:x对每个类别进行了编码。我试图找到
变量
(数字和
分类
)与目标
变量
(也是
分类
变量
,但已编码为0表示否,1表示是)之间
的
相关性。我已经能够对所有
变量
(大约有17个)运行此代码,它似乎确实起作用了,但我质疑相关性是否正确。我以前没有在我
的
数据集中计算过与
分类
变量
的
相关性,只想
浏览 2
提问于2017-11-16
得票数 0
1
回答
“决策树”/“随机森林”算法中
的
二进制
编码
、
、
、
在包含基数很高
的
分类
列
的
数据集中使用
二进制
编码可以吗?关于我
的
数据集
的
一些事实:其中一个范畴
变量
具有1,700个唯一值。作为一个领域专家,我确信那些基数较高
的
分类
列
是强有力
的
预测
浏览 0
提问于2018-10-03
得票数 3
2
回答
如何处理范畴
变量
、
、
我是数据科学
的
新手,对
分类
变量
有一个问题。我
的
数据集有2
列
字符串-出发城市和到达城市。120 | 200 | 4 |因此,这两
列
中都有很多
分类
变量
,而且这些
列
都很重要(它们
的
值依赖于其他
列
)。而且,不可能像一些教程中所建议
的</em
浏览 0
提问于2017-10-14
得票数 0
1
回答
转换多
列
中
的
范畴列作为R中
的
因子
、
我有一个像这样
的
数据,其中可能有
多个
数字
列
和
多个
分类
列
。在这种情况下,每个类中只有一个。 我已经搜索了这个论坛,并发现了一些与我
的
问题,但布尔
变量
。我确信代码会非
浏览 3
提问于2018-03-22
得票数 0
回答已采纳
1
回答
处理包含
多个
非序数
分类
功能
的
Pandas数据帧
、
、
、
我目前正试图分析一个包含
多个
非序数
分类
特征和一个
二进制
目标
变量
的
数据集。| cat 50 | cat 450 | 1 |整个表是400.000行x15
列
,其中最后一
列
是目标
变量
。每个特性都有
多个
非序数类别,从9个类别到数百个类别不等。 我
的
第一反应是对所有的
分类
变量
进行
浏览 0
提问于2020-06-03
得票数 1
回答已采纳
2
回答
基于
日期范围
创建
带有
分类
变量
的
新
列
、
、
、
如果我有这样
的
数据,让我们
的
日时刻表日期一年(2019年)-0 15.02.19 13:002 15.02.19 15:004 15.02.19 17:00 我想要
创建
一个
新
的
专栏,如果我
的
约会时间在一个范围内(从2019年开始
的
学校假期)和‘学期时间’,那么它
的
价值是‘学校假期’,否则我将如何以最有效
的
方式来处理这个问题得到<e
浏览 7
提问于2020-02-14
得票数 1
回答已采纳
1
回答
如何处理标号
分类
和标签编码?
、
、
、
、
drum 1.14 aadi creative drum 1.43 2 0 1 2现在,它正在转换每一
列
,但每
列
的
数值范围从0到5不等。仪器
变量
现在类似于“same”
浏览 0
提问于2018-07-31
得票数 0
回答已采纳
1
回答
R:如何
基于
多个
条件
创建
新
的
分类
变量
、
、
、
嗨,我是R
的
新手,所以这可能有一个简单
的
解决方案,但我似乎不能解决它。 我正在处理那些正在谈恋爱的人
的
数据。我
的
数据子集有三个
变量
familyID和var1female,以及var1male (得分为0从未经历过行为或1[经历过行为),有超过9000个观察值。我想
创建
一个具有4个级别的
新
分类
变量
,用于显示是否以及谁参与了var1描述
的
行为( 0=从未经历过,仅限1=女性,仅限2=male,以及女性和男性
的</
浏览 303
提问于2021-09-06
得票数 1
回答已采纳
1
回答
数据帧中多
列
的
LabelBinarizer
、
、
、
我有一个csv文件,其中有25
列
--有些是数字
的
,有些是
分类
的
,有些是演员、导演
的
名字。我想对这些数据使用回归模型。为此,我必须使用LabelBinarizer包将
分类
列
字符串类型转换为数值。如何在具有
多个
分类
数据
的
数据上使用LabelBinarize? 本质上,我希望对标签进行
二进制
化,并将它们添加到dataframe中。在下面的代码中,我检索了想要
二进制
化
的</e
浏览 0
提问于2016-11-07
得票数 6
2
回答
根据其他
列
中
的
值添加
列
创建
一个
基于
if chance.of.admit > 0.5
的
二进制
列
我需要遍历chance吗?我该如何循环更改并添加一个带有1和0
的
新
列
呢?有没有更好
的
方法?
浏览 2
提问于2021-06-18
得票数 0
1
回答
基于
多个
不同值
创建
新
列
、
、
下面的代码
创建
了一个
新
列
,该
列
基于
一个
列
的
多个
不同值,该
列
具有不同
的
值,这些值表示类似的东西,如汽车、Van或Ship、Boat、Submarine,我希望所有这些值都在
新
列
(如Vehicle或Boat)中
的
相同值下
分类
。具有简化数据集示例
的
代码: if row['A'] ==
浏览 2
提问于2020-01-13
得票数 0
回答已采纳
1
回答
科学学习
的
OneHotEncoder使所有的
列
都是绝对
的
吗?
、
、
、
、
我一直在使用Scikit-Learn
的
OneHotEncoder将
分类
数据转换为
二进制
列
,但是,将OneHotEncoder与具有数值和
分类
变量
的
数据集相匹配似乎也会使其为数值数据
创建
二进制
列
。我已经尝试在文档中搜索一个明确
的
答案,但找不到答案。OneHotEncoder是否自动避免编码数字
列
?如果不是,我怎样才能不分裂和重新连接数据文件,用它来制作管道呢?
浏览 0
提问于2022-11-24
得票数 0
回答已采纳
2
回答
如何根据R中
的
两个范畴
变量
创建
一个
新
变量
?
、
我有两个
分类
变量
a& b。a = sample(0:1, size=10, replace=T )我想要
创建
一个
新
的
变量
c,它
的
值以这样
的
方式依赖于a&vector(length=10)c[a==1 & b==0] = 2c[a==0 & b==0]
浏览 5
提问于2014-06-29
得票数 2
回答已采纳
1
回答
如何将从单个
分类
变量
创建
的
多个
虚拟
变量
列
合并为python中
的
单个
列
?
、
、
、
我正在处理IPL数据集,它有许多
分类
变量
,其中一个
变量
是toss_winner。我已经为此
创建
了虚拟
变量
,现在我有15个带有
二进制
值
的
列
。我想将所有这些
列
合并成一个
列
,编号为0-14,每个数字代表IPL团队。
浏览 2
提问于2020-06-02
得票数 2
回答已采纳
2
回答
使用
列
中
的
二进制
值连接列名
、
02/23/2020 0 1 102/25/2020 1 0 1
二进制
列
包含整数date“
列
是一个DateTime对象。我想
创建
一个
基于
二进制
列
的
新
分类
列
,如下所示 date
浏览 0
提问于2021-04-27
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习中的独热编码
Uber 宣布开源 AI 工具箱,免代码训练和测试学习模型
one-hot encoding不是万能的,这些分类变量编码方法你值得拥有
【视频】为什么要处理缺失数据?如何用R语言进行缺失值填充?
数据准备指南:10种基础特征工程方法的实战教程
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券