腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Pandas
:
从
列
中
的
值
创建
虚拟
变量
、
、
、
、
我有一个数据框,其中有一个名为Actors
的
列
,其中每个单元格都包含一个类似以下"Abigail Breslin, Greg Kinnear, Paul Dano, Alan Arkin"
的
字符串。我希望在(",")上拆分这个字符串,这样单元格就可以包含每个参与者
的
列表,即["Abigail Breslin", "Greg Kinnear, "Paul Dano, "Alan Arkin"],这样我就可以为每个唯一
的
浏览 20
提问于2020-03-28
得票数 0
1
回答
熊猫-只有特定
的
价值才能得到假人。
、
、
我有一个由10000行组成
的
Pandas
系列,其中填充了一个字母,
从
A到Z。但是,我想使用
Pandas
get_dummies为A、B和C
创建
虚拟
数据帧。我该怎么做?我不希望获得
列
中所有行
值
的
虚拟
值
,然后选择特定
的
列
,因为该
列
包含其他冗余数据,这些数据最终会导致内存错误。
浏览 2
提问于2015-11-03
得票数 8
回答已采纳
4
回答
在熊猫中用多个
值
的
列
创建
假人
、
、
、
我正在寻找一种pythonic
的
方法来处理以下问题。现在,我需要处理这件事。一个
列
,让我们称之为“标签”,具有类似于
浏览 1
提问于2013-09-19
得票数 37
回答已采纳
1
回答
如何根据
变量
在
列
中出现
的
次数对
变量
进行分组?
、
、
、
我正在尝试使用几个分类
变量
在Python
中
运行回归。所以我想把它们变成假人。然而,我在这里有一个问题。我正在处理
的
专栏有一些重复
的
类别,如果我应用
虚拟
转换,我会得到5000个
虚拟
的
。因此,我考虑对出现几次
的
类别进行分组。我该怎么做呢?例如,类别1出现了2000次,类别2出现了3000次,但类别4、5和6各出现了30次,类别7出现了10次,类别8出现了5次。这样做:如果该类别出现
的
次数少于X次,则对其进行分组。结果应该是group 1、
浏览 6
提问于2020-05-06
得票数 0
回答已采纳
1
回答
来自两个字段
的
唯一
值
索引
、
我是
pandas
和python
的
新手,绝对需要一些帮助。 我有下面的代码,它几乎就是我想要
的
。它为字段
中
的
唯一
值
创建
虚拟
变量
,并通过其他两个字段
中
唯一
值
的
唯一组合对它们进行索引。我想要
的
是用于索引
的
字段
的
每个唯一组合只有一行。现在,如果
虚拟
变量
出现3次,我会得到多个行,比如'asse
浏览 0
提问于2014-05-30
得票数 0
3
回答
从
值
列
创建
虚拟
变量
列
、
、
我知道
Pandas
有一个get_dummy函数,您可以使用它将分类
变量
转换为DataFrame
中
的
虚拟
变量
。我想做
的
事情有点不同。 我有一个
列
,包含0.0到100.0之间
的
百分比值。我需要将其转换为一个
列
,该
列
对于任何
值
>= 10.0都有1s,对于任何
值
< 10.0则为0。这里是否有一个好
的
方法来完成这个重新定位
的
g
浏览 5
提问于2017-02-23
得票数 1
回答已采纳
2
回答
从
其他熊猫栏
创建
新栏目
、
、
、
我想从
列
创建
一个新
的
列
。“类型”
列
包含一个或多个类型,我希望为每个类型名称
创建
一个
列
。然后,我想在每个专栏
中
填写1和0,这取决于它们是否有这种类型。 我对此毫无头绪。 我不需要这样
的
东西
浏览 6
提问于2022-05-12
得票数 0
回答已采纳
1
回答
从
分类
虚拟
变量
创建
虚拟
变量
、
我有一个
值
从
0到22
的
变量
,我想为支持向量机
创建
一个
变量
,它将该数据拆分如下: 0:取值范围为0- 12; 1:包含13到22之间
的
值
。 如何从这个
变量
生成一个
虚拟
对象?我正在使用
pandas
和sklearn。
浏览 28
提问于2021-06-18
得票数 0
回答已采纳
1
回答
如何在不具有多重共线性
的
熊猫
中
创建
虚拟
变量
?
、
、
、
、
使用Anaconda、Python 2.7.11、熊猫0.17.1、Mac OS X 10.11 (El Capitan),如何在拟合统计模型时,
从
正在制作
虚拟
变量
的
列
中
删除一个
虚拟
变量
,以避免多重共线性(或
虚拟
变量
陷阱)?如果一个人进入:s = pd.Series(list('abca'))返回<e
浏览 4
提问于2016-02-01
得票数 3
回答已采纳
1
回答
使用sk-learn进行分类:在预测时处理丢失
的
分类特征
、
、
我
的
项目我训练了一个BaggingClassifier。由于使用
的
数据包含分类特征,因此我使用
pandas
框架(Get_dummies)对其进行编码。在此之后,我训练分类器。预测数据集内
的
给定特征:6原始训练数据集35 |
浏览 6
提问于2015-05-06
得票数 3
2
回答
如何识别200+数值
变量
中
的
范畴
变量
?
、
、
、
我有一个有200+数值
变量
(类型:int)
的
数据集。在这些
变量
中
,有几个
变量
的
值
为(0,1),(0,1,2,3,4)等。 我需要识别这些分类
变量
并对它们进行
虚拟
化。识别和
虚拟
它们需要花费大量
的
时间--有什么方法可以轻松地做到吗?
浏览 4
提问于2017-11-03
得票数 3
回答已采纳
1
回答
如何将
Pandas
Dataframe中所有类别类型
的
列编码为
虚拟
变量
、
、
我有一个潘达斯
的
数据与大量
的
分类
列
,我希望传递给科学-学习。由于scikit-learn只接受数组作为参数,所以我需要将所有的分类
列
转换为
虚拟
变量
。例如,我有一个包含"Christian“、”穆斯林“和”印度教“类别的宗教
列
,它们应该转换为三个
虚拟
变量
,根据这些
值
设置为0或1。我找到
的
最佳解决方案是将数据分解为范畴
变量
和非范畴
变量
,然后对所有的范畴<em
浏览 4
提问于2015-11-01
得票数 2
回答已采纳
1
回答
创建
虚拟
变量
掩码
的
最好方法?
、
例如,我有一个包含城市名称
列
的
pandas
DataFrame,并且我已经有了一个大型预定义
的
城市名称列表,这些城市名称将在模型中用作
虚拟
变量
。我希望列表
中
的
每个城市名称都作为新
列
添加,然后用一串0和1填充,其中城市名称
列
中
的
字符串与
虚拟
变量
的
列名相匹配。
从
我
的
角度来看,我需要做
的</
浏览 26
提问于2018-06-02
得票数 0
10
回答
在python
的
pandas
中
创建
虚拟
变量
、
我正在尝试使用python
中
的
pandas
从
分类
变量
创建
一系列
虚拟
变量
。我遇到过get_dummies函数,但每当我尝试调用它时,我都会收到一个错误,指出该函数
的
名称尚未定义。任何
创建
虚拟
变量
的
想法或其他方式都将受到欢迎。import
pa
浏览 261
提问于2012-07-21
得票数 44
回答已采纳
2
回答
在
Pandas
中
创建
一个
虚拟
变量
而不制作副本
、
、
我想在
Pandas
中
创建
一个
虚拟
变量
,如果5
列
文本
中
的
任何一
列
包含特定字符串,则该
变量
的
值
为1。我在一个较大
的
数据集上做了大约一千次这样
的
操作,但大小不应该是无法管理
的
-它大约是一个零工(大约100万行)。在我看来,上面的代码一定是在以某种方式
创建
副本,因为我机器上
的
内存使用量增长到了80 b
浏览 1
提问于2015-02-28
得票数 1
2
回答
循环,将
创建
新
的
Pandas
.DataFrame
列
。
、
、
、
、
在之后,如果我们有一个名为colors
的
列
的
Pandas
.DataFrame,我们如何
创建
一个循环来循环所有DataFrame
的
列
(或包含所需
列
的
列表),从而使所有类别
变量
(例如。
变量
colors (可以具有
值
blue、red、purple)将被
虚拟
变量
列
( colors#blue、colors#red、colors#purpl
浏览 2
提问于2013-05-05
得票数 0
回答已采纳
1
回答
ImageDataBunch.from_df位置索引器超出界限
、
、
在这个问题上挠我
的
头。我不知道如何识别位置索引器。我甚至超过他们了吗? /opt/conda/lib/python3.7/site
浏览 12
提问于2020-05-18
得票数 1
1
回答
如何基于
列
值
创建
pandas
虚拟
对象
、
、
、
、
我想根据
列
值
创建
虚拟
对象...到目前为止,这就是我
的
方法df =pd.read_csv('test.csv')for: else: df[val]='
浏览 0
提问于2018-01-18
得票数 1
2
回答
寻找数字编码
的
分类
变量
之间
的
相关性?
、
、
、
所以我有一个包含分类
变量
的
数据集。我已经根据类别x
的
数量
从
0:x对每个类别进行了编码。我试图找到
变量
(数字和分类)与目标
变量
(也是分类
变量
,但已编码为0表示否,1表示是)之间
的
相关性。我已经能够对所有
变量
(大约有17个)运行此代码,它似乎确实起作用了,但我质疑相关性是否正确。我以前没有在我
的
数据集中计算过与分类
变量
的
相关性,只想确保我
的
方法是正确
的</em
浏览 2
提问于2017-11-16
得票数 0
1
回答
Polars:
从
变量
创建
具有固定
值
的
列
我已经清除了polars文档,看不到
从
变量
中
创建
具有固定
值
的
列
的
示例。下面是在
pandas
中
工作
的
内容Thx
浏览 2
提问于2022-03-03
得票数 5
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券