腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Pandas
对
索引
进行
分组
,以
使用
各自
的
值
分隔
列
、
我正在尝试转换一个
分组
的
timeindex数据帧,因此每个
索引
都是一个新
的
列
,并且这些
列
具有用于对应每个
索引
的
数据,我该如何做呢?我想把它转换成这样
的
形式: ?
浏览 7
提问于2020-07-15
得票数 1
回答已采纳
1
回答
如何重置.groupby输出中
的
索引
?
、
我希望根据名称和品牌
列
各自
的
唯一
值
对
它们
进行
分组
。dataframe 我编写了以下python代码来
对
它们
进行
分组
: high_products = products.reset_index().groupby(['name', 'brand'])[['name', 'brand', 'count_name']] 并<
浏览 23
提问于2020-09-24
得票数 0
1
回答
将
列
值
从grouped-by DataFrame展开到适当
的
列
中
、
、
、
、
根据我
的
需要,将user_id与其
各自
的
aisle_id
进行
分组
。现在,我希望将aisle_id
值
转换为
列
,将user_id作为
索引
,并将所有aisle_id作为
列
。然后,在我想要
的
值
中,我希望user_id和aisle_id在前一个DataSet中匹配
的
次数。例如,如果user_id 1从aisle_id 12购买了3次,则DF1,12中
的
值
将
浏览 20
提问于2020-10-20
得票数 0
6
回答
如何在非唯一
列
中按日期
对
pandas
DataFrame条目
进行
分组
、
Pandas
DataFrame包含名为"date"
的
列
,该
列
包含非唯一
的
datetime
值
。我可以
使用
以下命令对此帧中
的
线条
进行
分组
:但是,这将按datetime
值
拆分数据。我想按“日期”
列
中存储
的
年份
对
这些数据
进行
分组</
浏览 1
提问于2012-07-09
得票数 94
回答已采纳
1
回答
提取数据帧
的
索引
,按
列
值
分组
、
、
我有一个正确
索引
的
Pandas
数据帧:0 0 10 2 1 104 09我想提取
以
一
列
为条件
的
索引
(其中delta
值
= 1),但按另一
列
(y)
的
值
对
它们
进行
分组
。理想情况下,我想要一本以
浏览 2
提问于2018-04-22
得票数 0
1
回答
动态
分组
Pandas
列
、
全, 我有一个关于基于名称
分组
Pandas
列
的
问题。我正在处理气候模型数据,并且我手头有两个
索引
-一个为每个模型成员提供唯一
的
名称(例如,
以
A、B、C等开头)。以及每个模型成员内具有不同模拟
的
一个(例如,成员'A‘可以包含AA、AB、AC等)。我想
对
以
特定字符串开头
的
所有
列
进行
分组
(例如,我希望根据AA、AB、AC
的
开
浏览 37
提问于2021-10-28
得票数 0
1
回答
熊猫:按数据
索引
的
前两个字符
分组
、
、
我
的
Pandas
(df)
的
行
索引
是[0015, 0030, 0045, 0100, 0115, 0130, 0145, 0200, 0215, 0230.....2345]即。我想按[00, 01, 02, 03, 04, 05,.......23]
浏览 2
提问于2020-04-28
得票数 2
回答已采纳
1
回答
如何解压key,在数据帧
的
列
中,json
的
值
被转换成key作为
列
,而value在它
的
值
处
使用
python?
、
、
、
、
我有一个数据框: 我想要将json格式
的
每一行
的
键和
值
解压到单独
的
列
和它们
各自
的
值
中,
以
cast
列
的
形式呈现。因此,基本上,cast_id、character应该在数据框中用它们
各自
的
值
分隔
成
列
。我试过了: from
pandas
.io.json import json_normaliz
浏览 0
提问于2020-06-15
得票数 0
3
回答
Pandas
: df.groupby()对于大数据集来说太慢了。有什么替代方法吗?
、
、
、
我有一个有380万行和一
列
的
pandas
.DataFrame,我尝试按
索引
对
它们
进行
分组
。df = df.groupby(df.index).sum()<class '
pandas
.cor
浏览 1
提问于2017-06-23
得票数 15
1
回答
Pandas
groupby用于k-折交叉验证和聚合
、
假设我有一个数据框df,其中包含以下列: id |site| time| click |impressions最后,我想按站点和时间
对
所有训练数据
进行
分组
(
对
验证数据也是如此)(换句话说,对折叠
索引
求和,
浏览 3
提问于2014-07-28
得票数 0
2
回答
熊猫数据组根据组内位置添加二级指数(整数)
、
、
、
、
我有一个dataframe,它
的
时间
值
和组
值
作为
列
索引
,由运行中
的
时间
值
索引
。import numpy as npdata = np.array([np.random.randint(0,10,20), np.arangedataset.ind
浏览 2
提问于2020-06-30
得票数 1
回答已采纳
1
回答
Pandas
数据框中行具有相同
值
的
组条目
、
我有一个
Pandas
数据框,其中我希望
对
具有相同
值
的
所有行
进行
分组
,并按
索引
列
对
它们
进行
分组
。X15 b Y25 c Z 28 c Z 我想要
的
输出是
浏览 11
提问于2020-03-26
得票数 0
回答已采纳
1
回答
在DataFrame底部添加一行,总计
、
、
、
我用
Pandas
对
Excel文件中
的
信息
进行
分组
,用这些信息
对
值
进行
求和,
以
获得数据
的
摘要。summary_df.loc["Grand Total&
浏览 0
提问于2018-07-09
得票数 3
回答已采纳
1
回答
Python
Pandas
的
累积OLS
、
、
、
在
Pandas
中,
pandas
.ols
的
window_type参数有一个rolling选项,但这似乎隐含着需要选择窗口大小或
使用
整个数据样本作为默认
值
。我希望
以
累积
的
方式
使用
所有数据。我正在尝试
对
按日期排序
的
pandas
.DataFrame运行回归。对于每个
索引
日期,我希望
使用
从最小日期到
索引
i处
的
日期
的
可用数
浏览 5
提问于2013-02-27
得票数 5
回答已采纳
2
回答
基于另一个dataframe
的
Python
Pandas
群
、
、
我有两个具有公共
索引
的
数据格式。我想根据df1中
列
的
子集
对
df2
进行
分组
。我知道如何按df1中已经存在
的
多个
列
进行
分组
,比如df1.groupby(['col1', 'col2']),我知道如何
使用
相同
的
索引
(如df1.groupby(df2['col1']) )
对
不同
浏览 2
提问于2021-11-29
得票数 2
回答已采纳
1
回答
熊猫群返回多
索引
和另外两个集合
、
如果按一个
列
分组
,并
使用
as_index=False,这种行为在熊猫身上是可以预料
的
。但是,当我
使用
.agg时,as_index似乎不再像预期
的
那样运行。简而言之,这似乎并不重要。# importsimport numpy as np np.random.seed(834) aletter
浏览 2
提问于2020-10-11
得票数 0
回答已采纳
7
回答
是否同时
对
列
和
索引
值
对
pandas
数据帧
进行
排序?
、
、
、
按
列
的
值
和
索引
对
pandas
dataframe
进行
排序是否可行? 如果按
列
的
值
对
pandas
数据帧
进行
排序,则可以得到按
列
排序
的
结果数据帧,但不幸
的
是,您会看到数据帧
的
索引
顺序与排序列
的
值
相同。那么,我是否可以按
列
对数据
浏览 2
提问于2013-11-29
得票数 59
2
回答
可以
使用
哪些类型
的
聚合来创建
索引
视图
、
、
我一直在尝试弄清楚我可以
使用
什么类型
的
聚合来创建
索引
视图。仅供参考:我可以用SUM()创建一个。我还发现我不能用MIN、MAX和AVG创建
索引
视图。其他人呢?有可能吗?我在网上找不到任何信息,也不能在我
的
电脑上工作。
浏览 5
提问于2015-08-25
得票数 0
1
回答
每组只有一
列
()
、
Am从R切换到Python,满足了我
的
大多数数据分析需求,并遇到了以下问题。可能是我
对
groupby()
的
概念理解
的
结果。df = df[(df["Lead Source"] != "chase") & (df["Lead Source"] !", "Model Group", &qu
浏览 0
提问于2014-10-01
得票数 1
回答已采纳
1
回答
在numpy数组中
使用
索引
和求和
的
内存
我
使用
列表理解来
索引
一个numpy数组,并
对
这些
值
求和: df[col]=np.array([A_numpy_array[b].sum() for b in B_numpy_array]) 我
的
A_numpy_array是
使用
B_numpy_array
的
元素b
进行
索引
的
(它有800-900万个元素)。这部分代码是这个过程需要一段时间
的
地方,我完全用完了RAM,并开始写入磁盘。 据我所知,列表理解是P
浏览 13
提问于2021-09-23
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券