腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
按
数据
帧
中
列
中
的
相似
列表
进行
分组
、
、
、
、
我有一个
数据
帧
,其中有一
列
列表
。我希望对具有
相似
列表
的
行
进行
分组
,而不考虑
列表
中
项目的顺序。每个
列表
可以在
列
中
多次出现。我希望根据
列
中出现
的
次数对
分组
列表
进行
排序。tiger]5 f [cat,
浏览 24
提问于2021-05-31
得票数 0
回答已采纳
2
回答
R:不管顺序如何,
按
列
分组
,然后在第三
列
上
进行
功能。
、
我有来自多个TSdist函数
的
输出来测试多个时间序列之间
的
差异。得到
的
矩阵被转换成
数据
帧
,使用我使用melt转换成单个
数据
帧
。第一
列
将行ID表示为
列
,第二
列表
示冒号。我试图计算整个时期之间
的
平均
相似
性。 我试图
按
前两
列
分组
,在第三
列
上执行和操作。下面是一个
数据
框架示例。B = factor(x
浏览 1
提问于2018-04-27
得票数 1
回答已采纳
1
回答
在给定行上遇到特定值时
的
Dataframe groupby
、
、
、
我有一个
数据
帧
,我想对它
进行
分组
(或切片)。
数据
帧
的
形式为a b 1a b 1a b 0a e 3f g 7我想首先对
列
A和
列
B上
的
数据
帧
进行
分组
,然后,将每个
分组
按
某个值进一步划分为
浏览 3
提问于2017-02-04
得票数 2
1
回答
Python [panda/lambda] -
按
特定
列
对DF
进行
分组
和聚合
、
、
、
、
在DF中有多个字段: parent_path, child, level, flag, logic 我想
按
parent_path对DF
进行
分组
,并收集同一父对象下
的
所有子对象。我得到了这样
的
结论: curr_level.groupby('parnet_path').agg(lambda x: list(set(x))).reset_index() 它正在工作,它确实收集了
列表
中
具有相同父元素
的
所有子元素,但它还列出/
浏览 50
提问于2021-01-01
得票数 1
6
回答
如何在非唯一
列
中
按
日期对pandas DataFrame条目
进行
分组
、
Pandas DataFrame包含名为"date"
的
列
,该
列
包含非唯一
的
datetime值。我可以使用以下命令对此
帧
中
的
线条
进行
分组
:但是,这将
按
datetime值拆分
数据
。我想
按
“日期”
列
中
存储
的
年份对这些
数据
<
浏览 1
提问于2012-07-09
得票数 94
回答已采纳
1
回答
pandas
数据
帧
中
的
函数,用于复制R
中
的
dplyr group_by(多变量)函数
、
、
、
考虑一下这种情况: df = df%>% group_by(a,b) %>% 表示
数据
帧
首先按
列
a
分组
,然后
按
b
分组
。在我
的
例子
中
,我尝试先按group_name
列
、然后
按
user_name、再按type_of_work对
数据
进行
分组
。有三
列
以上(这就是我感到困惑
的
原因),但
浏览 0
提问于2017-06-19
得票数 1
1
回答
多
列
数据
帧
的
不同聚合
、
、
、
、
我正在寻找一些捷径,以减少手动
分组
所需
的
: 我有一个有很多
列
的
数据
帧
。当
按
“Level”对
数据
帧
进行
分组
时,我希望使用onward()对两
列
进行
分组
,但对所有其他
列
(大约60
列
,表示2021年以后
的
年份)使用mean()
进行
分组
。 有没有人知道如何定义“其余
浏览 8
提问于2021-09-29
得票数 1
2
回答
Pandas将一个
列
与多个
列
关联
按
列
的
范围
分组
、
、
、
假设我有一个类似于下面的
数据
帧
(实际
数据
帧
有数百万个观测值),我如何获得信号
列
和返回
列
列表
之间
的
相关性,然后
按
Signal_Up
列
进行
分组
?我尝试了pandas corrwith函数,但它没有给出signal_up
列
的
相关
分组
df[['Net_return_at_t_plus1', 'Net_re
浏览 46
提问于2020-03-20
得票数 0
回答已采纳
0
回答
将维度相同
的
数据
帧
分组
到
列表
中
、
、
我希望在
列表
中
对具有相同维度
的
数据
框
进行
分组
。df6, df7) and dim(df2) = dim(df3)我如何对
相似
尺寸
的
对象
进行
分组
最好将它们
分组
到不同
的
列表
中
?(我正在处理
的
列
浏览 1
提问于2016-07-14
得票数 0
7
回答
按
多
列
分组
,并对其他多
列
求和
、
、
、
、
我有一个大约有200
列
的
数据
框,其中我想
按
前10个左右
的
因子对表
进行
分组
,并对其余
列
求和。 我有我想要
分组
的
所有列名
的
列表
,以及我想要聚合
的
所有cols
的
列表
。我正在寻找
的
输出格式需要是具有相同数量
的
cols
的
相同
数据
帧
,只是
分组<
浏览 0
提问于2011-11-21
得票数 21
2
回答
获取
数据
框
列表
并按变量
分组
,并将该变量用作字典
的
关键字
、
、
、
我有一个熊猫
数据
帧
列表
,所有
数据
帧
的
列
都是'Year‘。我尝试
按
该
列
进行
分组
,并转换为字典,其中字典键是变量' year‘,值是该年
的
数据
帧
列表
。这在python
中
是可能
的
吗?我试过这个: grouped_dict = list_of_csv_files.groupby(b
浏览 24
提问于2019-04-15
得票数 0
回答已采纳
1
回答
PySpark:从
数据
帧
列表
创建RDD
、
、
我无法从pyspark
数据
帧
列表
创建RDD,如下所示:df = sqlContext.createDataFrame(l)df2Trace: py4j.Py4JException: Method __getnewargs__([]) does not exist 在parallelize调用
中
。它适用于像[1,2,3]这样
的
简单
列表
,但是当
列表
的<
浏览 4
提问于2017-04-10
得票数 1
1
回答
动态汇总和重命名PySpark
中
的
聚合
列
、
、
、
、
我有一个PySpark
数据
帧
(Df),其中包含50+
列
,其中包含一些动态
列
,这些
列
可能存在也可能不存在,但它们存在于一个单独
的
列表
(Reqd_col)
中
。我想对
列表
(Reqd_col)
中
存在
的
PySpark data frame(df)
中
的
那些
列
进行
汇总(
按
固定
列
‘region’
分组<
浏览 24
提问于2021-09-08
得票数 0
1
回答
h2o目标编码功能
、
、
、
只是尝试理解目标编码映射并应用R html文档
中
的
特性,映射<- h2o.target_encode_create(data =训练,x=
列表
(c(“工作”),c(“工作”,“婚姻”)),y=“年龄”)在上面的映射中,为什么job被单独作为
列表
的
一部分?这是某种交互变量吗,为什么我们会忽略婚姻作为一个单独
的
特征?我们是否可以给出n个分类变量作为
列表
的
一部分,或者建议为每个分类变量创建单独
的
映射?
浏览 0
提问于2018-10-26
得票数 0
1
回答
分组
列表
中
的
数据
框
列
、
、
我有一个
数据
帧
,看起来像这样: | id | A | B | C | D || 2 | 70 | 71 | 72 | 73 || 1 | 90 | 91 | 92 | 93 | | 2 | 40 | 41 | 42 | 43 | 我想
按
“id”
列
对其
进行
分组
,以便每一行都以
列表
的
形式存在
中
id1
的
浏览 20
提问于2021-10-21
得票数 0
回答已采纳
1
回答
:尝试
按
多
列
分组
时
的
问题
、
、
我试图
按
多个
列
进行
分组
,并返回
数据
帧
中选择
列
的
总和。我只
按
一
列
分组
就能做到这一点。df_sum = df.iloc[:, 27:].groupby(df['id']).sum().reset_index() 我成功地
按
id
分组
,并将从第27
列
到
数据
帧
末尾
的
值相加。但是,当我
浏览 3
提问于2019-12-14
得票数 1
回答已采纳
1
回答
pandas:如何使用列名
进行
分组
和聚合?
我有一个
数据
帧
,看起来像这样 col1 col2 col3 col4 .... col90 row2row1000 1001 1002 1003 1004 .... 1090 我希望将这些
列
一次
分组
为3
列
,并取每行
的
平均值。我将
按
以下步骤
进行
: 我生成一个
列表
列表
[['col1',
浏览 24
提问于2019-02-19
得票数 0
回答已采纳
1
回答
初学者R:使用事件
数据
,创建一系列包含分类变量和
的
新
数据
帧
我想创建一个新
的
数据
帧
序列,对未
分组
的
数据
进行
分组
(即,与此链接
中
的
第一步相反:)。我希望
数据
帧
包含上述最后两
列
中
每一
列
的
每个分类计数
的
每一年/每个州
的
总数(但每个年份-州组合只有一行),因此它将是两个单独
的
数据
帧</em
浏览 0
提问于2014-05-30
得票数 0
1
回答
按
日期范围剪切或
分组
的
熊猫
、
我有多个具有日期
列
的
数据
帧
。我想
按
日期
列
按
5天对这些
数据
帧
进行
分组
。通常情况下,类似这样
的
操作是有效
的
: df.se
浏览 2
提问于2016-11-30
得票数 1
1
回答
从pandas组
中
的
绘图中排除
列
、
我有一个
数据
帧
df,它包含4
列
和一个DateTimeIndex。我已经
按
第4
列
对
数据
进行
了
分组
,并希望打印
分组
后
的
数据
。但是,每次我调用df.mean().plot()时,它会绘制我用来对
数据
进行
分组
的
列
的
数据
。有没有办法将此列从绘图中排除?
浏览 1
提问于2016-03-13
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券