腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
熊猫
中
获取
按
组
分布
的
df
python
、
pandas
、
dataframe
、
distribution
我有一个带有Reddit数据
的
dataframe,包括一个作者和一个subreddit字段。我想要得到每个作者
的
分布
,他/她在每个子subreddit中发布
的
频率,可以与其他作者
的
分布
进行比较。sub_visits =
df
.groupby('author').subreddit.value_counts()/
df
.groupby('author').subreddit.count() 这一行
浏览 9
提问于2020-07-14
得票数 0
回答已采纳
2
回答
星星之火上
熊猫
API
组
pandas
、
apache-spark
、
pyspark
、
group-by
、
spark-koalas
我下面有一只
熊猫
, 'kings', 'Kings', 'Kings2014,2015,2014,2015,2014,2015,2016,2017,2016,2014,2015,2017], 'Points':[876,789,863,673,74
浏览 5
提问于2022-11-11
得票数 0
回答已采纳
1
回答
如何同时分组/应用两个星火DataFrames?
apache-spark
、
pyspark
、
apache-spark-sql
、
pyspark-sql
如果我有三个集群,我正在寻找这个
DF
:|--------+---------+----------------|我有两个想法,如果有的话,我不确定哪一个是有意义
浏览 1
提问于2018-10-11
得票数 2
1
回答
如何计算超过某一数值
的
均值
的
个数
python
、
pandas
嗨,需要帮助
在
一些
熊猫
鳕鱼!问题是如何
获取
df
和groupBy年龄得分平均值,并将其与
df
‘groupBy’.平均值进行比较,并对高于
df
‘Score’
的
结果进行计数。data.groupby(['age'])['Score'].mean()现在我如何比较总分
的
平均值,并按年龄计算结果
组
浏览 1
提问于2021-05-31
得票数 0
1
回答
获取
大
熊猫
群
中
的
所有值
python
、
pandas
熊猫
群比提供first和last来
获取
组
中
的
第一个和最后一个值。是否有一种方法可以将一个
组
中
的
所有值作为列表?我想为某些列计算平均值,但通过操作
获取
熊猫
组
中
其他列
的
所有值。
df
_points =
df
_points.groupby(['field_id', 'Year']).agg({
浏览 2
提问于2019-12-05
得票数 2
回答已采纳
1
回答
在
pandas
中
基于列和透视
中
的
一
组
查找最大值行
python
、
pandas
、
dataframe
、
pivot-table
、
pandas-groupby
我有以下
熊猫
数据框架:4 78 a 4 50 c 9 8 e 9 30
在
每个'id‘
组
中
,
获取
基于'val’
的
n个最大行(本例
中
为n=2)。例如,
在
id为4
的
组
中
为78 & 50,
在
id为9
的
组</
浏览 2
提问于2018-07-05
得票数 1
1
回答
如何将不聚合
的
熊猫
群体转化为火星雨?
pandas
、
pyspark
、
pandas-groupby
我正试图将以下
熊猫
系列转化为火星雨:现在,我已经熟悉了pyspark
的
df
.groupby("col1","col2")方法,以及下面列出
的
第一个元素
在
一个
组
中
的
位置:
df
=
df
.withColumn("row_n
浏览 5
提问于2019-11-11
得票数 1
回答已采纳
1
回答
如何在
熊猫
数据群
中
创造秩序?
python
、
pandas
、
dataframe
、
analysis
我有数据数据,在其中我想要添加列,它将分别显示每个user_id
的
日期顺序,所以它将类似于TABLE2。2018-01-06 14:24:13 A 像这样
的
事情3 是否有比对每个user_id分别进行迭代更有效和可能更简单
的
解决方案
浏览 0
提问于2018-09-05
得票数 0
回答已采纳
1
回答
Pandas.DataFrame.hist()只显示连续/数值数据
python
、
pandas
、
matplotlib
文档上写着: matplotlib.pyplot.hist(
df
['Embarked'])
df
['Embarked
浏览 6
提问于2020-03-17
得票数 1
2
回答
Python-
熊猫
用数据中一
组
的
中间值或平均值替换NA。
python
、
numpy
、
pandas
、
dataframe
假设我们有一个
df
: apple 1.0 apple NA orange 7.0melon 14.0 melon 15.0要替换NA,我们可以使用
df
["B"].fillna(
df
["B"].median()),但它将用"B“中所有数据
的
中位数填充NA。我们是否可以用某个A
的
浏览 3
提问于2015-11-06
得票数 9
回答已采纳
3
回答
AttributeError:无法访问'DataFrameGroupBy‘对象
的
可调用属性'reset_index’,请尝试使用'apply‘方法
python-3.x
、
pandas
、
pandas-groupby
我对
熊猫
很陌生,并且尝试使用groupby。我有一个有多列
的
df
。 col1 | col2 | col3 | col4 | col5 ======================
浏览 1
提问于2018-05-22
得票数 7
2
回答
groupby并返回前n个
组
的
所有行
python
、
pandas
、
pandas-groupby
我有一个
熊猫
数据框,如下所示 0 1 2 3 4 55列
的
排序顺序对它们进行分组,并返回前n个
组
,其中n可以作为变量。I
df
.sort_values(5).groupby([5]) I get <pandas.core.groupby.DataFrameGroupBy object at 0x2afc8d0> 如何
获取
前2
组
中
浏览 11
提问于2017-07-03
得票数 5
1
回答
熊猫
小计分类
python
、
pandas
我有一个多索引
的
数据,如下所示。我有意识地给出了完整
的
数据,因为当我用小数据尝试这个解决方案时,它是可以
的
,但是当我尝试使用完整
的
数据时,它就不起作用了。SubTotal 7我想根据每个0级“MATERIALNAME”列
的
小计对这个
df
进行排序。
浏览 3
提问于2021-07-13
得票数 0
回答已采纳
1
回答
按
栏分组,然后
在
熊猫
中
按
索引绘制盒图
pandas
、
boxplot
我有一个大
的
数据,我想
按
某一列分组,并使用方框图以图形方式检查每个
组
的
分布
情况。我发现
df
.boxplot()会对数据文件
的
每一列都这样做,并将它放在一个图中,正如我所需要
的
。问题是,
在
进行了groupby操作之后,我
的
数据都在一列
中
,索引中有
组
标签,所以我不能对结果调用box图。以下是一个例子:
df
= DataFrame({'a':ran
浏览 2
提问于2013-12-19
得票数 6
回答已采纳
1
回答
如何在Pandas Dataframe
中
对两列进行分组并
获取
值计数后获得最高值行?
python
、
pandas
、
pandas-groupby
我用下面的代码行对两列进行分组:我得到以下输出: Technology 97我想得到每个主题(这是最常见
的
类别)
的
最上面的行,如下所示: topic category
浏览 0
提问于2018-05-21
得票数 3
回答已采纳
1
回答
Python大
熊猫
-将函数应用于分组数据
python
、
pandas
、
dataframe
0.455287 8 bar 0.351544 -1.146554 我希望得到每个
组
(
按
A分组时)列C
的
最大值,并将其添加到列C。以下是我尝试过
的
:
df
=
df
.groupby(by='A')for name in [
浏览 4
提问于2016-02-26
得票数 0
回答已采纳
2
回答
如何将火花数据转换为数据库考拉数据?
python-3.x
、
dataframe
、
databricks
我知道你可以将星星之火数据格式
df
转换成
熊猫
数据格式 然而,这花费了很长时间,所以我
在
databricks中发现了一个考拉包,它可以让我
在
没有
熊猫
数据
的
情况下使用这些数据作为
熊猫
的
数据
浏览 0
提问于2019-06-21
得票数 10
回答已采纳
1
回答
熊猫
:如何保存每一
组
的
最后“N”记录,
按
另一个变量排序?
python
、
pandas
、
dataframe
我想保留每个
组
的
最后一个n行,按照使用
熊猫
的
变量var_to_sort排序。现在我就是这样做
的
,我想将下面的数据
按
name分组,然后
按
date对sort进行分组,然后使用tail(n)
获取
by-group
中
的
最后一个n元素。2019,4,1), "Don't want"], ['nick', date(2019,5,1), "I want this&
浏览 0
提问于2019-08-19
得票数 7
回答已采纳
4
回答
如何从不同
的
数据集中用“边缘”(
分布
直方图)覆盖Seaborn连接图
python
、
pandas
、
overlay
、
seaborn
我从一
组
保存在
熊猫
JointPlot
中
的
“观察计数与浓度”
中
绘制出了一份海运DataFrame图。我想(
在
同一
组
轴上)一个边际(即,单变量
分布
)对每个浓度
在
现有的边缘之上
的
“期望计数”进行叠加,这样就可以很容易地比较差异。这个图与我想要
的
非常相似,尽管它有不同
的
轴和只有两个数据集: 下面是我
的
数据是如何编排和关联
的
一个例子:
df<
浏览 5
提问于2016-03-10
得票数 8
回答已采纳
1
回答
具有目标分层
的
K
组
scikit-learn
、
pandas
、
cross-validation
'group': [10, 10, 10, 20, 20, 20, 30, 30, 30],}) 我想把
df
分成几次训练和测试(K倍),所以训练和测试包含来自互斥
组
子集
的
例子。例如,如果测试包含来自组
的
示例,10、20测试应该只包含来自组30
的
示例。我也想保持
按
目标分层。因此,
在
创建
组
子集时也考虑了目标
分布
。这
浏览 0
提问于2020-09-09
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
盘点一个Pandas处理Excel表格实战问题(上篇)
10招!看骨灰级Pythoner如何玩转Python
Pandas与SQL的数据操作语句对照
手把手教你用R做倾向性匹配
Python基础——4 数据可视化(下)
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券