腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Pandas
:如
何在
groupby
中
包含
DataFrame
中
不存在
的
类别
、
我在
Pandas
Dataframe
中使用了
groupby
函数。df :U-01 HU-03 HU-05 HH 4 L 2 实际上,在层次上有"H“、&quo
浏览 17
提问于2020-08-24
得票数 1
回答已采纳
1
回答
PySpark相当于熊猫
的
群体分类?
、
、
、
、
在
Pandas
上,我们可以按一个分类系列进行分组,然后在聚合时,它会显示所有的
类别
,不管它是否
包含
任何记录。import
pandas
as pd cuts = pd.cut(df.Age, bins=[0, 11, 30, 60]) df.Age.
groupby
(cuts).agg(mean="mean", oc
浏览 13
提问于2022-10-24
得票数 1
回答已采纳
1
回答
如何操作Dask
的
group by返回
的
组?
value category1 20 B3 40 B 我想添加一个mean列,其中
包含
每个
类别
的值
的
平均值。) pd.concat(groups).sort_index() 我如
何在
Dask
中
做同样
的
事情?我不能按原样使用
pandas
函数,因为你不能在Dask
中
枚举
groupby
对象。这 import dask.
dataframe</e
浏览 15
提问于2019-10-18
得票数 0
回答已采纳
1
回答
从部分分类列获取value_counts
、
我正在尝试使用
pandas
(v0.23.4)从Categorical列(特别是
包含
月份信息)
中
获取value_counts。当所有
类别
都存在时,可以很好地工作:import random
如
预期
的
那样打印: Month
浏览 2
提问于2019-03-19
得票数 2
回答已采纳
1
回答
Pandas
groupby
和count:
包含
不在
DataFrame
中
的
类别
、
我有以下功能(1-4)和一些名称
的
DataFrame
。并非所有功能实际上都存在于
DataFrame
中
(缺少3个): import
pandas
as pd [[1, 'name_1'],,# Feature Name#1 2 name_2#3 4 name_4 我想要分组特征和计数: df.
groupby
浏览 10
提问于2020-03-18
得票数 1
回答已采纳
2
回答
在spark
Dataframe
中
应用
groupBy
后筛选
的
列
的
百分比
、
、
、
Spark
Dataframe
包含
一个
包含
2列
的
表:状态、
类别
。Status has values----'y' and 'n'如
何在
spark (Scala)中找到每个
类别
中
状态'y‘
的
百分比df.
groupBy
("ca
浏览 4
提问于2017-10-24
得票数 1
1
回答
如
何在
groupby
中
包含
Pandas
DataFrame
中
不存在
的
列
、
nann3 3 0 0 0 2 在代码
中
,df1 = (df.unstack() .fillna('nan') .unstack([0,2], fill_value=0)
浏览 13
提问于2020-08-25
得票数 1
回答已采纳
2
回答
如
何在
Pandas
中
的
大数据帧上执行rolling_median而不会遇到skiplist_insert失败
的
错误?
、
我有一个巨大
的
数据框架,大约有1041507行。df['rolling_median']=df['value'].
groupby
(['Category','Subcategory']).apply如果需要的话,我会附上完整
的<
浏览 1
提问于2016-03-10
得票数 1
1
回答
在
Pandas
中
的
两列上计数下面的群不包括零计数
的
组
、
、
、
、
我在
Pandas
DataFrame
中
按两列分组,然后计算每个组
的
大小。然后,将对此分组
DataFrame
进行过滤,并在条形图中绘制数据。我遇到
的
问题是,如果一个组有一个零计数,那么它不会显示在
DataFrame
中
,因此不会出现在图中。[熊猫群为零values](https://stackoverflow.com/questions/37003100/
pandas
-
groupb
浏览 0
提问于2018-06-15
得票数 1
回答已采纳
2
回答
熊猫群
中
的
NaN项目是否伴随着包括
类别
列期望行为在内
的
聚合?
、
、
我聚合了一个
包含
类别
列
的
熊猫
DataFrame
。输出
包含
了几个我没想到也不明白
的
NaN。示例代码:d.astype({'b': 'category'}).<em
浏览 2
提问于2019-11-01
得票数 4
回答已采纳
1
回答
Pandas
0.25.0:分类
的
groupby
、
我在使用上个月发布
的
Pandas
0.25.0时遇到一些困难。由于组合b m
不存在
,因此生成
的
数据框应
包含
3行。df.
groupby
(['A', 'B']).agg({'C': 'sum'}) Ca m 1然而,在
Pandas</
浏览 7
提问于2019-08-19
得票数 2
回答已采纳
4
回答
不清楚为什么使用单个组
的
groupby
会产生行
DataFrame
、
下面是对一个
groupby
的
两个
pandas
.
DataFrame
操作 ans1 = d.
groupby
(grp1).apply(lamb
浏览 5
提问于2021-09-08
得票数 9
回答已采纳
1
回答
名为聚合语法
的
熊猫抛出错误TypeError: int()参数必须是字符串、类似字节
的
对象或数字,而不是'_NoValueType‘。
、
、
我有一只熊猫
的
资料如下'x': range(0, 5),当我使用未命名
的
聚合时,我得到了预期
的
结果但是,当我将语法更改为命名聚合时 xx = aa.
groupby
('g1').
浏览 3
提问于2021-10-28
得票数 0
1
回答
传递什么
Pandas
数据类型来在一个组中转换或应用
、
在尝试调试
groupby
函数应用程序时,我使用一个虚拟函数来为每个组“查看传递给函数
的
内容”
的
。, 'data_2']].apply(f)single column transform<'> <class '
pandas
.core.frame.
D
浏览 5
提问于2013-12-19
得票数 6
回答已采纳
1
回答
相当于从R到Python
的
By
、
我是python
的
新手。如果有人能告诉我如
何在
python中使用by包装数据表,我将不胜感激。tmp2=by(data =tmp,tmp$categorie, FUN = function(x) head(x, nb))提前谢谢你, 从评论
中
我完成了我
的
帖子
浏览 2
提问于2014-01-21
得票数 2
2
回答
统计数据帧字典
中
的
行数
、
、
我正在尝试计算每个数据帧
中
的
行数。对于真正
的
数据,我
的
代码计算只有几行
的
数据帧
的
行数刚刚超过一万行。import numpy as npDf = pd.
DataFrame
(np.random.randint(0,1
浏览 18
提问于2018-08-08
得票数 0
回答已采纳
3
回答
熊猫按两列分组并绘制曲线图
、
我有一个这样
的
数据帧:import
pandas
as pd%matplotlib inlinedf = pd.
DataFrame
({'category': list('XYZXY'), 'B': range(5,10),'sex': list('mfmff')}) 我想从“
类别
”栏
中
绘制基于
类
浏览 5
提问于2019-01-02
得票数 15
回答已采纳
3
回答
如
何在
Pandas
中
忽略列
中
的
值?
、
、
我想知道--一旦选择了列,如何忽略该列
中
不需要
的
/不必要
的
值?例如,假设我有一个10x2
的
df import
pandas
as pd data = [['jamie', 30], ['cersei', 30], ['tyrion', 25], ['tywin'或'Age'列,
如
anything > 18 在一个
Pandas
groupby</e
浏览 28
提问于2019-12-30
得票数 0
回答已采纳
1
回答
通过分组
dataframe
列循环检查字符串值。
、
、
我有两个数据文件,一个
包含
从PDF文档
中
抓取
的
大量文本数据,另一个
包含
类别
和子
类别
。对于每个子
类别
,我需要计算
包含
至少一次提到子
类别
的文档
的
百分比(例如,对于子
类别
"apple",计算
包含
“apple”
的
文档
的
百分比)。我能正确地计算出子
类别
百分比。但是,当我尝试用该值填充
dataframe
浏览 5
提问于2022-06-17
得票数 2
回答已采纳
1
回答
对重复行条目进行计数,高效RAM
、
、
我有一个很大
的
数据帧,我想知道每行有多少个数据帧。我一直在使用这个:但它需要超过60‘m
的
内存,而我只能使用32’mfrom collections import Counter counts = df.
groupby
(['industry', 'sector'], as_index=False, sort=False).aggregate(Cou
浏览 8
提问于2021-05-20
得票数 1
点击加载更多
相关
资讯
在Pandas中通过时间频率来汇总数据的三种常用方法
利用Python Pandas库从DataFrame中提取最新日期
Python数据分析利器:Pandas核心功能与实战应用指南
Python 数据分析之NumPy与pandas 的功用
查找的优化!如何在Excel单元格中查找包含指定内容的数据记
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券