腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如
何在
spark中使用
pandas
split-apply-combine风格策略和scala api?
、
、
、
我有一个scala函数,它接受一个spark dataframe并返回一个单值,也就是说
两个
值。这个函数很复杂,使用在DataFrame类
中
定义
的
聚合
,调用其他java库,并且不能用SQL表达。它需要整个
数据
帧
的
内容来进行计算,它不能一次添加一行并建立一个结果。 我有一个大
的
dataframe,其中包含一个列,我想用它将dataframe分成小块,并对每个小块
执行
上述计算。然后,我想返回一个新
的
数据
浏览 28
提问于2020-04-22
得票数 0
1
回答
如
何在
同一个
pandas
数据
帧
的
一列
中
执行
两个
聚合
操作
?
、
、
我在
pandas
data frame中有
一列
,我想找出同一结果
中
某列
的
最小和最大值。但问题是,我只能得到一个
聚合
值作为回报。import
pandas
as pd5 93 4 df.agg({'col1':'sum','col1':'mean'}) 这个
聚合
的
输出只给出了一个含义: c
浏览 17
提问于2019-05-04
得票数 0
回答已采纳
1
回答
计算并广播
pandas
中
的
计数(使用groupby转换)
、
、
、
我如何计算和广播一个熊猫
的
计数?要计算计数,请
执行
以下
操作
: df.groupby('field').size() 要向原始
数据
帧
广播
聚合
,请
执行
以下
操作
: df.groupby('field')['field_to_aggregate'].transform(aggregation) 如果我指定要
聚合
到
的
字段和
聚合
(
如
s
浏览 34
提问于2020-11-25
得票数 1
5
回答
星星之火
数据
帧
的
同
一列
上
的
多个
聚合
操作
、
、
我有三个字符串类型数组,包含以下信息:
操作
数组:包含我要
执行
的
聚合
操作
。我正在尝试使用火花
数据
帧
来实现这一点。Spark
数据
帧
提供了一个agg(),您可以在其中传递一个Map 作为输入,但是我希望对
数据
浏览 8
提问于2016-01-22
得票数 40
回答已采纳
0
回答
减去
Pandas
或Pyspark Dataframe
中
的
连续列
、
、
、
、
我想在
pandas
或pyspark
数据
帧
中
执行
以下
操作
,但我仍然没有找到解决方案。我描述
的
操作
可以在下图中看到。 请记住,输出
数据
帧
在第
一列
上不会有任何值,因为输入表
中
的
第
一列
不能被前
一列
减去
浏览 1
提问于2016-07-12
得票数 4
回答已采纳
1
回答
如
何在
聚合
后将
pandas
数据
帧
转换为单索引?
、
、
我一直在玩
pandas
数据
帧
中
的
聚合
。考虑以下
数据
帧
: df=pd.DataFrame({'a':[1,2,3,4,5,6,7,8], 'batch':['q','q','q','w','w','w','w) 问题是,我希望最终
的
<e
浏览 21
提问于2020-09-05
得票数 0
回答已采纳
1
回答
处理
数据
以进行网络分析
、
、
在使用networkx进行网络分析之前,我正在尝试处理我
的
数据
帧
。下面是我获得
的
一个
数据
示例:理想
的
结果是每个单独
的
演员和他/她所在
的
电影/节目都有一个列。如果演员有多个节目/电影,我希望该演员也有不同
的
行。有没有人能建议我如何实现这个目标?谢谢你!!
浏览 4
提问于2021-12-03
得票数 0
2
回答
如
何在
Java
中
添加
两个
不同列
的
Spark
数据
帧
、
、
我有一个Dataframe,我在该Dataframe上
执行
一个UDF
操作
,然后UDF
的
操作
在Dataframe
中
只有
一列
。如何将其附加到以前
的
数据
报
中
。示例: Dataframe 1: sr_no,name,salary Dataframe 2: UDF给出
的
输出是ABS(薪水)--只有
一列
作为Dataframe1上应用
的
UDF
的
输出。如
何在
JA
浏览 20
提问于2020-01-25
得票数 0
1
回答
如何运行多个agg函数并在
pandas
数据
框
中
以行
的
形式返回它们?
给定一个如下所示
的
数据
帧
: id x y 2 5 5 2 3 7 2 1 9 如
何在
一列
上运行多个
聚合
函数(例如min和max),但将它们作为
数据
框
的
行返回?预期输出应为: minmax 6 在R
的
dplyr
中
,我可以做这样
的
事情,但我不知道如何让它在
pandas</
浏览 16
提问于2020-08-24
得票数 0
回答已采纳
3
回答
基于
Pandas
中
的
公共列值合并
两个
数据
框
、
如何从具有共同列值
的
两个
数据
帧
中
获得合并
的
数据
帧
,使得只有那些行使得合并
的
数据
帧
在特定
的
列
中
具有共同
的
值。Old Men一个公共列'movie_title‘有公共
的
值,基于它
浏览 6
提问于2017-04-09
得票数 76
回答已采纳
1
回答
从增加
的
位置遍历
Pandas
数据
帧
的
所有列后,如何再次返回到第
一列
?
、
、
、
、
在下面的代码
中
,我迭代了一个
Pandas
数据
帧
的
列。对于每
一列
,我都做了一些
操作
。在对最后
一列
执行
操作
之后,我希望返回到
数据
帧
的
第
一列
,并再次从j+512增加
的
位置逐一迭代每
一列
。我该怎么做呢?
浏览 12
提问于2021-10-02
得票数 0
回答已采纳
1
回答
将
数据
帧
分割成较小
的
数据
帧
,并将一个大
的
数据
帧
推送给所有
执行
者?
、
获取50K行表
的
结果。 }) 将table2 (作为参数传递大
数据
帧
)发送给这样
的
执行</em
浏览 2
提问于2017-07-14
得票数 0
1
回答
Python
Pandas
:在不同
的
列选择方法
中
,是什么导致速度变慢?
、
、
、
在看到关于在
Pandas
中
复制类似SQL select语句
的
行为
的
之后,我添加了,展示了两种可以缩短
中
针对该问题给出
的
冗长语法
的
方法。尝试过后,我
的
两个
语法较短
的
方法明显慢了很多,我希望有人能解释一下原因import numpy as np N = 10000
浏览 0
提问于2012-11-19
得票数 1
回答已采纳
1
回答
将
数据
从S3读取到
pandas
的
最佳方法
、
、
、
、
我有
两个
CSV文件,一个大约60 GB,另一个在S3
中
大约是70 GB。我需要将这
两个
CSV文件加载到
pandas
数据
帧
中
,并对
数据
执行
连接和合并等
操作
。我有一个EC2实例,它有足够
的
内存供
两个
数据
帧
一次加载到内存
中
。 从S3到
pandas
数据
帧
读取这么大
的
浏览 5
提问于2020-05-06
得票数 0
2
回答
如
何在
Pandas
中
展平groupby
操作
的
结果?
、
使用
Pandas
数据
帧
,有没有一种方法可以扁平化groupby
操作
的
结果,而不必使用临时
数据
帧
,然后将其合并到原始
数据
帧
中
?假设我需要创建一个依赖于
聚合
操作
的
"result“列,就像这个场景: import
pandas
as pd df = pd.DataFrame({'box': [1,1,1,2,2,3,3,
浏览 82
提问于2020-05-04
得票数 2
回答已采纳
1
回答
从同一loop_python
中
的
两个
路径读取
两个
文件
、
、
我有
两个
路径,每个路径包含许多文件,每个文件包含一天
的
数据
。我需要从第一个路径读取文件,从与同一天对应
的
另一个路径读取另一个文件。在
同一个
python循环中,我希望读取每个路径
中
第一天
的
文件。这些文件在每个路径
中
具有相同
的
名称和顺序。我尝试在for循环中使用os.listdir(path)而不是with open (file) as file,因为我想使用
pandas
将文件读取为
数据
帧</e
浏览 15
提问于2019-10-10
得票数 0
回答已采纳
1
回答
如
何在
我
的
网页上用我
的
数据
框
中
的
列名和唯一值生成动态选择字段?
、
、
、
、
我
的
web应用程序被设计为允许用户上传他们
的
Excel文件,然后在我
的
flask应用程序
中
读取这些文件并将其转换为DataFrame。随后,我
的
应用程序应该过滤DataFrame以从DataFrame
中
删除不必要
的
记录。为此,我计划设置2个动态选择字段: 第一个选择字段-包含
数据
帧
第二个选择字段
中
的
列名列表-第一个选择字段中所选值
的
对应唯一值。 那么我该怎么做呢?但我似乎不能定制他
浏览 23
提问于2019-05-20
得票数 0
回答已采纳
1
回答
groupby正则表达式跨行并在
pandas
中
聚合
、
、
是否可以应用一个函数,在
pandas
中
对连接
的
行进行
操作
,并根据输出
聚合
数据
帧
?示例:a = pd.DataFrame([['a', 0],['b',0],['c',0], [' ', 0], ['1', 1], ['2', 1],0 2 c
浏览 1
提问于2017-03-07
得票数 2
2
回答
数据
框列
中
的
常见元素
、
、
我有一个CSV列表,我目前正在
Pandas
的
数据
帧
中
读取。我需要在
数据
帧
的
其中
一列
中找到公共元素。= pd.read_csv("example1.csv")如何对多个文件
执行
此
操作
浏览 30
提问于2018-06-11
得票数 0
回答已采纳
3
回答
使用
pandas
GroupBy.agg()对同
一列
进行多个
聚合
、
、
、
、
pandas
有没有一种内置
的
方法,可以在同
一列
df["returns"]上应用
两个
不同
的
聚合
函数f1, f2,而不必多次调用agg()?示例
数据
帧
:import datetime as dtdf = pd.DataFrame"returns" : 0.05 * np.r
浏览 0
提问于2012-09-26
得票数 190
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何只用一行代码让 Pandas 加速四倍?
每天读一本:利用Python进行数据分析
pandas系列学习(五):数据连接
如何只用一行代码让Pandas加速四倍?
Python数据分析入门日记Day10:数据分析库Pandas:实现数据库查询操作
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券