腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Dask
Dataframe
groupby
没有
len
()
、
、
如果你有一个基于
dask
数据帧的
groupby
对象,为什么
len
(<
groupby
object>)会返回一个错误?(错误或功能)
浏览 13
提问于2018-02-11
得票数 5
回答已采纳
1
回答
dask
数据帧应用元
、
、
我想对
dask
数据的单个列进行频率计数。代码可以工作,但是我收到一个warning抱怨meta
没有
定义。虚拟数据和列频率from
dask
import
dataframe
as dd Out[60]: Alice 2Sam 3 试图
浏览 7
提问于2017-06-08
得票数 25
回答已采纳
1
回答
dask
groupby
agg加权平均“未知聚合lambda”错误
、
在
Dask
中,我得到了: File "<ipython-input-16-0beb32700c04>", line 3, in <module> File "/anaconda3/lib/python3.7/site-packages/
dask
/
dataframe
/
groupby</em
浏览 35
提问于2019-08-27
得票数 2
1
回答
如何在
Dask
中进行
groupby
过滤
'B', 'C'] x = grouped.filter\
dataframe
\
groupby
.py in __getattr__(self, key)-> 1163 return self[\
dataframe</e
浏览 15
提问于2019-03-22
得票数 2
回答已采纳
3
回答
Dask
: n数据帧
groupBy
上的唯一方法
、
、
我想知道在使用
Dask
进行
groupBy
聚合之后,是否可以获得给定列中唯一项的数量。我在文档中
没有
看到任何类似的东西。它在pandas
dataframe
上可用,并且非常有用。
浏览 10
提问于2017-08-28
得票数 8
1
回答
Dask
2.1.0,KeyError:‘列未找到: 0’
、
、
、
、
我正在使用
dask
读取大型csv数据文件,并试图对生成的数据文件执行
groupby
。
groupby
on Pandas
DataFrame
')for name, group in pgroup:print(ddf.head(5)) print('Performin
浏览 0
提问于2019-07-28
得票数 2
2
回答
在
dask
中遍历
GroupBy
对象
、
、
是否可以遍历
dask
GroupBy
对象来访问底层数据帧?我试过了:import pandas as pdddf = dd.from_pandas(pdf, npartitions
浏览 21
提问于2016-09-28
得票数 10
回答已采纳
1
回答
pandas
groupby
聚合到
dask
、
我有一个熊猫代码,想要翻译成
Dask
让我们有一个虚拟数据 import
dask
.
dataframe
as dd df = pd.
DataFrame
({'item_id': [10, 10, 10,item_hist_rating_up=pd.NamedAgg(column='rating', aggfunc=lambda x: round(100 * sum(x>=3.75) /
len
item_hist_rating_down=pd.Named
浏览 20
提问于2021-03-31
得票数 1
回答已采纳
1
回答
将PySpark
groupby
collect_set迁移到
Dask
、
、
为了转换大型数据集,我使用了
dask
包。pySpark实现: df.
groupBy
('Key').agg(collect_set('ColumnA').alias('Items'), collect_set('ColumnB').alias('DocumentId')) 到Pandas df.
groupby
("Key")[['ColumnA','ColumnB']].agg(set)
浏览 31
提问于2021-08-16
得票数 0
1
回答
如何检查为什么
Dask
在变量覆盖时
没有
释放内存
、
、
、
拥有一个占用大约100 in内存的
dask
.
DataFrame
: ddf = client.persist(ddf)# 246652596 rows ## Runningsome other code like
groupby
/aggregate etc 现在我想使用.loc操作符过滤掉数据,但在运行以下命令后,内存消耗为165 to: ddf_c = ddf_c.locddf_c.is_in_valid_set_of_combis == True] ddf_c = clien
浏览 21
提问于2020-08-06
得票数 1
2
回答
dask
.
dataframe
.
groupby
.DataFrameGroupBy错误
、
、
、
、
我在两个列上使用了
groupby
( df有大约70列,除日期时间外,所有列都是浮动的)来获得
dask
数据文件:我不能使用结果,因为它是以某种奇怪的格式:如何将结果作为
dataframe
浏览 3
提问于2021-01-26
得票数 1
回答已采纳
1
回答
使用lambdas时聚合失败
、
我正在尝试将我的应用程序的一部分从pandas移植到
dask
,但在
dask
DataFrame
上的
groupby
中使用lamdba函数时遇到了障碍。import
dask
.
dataframe
as dd
dask
_df =
dask
_df.
groupby
groupby
同样适用于pand
浏览 3
提问于2016-11-28
得票数 6
1
回答
如何在
dask
中编写unstack和reindex?
、
、
、
我用pandas编写脚本,但为了提高效率,我需要切换到
dask
,但我不确定如何在
dask
中实现unstack和reindex?这是我的pandas脚本的样子: df_new = df.
groupby
(['Cars', 'Date'])['Durations'].mean().unstack(fill_value=0).reindex
浏览 11
提问于2020-06-18
得票数 0
回答已采纳
2
回答
Dask
DataFrame
:对具有多行的
groupby
对象进行重采样
、
、
、
、
我从Castra创建了以下
dask
dataframe
:2353 2015-08-08 00:00:00 b我尝试了以下几点: df.
groupby
浏览 6
提问于2015-11-26
得票数 5
回答已采纳
1
回答
如何对
Dask
dataframe
组中的值进行排序?
、
、
、
、
: .
groupby
['target'].sum().shift(i).ffill().bfill().values 是否可以对值进行排序、分组、移位,然后分配给一个新变量,而不需要在
Dask
浏览 10
提问于2017-03-15
得票数 4
1
回答
如何在
Dask
DataFrame
中按列分组并作为一个列表列出另一列?
、
、
我有一个
Dask
DataFrame
,我想从其中按列分组,并将agg作为其他列的列表。例如:ddf.
groupby
('group_id')['name', 'department'].agg(list) 有
没有
什么方法可以让我做到这一点?
浏览 15
提问于2019-06-06
得票数 0
3
回答
捕获异常并返回空数据
、
当数据库查询返回数据时,它工作得很好,但是当
没有
返回数据时,它会抛出一个错误(这是预期的)。如何捕获此异常并返回空数据?#When
dataframe
is non-empty, transformation works fine:0 41 Jason31.0 32.0 2012.0 2013.0 2014.0 #But when
dataframe
is empt
浏览 4
提问于2016-06-30
得票数 7
回答已采纳
1
回答
如何在
dask
中找到数据帧的长度?
、
、
如何使用
dask
找到数据帧的长度?例如,在熊猫中,我可以这样做:import numpy as npimport
dask
.
dataframe
as ddprint df_
dask
print df_
dask
Dask
浏览 0
提问于2018-05-28
得票数 6
1
回答
如何并行化达克中的连接?
、
、
我正在学习在我的大学项目中使用
Dask
进行并行数据处理。我用
Dask
连接两个节点来处理数据。concat = concat.
groupby
(axis=1, level=0).sum() for idx inrange(5,
len
(piv
浏览 7
提问于2022-05-27
得票数 2
1
回答
达斯克可以用来群并从核心中重新编码吗?
、
、
sklearn.preprocessing import LabelEncoderdf = df.
groupby
(['ID_0', 'ID_1']).size().rename('count').reset_index
浏览 1
提问于2016-09-10
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Dask:并行计算的灵活解决方案,用完都说好神奇!
Python之数据聚合与分组运算
在Pandas中通过时间频率来汇总数据的三种常用方法
你可能不知道的pandas的5个基本技巧
pandas入门3-1:识别异常值以及lambda 函数
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券