腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
How
to
add
a
column
in a
dask
dataframe
包含
基于
其他
列
中
的
值
的
相似性
的
一列
的
值
的
平均值
、
、
、
、
我有一个非常大
的
CSV文件,它已经作为
dask
数据帧导入到Python
中
。我制作了一个小数据框来解释我
的
问题。import
dask
.
dataframe
as dddf.head() 输出: +----+--_mean,如果col1
中
的
对应
值
相同,则该
列
包含
col3
的<
浏览 7
提问于2019-01-22
得票数 0
1
回答
Python
dataframe
.map_partitions()返回
值
、
、
所以
dask
.
dataframe
.map_partitions()采用了一个func参数和meta kwarg。它究竟是如何决定其返回类型
的
?例如:我对“分布式”计算非常陌生,但我直觉地期望它返回一个系列对象
的
集合(很可能是一个列表或dict ),但是结果是一个Series对象,它可以被认为是每个分区上example_func结果
的
浏览 2
提问于2016-11-17
得票数 6
回答已采纳
3
回答
Dask
-
Dataframe
列
中
的
唯一
值
数
、
、
、
我有一个从csv文件读取
的
Dataframe
文件,有大约100万条记录和120个特性/
列
,我想在每
一列
中计算唯一
值
的
数量。我可以使用for -循环分别为每
一列
执行此操作:
dask
_df = dd.read_csv("train.csv") for
column
in
dask
_df.co
浏览 4
提问于2021-11-11
得票数 0
1
回答
dask
groupby agg加权平均“未知聚合lambda”错误
、
在
Dask
中
,我需要
基于
第三
列
从两
列
的
分组
值
计算加权
平均值
。() 在Pandas
中
,我耗尽了内存。在
Dask
中
,我得到了: File "<ipython-input-16-0beb32700c04>", line 3, in <module>
dask
_df =
dask
_df.groupby/<e
浏览 35
提问于2019-08-27
得票数 2
1
回答
如何操作
Dask
的
group by返回
的
组?
value category1 20 B3 40 B 我想添加一个mean
列
,其中
包含
每个类别的
值
的
平均值
。
中
做同样
的
事情?我不能按原样使用pandas函数,因为你不能在
Dask
中
枚举groupby对象。: '
Column
not found: 0'。我可以使用apply函数来计算
Dask
浏览 15
提问于2019-10-18
得票数 0
回答已采纳
1
回答
将
列
添加到根据python
中
的
列
数据类型显示布尔
值
的
dataframe
中
、
、
、
、
我正在尝试向
dataframe
中
添加布尔
值
的
列
,这些布尔
值
基于
对当前要迭代
的
列
是字母数字、字母还是数字
的
判断。不幸
的
是,对于每个布尔测试,每
一列
都给出了False。我们
的
目标是,对于给定
的
列
,我如何添加另一个
列
来显示给定
列
中
的
行是否为字母数字?我不想遍历<e
浏览 25
提问于2019-12-11
得票数 1
回答已采纳
2
回答
遍历
dask
序列(从
dask
序列
中
获取唯一
值
到列表)
、
我需要遍历
dask
dataframe
中
的
唯一
值
。我使用.unique()来获取
列
的
惟一
值
,但是现在给了我一个不能用来迭代
的
dask
对象。我需要知道如何将这些唯一
值
从这个
dask
对象
中
获取到一个列表(或类似的内容)
中
,这样我就可以使用这些
值
来迭代
dask
数据帧。df = dd.read_csv('fi
浏览 19
提问于2019-06-02
得票数 1
回答已采纳
1
回答
将数据帧
中
的
每行与
其他
行进行比较
、
我有一个数据帧,其中
包含
一列
值
(X)。 df = pd.
DataFrame
({'X' : [2,3,5,2]}) 对于每一行,我想找出
其他
行
的
X
值
的
平均值
(A)。 ?
浏览 20
提问于2019-06-25
得票数 0
回答已采纳
2
回答
如何在pandas
DataFrame
中
忽略滚动
平均值
计算
的
NaN
值
?
、
、
、
我尝试创建一个
包含
基于
长度为5
的
窗口
的
滚动
平均值
的
DataFrame
。但我
的
数据
包含
一个NaN
值
,因此我只能获得具有NaN
值
的
第3
列
的
NaN
值
。在使用.rolling(5).mean()时,如何可以忽略NaN
值
Column
1
Column
2
浏览 69
提问于2021-11-30
得票数 0
3
回答
在
dataframe
中将
列
乘以另
一列
、
、
、
(完全披露这与我提出
的
另一个问题有关,所以请原谅我是否应该把它附加到我以前写
的
文章
中
,尽管问题不一样。) 我有一个由
一列
权重和
包含
0和1
的
二进制
值
的
列
组成
的
数据,我想把数据
中
的
每
一列
乘以权重
列
。但是,我似乎要用with
列
替换
dataframe
中
的
每
一列
。我肯
浏览 12
提问于2017-05-15
得票数 2
回答已采纳
2
回答
选择pd.mean()显示了多少数据?
、
当返回pd.mean()时,如何只显示特定
的
信息?示例new_df = pd.read_excel('example.xls', usecols = ['weight'] )结果 avg value for
column
weight is here: weight 2311.000000 dtype: fl
浏览 8
提问于2022-05-06
得票数 1
回答已采纳
1
回答
选择子集后将其转换为pandas时,
Dask
dataframe
内存不足
、
、
、
、
所以我有一个
包含
160M记录和240
列
的
拼图文件。因此,我使用
dask
在python中使用EMR CLuster m5.12xlarge加载它。import
dask
.
dataframe
as dd 现在我需要其中
一列
的
值
计数和归一化
值
计数: c
浏览 1
提问于2021-09-23
得票数 0
1
回答
大熊猫CSV
、
、
上一篇文章
的
续篇。以前,我帮助使用Pandas在
dataframe
中
创建了一个新
列
,每个
值
都表示一个
基于
另一个
列
的
值
的
分解后
的
或唯一
的
值
。我想要分解它上
的
每个用户名。我一直在研究使用
Dask
,然而,我不能复制sort和factorize
的
功能来为
Dask
数据帧做我想要
的
事情。
浏览 0
提问于2017-06-13
得票数 1
2
回答
如何将
DataFrame
中
除第
一列
以外
的
所有
列
合并为
一列
,并删除空行?Python
、
、
我有一个
包含
多
列
的
大型数据帧,希望将除第
一列
以外
的
所有
列
中
的
所有
值
合并到一个新
列
('New')
中
。然后删除'New'为空
的
行。
DataFrame
如下所示(行'C'为空): '
Column
1' '
Column
2'
浏览 78
提问于2018-07-05
得票数 0
2
回答
将元组
的
列
拆分为两
列
、
、
、
、
我正在使用python2.7和
dask
table[col] = table.apply(lambda x: (x[col1],x[col2]), axis = 1, meta = pd.
Dataframe
) table[[col1,col2]] = table[col].apply(pd.Series) 这样做
的<
浏览 7
提问于2017-11-19
得票数 4
回答已采纳
1
回答
如何根据CSV
中
的
其他
列
值
访问
列
值
并求其
平均值
、
我想要访问第3
列
的
值
,即
基于
索引列表
中
的
索引
的
Total_network's_Disbelief
列
,并且必须找出这些
值
的
平均值
。来自OutCSV.csv 。索引
包含
值
0、7、14、21、28、35、42、49、56。list1
包含
csv文件
中
的
第
一列
Timevalues
浏览 16
提问于2018-02-26
得票数 0
回答已采纳
2
回答
使用lotus notes公式获取视图中两
列
的
平均值
如何使用lotus notes公式获得视图中两
列
的
平均值
浏览 0
提问于2011-03-18
得票数 0
1
回答
如何使用AVG()函数在
包含
的
SQL
中
创建
一列
?
我有一个有
一列
和46行
的
表,我想创建另
一列
,它
包含
所有46行
中
第
一列
的
平均值
,例如,这是该表: CREATE TABLE table2FROM table1 我想添加另
一列
,每行(46行)
包含
AVG(
column
1)
的
值
。
浏览 7
提问于2021-04-05
得票数 0
回答已采纳
1
回答
读取文件时,Pandas mean函数
中
显示意外
的
值
、
当我使用pandas读取csv文件并找到
平均值
时,它
的
开头有一个额外
的
数字。97是数据
的
第一个条目(在A1
中
)。所有数字都在从A1到A100
的
表
中
,没有标题和数字
列
。谢谢
浏览 0
提问于2020-02-11
得票数 0
2
回答
Dask
DataFrame
的
逐行处理
、
、
我需要处理一个大文件并更改一些
值
。我想做这样
的
事情: lol = doOtherStuffWith(row)
dataFrame
['coly'][index] = lol 对我不好,我不能做数据帧‘’col
浏览 5
提问于2017-03-17
得票数 5
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
实时音视频
活动推荐
运营活动
广告
关闭
领券