腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
从
dask
中
具有
多个
值
的
列
创建
虚拟
对象
我
的
问题类似于这个帖子Create dummies from column with multiple values in pandas 目标:我想在下面产生类似的结果,但使用
dask
在熊猫
中
import0 0 1 3 0 0 0 0 0 0 0 上面的get_dummies()
的
类型为现在
的
问题是,没有get_dummies()用于等价于
dask
的
如
浏览 8
提问于2020-10-07
得票数 1
回答已采纳
2
回答
将元组
的
列
拆分为两
列
、
、
、
、
我正在使用python2.7和
dask
table[col] = table.apply(lambda x: (x[col1],x[col2]), axis = 1, meta = pd.Dataframe) table[[col1,col2]] = table[col].apply(pd.Series) 这样做
的
要点是,<
浏览 7
提问于2017-11-19
得票数 4
回答已采纳
2
回答
遍历
dask
序列(
从
dask
序列
中
获取唯一
值
到列表)
、
我需要遍历
dask
dataframe
中
的
唯一
值
。我使用.unique()来获取
列
的
惟一
值
,但是现在给了我一个不能用来迭代
的
dask
对象
。我需要知道如何将这些唯一
值
从这个
dask
对象
中
获取到一个列表(或类似的内容)
中
,这样我就可以使用这些
值
来迭代
dask
数据帧。dd.read_csv(
浏览 19
提问于2019-06-02
得票数 1
回答已采纳
1
回答
Pandas-
Dask
DataFrame Apply函数,返回列表
、
、
、
我正在尝试向
dask
数据帧添加
多个
列
,以存储apply函数
的
结果。这将是我关于堆栈溢出
的
第一个问题,我希望这个问题不会太长!
dask
数据帧,然后将函数'dfFunc’应用到数据帧
的
每一行。这段代码运行得很好,因为输出'res‘是原始
的
天气数据帧,其中有一个名为'NewCol1’
的
新
列
。我
的
困惑在于,如果我希望我
的
函数返回一个列表而不是单个
值</
浏览 5
提问于2018-10-11
得票数 1
1
回答
理解map_partitions在
dask
中
的
作用
、
、
、
我正在尝试理解
dask
中
的
map_partitions是做什么
的
。下面是我
的
例子:import pandas as pdimportddf.map_partitions(test_f ).compute(get=get)0 1.0Name: col_1, dtype: float64 ------
浏览 0
提问于2017-11-06
得票数 1
1
回答
来自延迟压缩csv
的
Dask
数据
、
、
、
我正在尝试从一组压缩
的
CSV文件
中
创建
一个
dask
数据文件。读到这个问题,
dask
似乎需要使用
dask
.distributed延迟()import
dask
.dataframe as ddimport pandasas pd #Create zip_dict with key-value pairs for .zip &
浏览 0
提问于2018-10-19
得票数 2
2
回答
使用
dask
hdf/parquet
的
Python大型数据集特征工程工作流
、
、
、
、
初始文件是一个不适合内存
的
csv。以下是我
的
需要: 首先,我把大csv文件分割成
多个
小
的
“地板”文件
浏览 0
提问于2018-03-29
得票数 2
1
回答
计算()在
dask
中
做什么?
、
我对
dask
并不熟悉,也不知道
dask
中计算()方法到底做了什么?它是一种打印
对象
的
方法吗?我
从
它
的
网站上读过文档,不确定我是否理解“具体价值”和“懒惰
的
达克”这两个术语。--您可以通过调用.compute()方法或
dask
.compute(.)将任何
dask
集合转换为具体
值
函数。这个函数将被阻塞,直到计算完成,直接从一个懒惰
的
dask
集合到本地内存
中
的<
浏览 5
提问于2019-11-05
得票数 0
回答已采纳
1
回答
如何在
dask
.dataframe中子集一行?
、
、
、
我试图使用命令
dask
.dataframe
从
x.loc[0].compute()
中
只选择一行。它返回4行,所有行都有index=0。我尝试了reset_index,但在重置后仍有4行
具有
index=0。(我认为我重置是正确
的
,因为我做了reset_index(drop=False),我可以在新
列
中看到原始索引)。我阅读了
dask
.dataframe文档,它说明了index=0可能有
多个
行,这是因为
dask
如何构造块数据。 所以,如果我
浏览 0
提问于2019-02-02
得票数 4
回答已采纳
5
回答
默认pip安装
Dask
提供"ImportError:无模块名为toolz“
、
、
、
、
我使用这样
的
pip安装了:当我尝试执行import
dask
.dataframe as dd时,我会得到以下错误消息: File "<stdin>", line 1, in <module> File "/path/to/venv/lib/python2.7/site-pack
浏览 9
提问于2017-01-03
得票数 22
回答已采纳
1
回答
如何使用
dask
并行导入hdf5数据并
创建
dataframe?
、
、
、
我完全被困住了,所以我正在寻求善意
的
建议。我
的
目标是并行读取
多个
hdf5文件,提取内部
的
多个
模糊数组,并将每个数组存储在一个dataframe
的
一行,准确地说是一个单元格
中
。不可能使用read_hdf()
从
用h5py
创建
的
hdf5文件
中
读取。我能做些什么来用paralleL
中
的
dask
导入数千个hdf5 5文件,并访问其中
的
<e
浏览 0
提问于2021-09-30
得票数 1
回答已采纳
1
回答
替换
dask
数据帧分区
我是否可以用我单独
创建
的
另一个dataframe分区替换一个dataframe分区,该分区
的
行数和结构相同?如果是,怎么做? 有可能有不同
的
行数吗?
浏览 3
提问于2018-06-29
得票数 2
回答已采纳
2
回答
将groupby.apply输出连接到单个数据帧
、
、
、
、
我使用
dask
dataframe.groupby().apply(),并将
dask
系列作为返回
值
。我是每个组
的
一个列表三胞胎,如(a,b,1),然后希望把所有的三胞胎变成一个单
dask
数据帧。: dfs必须是DataFrames/Series
对象
的
列表 print type(result) 怎样才能正确地将
浏览 4
提问于2017-11-10
得票数 2
回答已采纳
1
回答
从
具有
多个
值
的
单元格
创建
虚拟
列
、
、
Or_Ba-AR-B4 Lo_In-AR-U6 Or_Ba-AR-B7 N7 N
浏览 2
提问于2018-08-19
得票数 1
回答已采纳
2
回答
将
dask
转换为pandas数据帧
、
、
、
我有一个与这个问题非常相似的问题:
Dask
read_csv-- Mismatched dtypes found in pd.read\_csv/pd.read\_table 我正在运行以下脚本: importpandas as pddf2 = dd.read_csv("Path/*.csv", sep='\t', encoding='unicode_escape'STVZE', 'STVT'
浏览 39
提问于2020-04-15
得票数 0
1
回答
dask
读取
具有
不同模式
的
多个
拼图文件
、
、
、
、
我想用
dask
将
具有
不同方案
的
多个
拼图文件读取到pandas dataframe,并能够合并这些方案。当我谈到不同
的
方案时,我
的
意思是,在所有这些文件中都有公共
列
,但在一些文件中有其他文件
中
没有的
列
。不幸
的
是,当我用 dd.read_parquet(my_parquet_files, engine="fastparquet") 我只有普通
的
列
可读。我知道在spa
浏览 40
提问于2019-09-04
得票数 0
1
回答
尝试将数据分组并将其写入文件
、
我想知道是否有人知道根据
Dask
中
的
列
的
值
写出一组文件
的
正确方法。换句话说,如果我想根据
列
中
的
值
对一组
列
进行分组,并将它们写到CSV
中
。我一直在尝试对
Dask
使用groupby-apply范例,但问题是它不返回
dask
.dataframe
对象
,所以我应用它
的
函数使用Pandas API。 有没
浏览 12
提问于2021-09-21
得票数 1
回答已采纳
1
回答
没有模块名为“modin”
、
、
我在windows终端
中
创建
了一个
具有
以下语法
的
虚拟
环境:conda activate e:\modin\modinenvjupyter notebook在一个新
的
python文件
中
,当我执行以下命令时:它给了我一个错误:模块
创建<
浏览 4
提问于2021-01-28
得票数 1
0
回答
在
Dask
中
连接/查找/映射
列
值
的
最有效方法是什么?
、
给定一个
Dask
DataFrame,我正在尝试找到应用静态
值
查找
的
最有效方法。在
Dask
中
实现这一点<em
浏览 4
提问于2017-06-13
得票数 2
回答已采纳
4
回答
在熊猫中用
多个
值
的
列
创建
假人
、
、
、
我正在寻找一种pythonic
的
方法来处理以下问题。现在,我需要处理这件事。一个
列
,让我们称之为“标签”,
具有
类似于['A&
浏览 1
提问于2013-09-19
得票数 37
回答已采纳
点击加载更多
相关
资讯
肝了3天,整理了90个Pandas案例
数据分析工具Pandas的数据结构学习
使用 Dask在Python 中进行并行计算
《SQL入门经典》笔记
python奇遇记:数据结构窥探3
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券