腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Dask
,
根据
下一
行
添加
新
列
、
、
、
我有这个
dask
数据框架,最后一
列
是这个问题的重要信息:
Dask
DataFrame Structure: asks[0].amount asks[1].amount asks现在我需要
根据
下一
行
'currentPrice‘
添加
一个
新
的
列
(名为succPrice)。数据帧非常大,所以我需要使用
dask
浏览 20
提问于2021-08-31
得票数 0
回答已采纳
4
回答
根据
现有
列
向Dataframe
添加
多行和单列
、
我想要
添加
新
行
,并
根据
现有
列
添加
一个
新
列
。这些值用于
新
的
行
和
列
:{a: [x, y, z], b: [x, w, r], c: [x, q]} A C 3 x 4 x 4
浏览 1
提问于2019-02-11
得票数 2
回答已采纳
1
回答
将熊猫系列
添加
到
dask
dataframe中
、
、
将熊猫系列
添加
到
dask
dataframe中的惯用方法是什么? 熊猫在处理数据方面要灵活得多,所以我经常将部分
dask
数据存储在内存中,操作
列
并创建
新
的
列
。然后,我想将这些
新
列
添加
到原始的
dask
数据格式中。如何才能做到这一点?
浏览 0
提问于2017-06-29
得票数 4
1
回答
KeyError:当尝试选择
dask
数据框上的
列
时:“没有[索引([‘’,''],dtype='object')]在[
列
]中”
、
我正在使用from_pandas()函数从熊猫数据帧创建一个
dask
数据帧。当我尝试使用方括号[ ]从
dask
dataframe中选择两
列
时,我得到了一个KeyError。
根据
dask
文档,
dask
dataframe支持像pandas dataframe一样的方括号
列
选择。# data is a pandas dataframe data = data[
dask</e
浏览 67
提问于2019-10-04
得票数 1
1
回答
如何在
Dask
DataFrame的特定索引中插入
新
列
?
、
使用pandas,我可以在特定位置插入一个
新
列
,如下所示: df_all.insert(loc=10, column="label", value=label_column, allow_duplicates=True) 如何使用
dask
将
新
列
添加
到特定位置?(至
dask
数据帧)
浏览 13
提问于2019-12-24
得票数 1
1
回答
从多个csv文件读取外部连接
import
dask
.dataframe as ddfrom
dask
import delayed df1 = pd.DataFrame({'a': np.arange
浏览 2
提问于2016-12-14
得票数 2
回答已采纳
3
回答
如何为
Dask
数据框中的
列
赋值
、
、
、
如何对
dask
数据帧执行与以下代码相同的操作。if (condition): else:我想在
dask
数据框中
添加
一个
新
列
,并在
新
列
中插入0/1。
浏览 0
提问于2020-03-04
得票数 2
2
回答
Dask
数据文件:读取多个文件&将文件名存储在
列
中
、
、
、
我经常使用
dask
.dataframe读取多个文件,如下所示:然而,每一
行
的起源,即数据是从哪个文件读取的是否有方法将其
添加
为
列
,例如,如果df.loc[:100, 'partition'] = 'file1.csv'是第一个文件并包含100
行
,则为file1.csv。其思想是,
根据
源的不同,可以应用
浏览 0
提问于2018-02-14
得票数 6
回答已采纳
1
回答
Pandas-
Dask
DataFrame Apply函数,返回列表
、
、
、
我正在尝试向
dask
数据帧
添加
多个
列
,以存储apply函数的结果。这将是我关于堆栈溢出的第一个问题,我希望这个问题不会太长!数据帧,然后将函数'dfFunc’应用到数据帧的每一
行
。这段代码运行得很好,因为输出'res‘是原始的天气数据帧,其中有一个名为'NewCol1’的
新
列
。我的困惑在于,如果我希望我的函数返回一个列表而不是单个值,那么我该如何着手在
dask
数据帧中创建多个
列
。 从之前的线程来看,通过使用列表,这应该是在
浏览 5
提问于2018-10-11
得票数 1
1
回答
就地修改大于内存的
Dask
数组
、
、
我有一个
dask
数组,X,大约是。3500x700000。每一
行
都有缺失值,我需要
根据
该行的平均值进行推算。有没有一种方法可以将这种估算应用于适当的数组,以便最终将估算的数组作为内存不足的
dask
数组?
浏览 11
提问于2018-09-09
得票数 2
1
回答
用
dask
等价物加快“中间”函数的速度
、
、
、
我试图想出一种快速的方法,在dataframe中
添加
一个
新
列
,其中所
添加
的值是基于条件的。有人向我推荐了一种使用numpy的方法,但它相对来说非常慢。目前,我正在加载一个11米
行
csv,
添加
了几个
新
的
列
谁有公式计算,并打印头尾在10秒以下。 下面是当前用于缓慢/麻烦函数的代码。我想知道是否有一种与
dask
相对应的方法,或者是否可以更好地构造numpy查询以提高性能。import
dask
.dataframe
浏览 2
提问于2019-10-06
得票数 0
2
回答
如何在
dask
中使用'loc‘选择数据帧的
列
、
、
、
、
谁能告诉我应该如何使用
dask
在数据框中选择一
列
“loc”?错误: File "/usr/local/
dask
-2018-08-22/lib/python2.7/site-packages/
dask
-0.5.0-py2.7.egg/
浏览 1
提问于2018-08-26
得票数 4
1
回答
在
dask
dataframe中用每
列
最大值填充NaNs
、
当值为np.nan时,我需要在数据中计算每个
列
中的最大数目。不幸的是,在SimpleImputer中,
根据
文档,这种策略是而不是支持的: meta = [('height', 'float'),('weight', 'float')] df_
dask
= df_
dask
.apply(lambda x: x.fillna(x.
浏览 8
提问于2022-08-21
得票数 1
回答已采纳
1
回答
如何将
dask
数据交换(将
列
转换为
行
)以接近整洁的数据原则
、
、
、
、
TLDR:我从一个
dask
包创建了一个dataframe。
dask
dataframe将每个观察(事件)作为一
列
对待。因此,我没有为每个事件设置行数据,而是为每个事件设置了一
列
。其目标是将
列
转换为
行
,就像熊猫可以使用df.T转换数据格式一样。df = b.to_dataframe()问题----我所有的个别事件(即tweet)都被记录为
列<
浏览 7
提问于2016-08-04
得票数 4
回答已采纳
2
回答
如何
根据
dask
dataframe
列
写入文件名?
、
我有一个
dask
数据帧,我想保存到s3。数据帧中的每一
行
都是一个“时间戳”
列
。我想
根据
时间戳
列
中的日期对s3中的路径进行分区,因此s3中的输出如下所示:s3://..data/date=2019-01-01/part2.json.gz... s3://....BUCKET_N
浏览 16
提问于2019-07-16
得票数 2
1
回答
如何在
dask
.dataframe中子集一
行
?
、
、
、
我试图使用命令
dask
.dataframe从x.loc[0].compute()中只选择一
行
。它返回4
行
,所有行都有index=0。我尝试了reset_index,但在重置后仍有4
行
具有index=0。(我认为我重置是正确的,因为我做了reset_index(drop=False),我可以在
新
列
中看到原始索引)。我阅读了
dask
.dataframe文档,它说明了index=0可能有多个
行
,这是因为
dask
如何构造块数据。 所以,如果我
浏览 0
提问于2019-02-02
得票数 4
回答已采纳
1
回答
在dataframe上进行
Dask
计算以
添加
列
返回AttributeError
、
、
、
、
我有一个函数,它使用函数将
列
添加
到DataFrame中,例如 resp_data = {'status': '1', 'data': x}return json.dumps(resp_data)import
dask
.dataframe as ddddf = dd.from_pandas(df, npartitions
浏览 2
提问于2022-01-27
得票数 1
回答已采纳
1
回答
Dask
groupby索引
列
、
、
我使用dd.read_csv(s3://bucket/*)将大量csv文件(几千个)从s3加载到
dask
中。这些文件有一个隐含的索引
列
(升序的未命名列):有没有办法使用ddf.groupby()操作来
根据
索引值对csv文件进行分组?我尝试使用groupby(axis=0)和groupby(level=0),但在
dask
中返回错误。我唯一的另一个想法是使用for循环加载文件,然后显式地手动
添加
一个
新
的索引
列
--但这似乎是一个不必要
浏览 8
提问于2017-07-12
得票数 1
回答已采纳
1
回答
对
DASK
中的
列
中的每个值运行mysql查询
、
、
此CSV文件作为
dask
-dataframe导入。进入数据帧后,我需要为id
列
中的每个条目获取该user-id,并在其上运行一个SQL查询来获取该user -id的用户名,并将其
添加
到
新
列
中的dataframe。我有几个这样的
列
需要获取。我不确定对
DASK
数据帧中的值运行select查询的
dask
方法是什么。我该怎么做呢?我不想走命令式路线,并使用for循环来解决它。
浏览 26
提问于2020-03-18
得票数 1
回答已采纳
2
回答
“
列
赋值不支持numpy.ndarray类型”
、
、
、
、
我试着用
Dask
代替熊猫,因为我分析的数据很大。我想
根据
几个条件
添加
一个标志
列
。import
dask
.array as da
浏览 5
提问于2022-05-29
得票数 2
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券