为什么dask系列没有实现__getitem__？_为什么我的代码给TypeError: TypeError：'int‘对象没有属性'__getitem__'？_如何检查为什么Dask在变量覆盖时没有释放内存 - 腾讯云开发者社区

、、

我在使用dask系列对象做任何有用的事情时遇到了麻烦。在我设法创建了一个之后，我不能在比序列对象本身更低的级别上使用它。import numpy as npimport dask.dataframe as ddf for i in range(5):我想我希望它返回某种类型的dask对象，在计算时，该对象返回文件中的数据。

浏览 9提问于2019-04-10得票数 0

回答已采纳

1回答

具有分布式调度程序的dask.delayed KeyError

、、、、

我想使用dask.delayed对此函数进行一系列调用。代码在没有dask的情况下成功运行 # Interpolate w/o daskfrom dask.distributed import Clientres

浏览 19提问于2020-04-07得票数 2

2回答

dask.dataframe.groupby.DataFrameGroupBy错误

、、、、

我在两个列上使用了groupby ( df有大约70列，除日期时间外，所有列都是浮动的)来获得dask数据文件：我不能使用结果，因为它是以某种奇怪的格式：如何将结果作为dataframe/dataframe/groupby.py in __getite

浏览 3提问于2021-01-26得票数 1

回答已采纳

1回答

使用dask并行化数据迭代器

、、、、

我实现了一个数据迭代器，它从两个numpy数组中获取对象，并在返回对象之前对它们进行非常密集的CPU计算。我想使用Dask并行化这一点。self.x = x return len(self.x) def __getitem有人能帮忙使用dask并行化它吗？

浏览 3提问于2019-12-20得票数 1

回答已采纳

1回答

如何在dask中转换/重命名类别

、

我正在尝试将dask数据帧的dtype 'category‘列的类别重命名为从1到len(类别)的一系列数字。在熊猫中，我是这样做的：但在dask中，这是行不通的： out = self.g

浏览 0提问于2016-10-19得票数 1

2回答

索引到Dask系列可以返回Dask系列

、、

我有Dask系列的Dask数据帧。但是，使用loc[0]会导致另一个dask系列。使用to_frame也不起作用，因为结果是"Dask系列Dask数据帧的Dask数据帧“。下面是一个使用Dask系列Pandas数据帧的最小示例(不完全相同，但说明了问题)： import pandas as

浏览 3提问于2020-02-03得票数 1

1回答

我正在尝试获取一个dask数据帧，按列'A‘分组，并删除行数少于MIN_SAMPLE_COUNT的组。\dataframe\groupby.py in __getitem__(self, key)-> 11541155 return g ~\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\base.py in __getitem中<em

浏览 15提问于2019-03-22得票数 2

回答已采纳

1回答

基于Dask.Series创建类别代码映射

、、、、

我有一个已知的带有分类数据类型的Dask.Series。我想创建一个小的dataframe，它显示相关的映射，而不必计算整个系列。我该如何实现这一点？中创建了一个类别系列。，这与使用dask的目的背道而驰。我还没有在dask中找到任何可以帮助我在没有重新分区的情况下做到这一点的东西，这是我不想做的。还要注意，尽管该示例可以访问用于设置目的的DataFrame，但我实际上没有访问原始数据帧的权限，因此它需要从系列“测试

浏览 10提问于2020-11-14得票数 0

回答已采纳

1回答

Dask:创建严格增加的索引

、、

正如详细记录的那样，在调用reset_index时，Dask在每个分区基础上创建一个严格增加的索引，从而导致整个集合上的索引重复。编辑谢谢@MRocklin，我已经做到了这一点，但是我需要一些关于如何将我的系列与原始的dataframe重新组合的帮助。Consider using dask.repartition.")

浏览 3提问于2017-11-30得票数 7

回答已采纳

1回答

dask数据帧中行及其前导3行之间的差异

、、、

我有一个CSV文件，它已经通过以下代码作为dask数据帧导入： import dask.dataframe as dd df = dd.read_csv("name and path of the file.csv我们可以在熊猫身上完成这项任务，如下所示 df['col4'] = df.groupby('col1')['col2'].transform(lambda x: x.shift(-3)) / df['col2'] - 1 但它在dask</e

浏览 9提问于2019-01-22得票数 0

1回答

支持带有头的CSV文件

、、

dask似乎不支持读取包含头的CSV文件。当我试着读它时，我得到了我可以阅读同样的文件，熊猫没有问题，达克没有标题，但他们达克属性的第一行作为标题

浏览 4提问于2015-12-02得票数 0

回答已采纳

2回答

dask计算结果存储吗？

、、、、

考虑以下代码import dask.dataframe as dddf_pd = pd.DataFrame(data_dict) df_dask['data1x2'] = df_dask['d

浏览 8提问于2022-04-03得票数 2

回答已采纳

3回答

dask_geopandas:只有几何列的GeoDataFrame

、、、、

points = [Point(0,0)]gdf = gpd.GeoDataFrame(geometry=gser.values)为了澄清:我有一个dask_geopandas.GeoSeries (没有g

浏览 15提问于2022-08-09得票数 1

回答已采纳

3回答

如何将dask.dataframe与自定义dsk图一起使用

、

我将尝试重新表述我的问题：id,names,amount387,Tim,208129,Patricia,284import dask.dataframeas ddfrom dask.threaded import get dsk = {

浏览 5提问于2015-10-21得票数 2

回答已采纳

0回答

在Dask中连接/查找/映射列值的最有效方法是什么？

、

给定一个Dask DataFrame，我正在尝试找到应用静态值查找的最有效方法。 df["user_id_mapped"] = id_lookup_series[df["user_id"]].reset_index(drop=True

浏览 4提问于2017-06-13得票数 2

回答已采纳

1回答

用dask.array.core.map_blocks实现三维数组计算的并行化

、、、

我有一个3Dnumpy数组(维度:深度、纬度、经度)，我正在尝试使用每个经纬点的深度轴上的数据进行一些并行计算，到目前为止我还没有成功。我看过dask.array.core.map_blocks的文档，但它并没有什么帮助。_profile( /home/takaya/.cond

浏览 0提问于2016-06-23得票数 0

1回答

将熊猫转换成dask代码，就会出错

、

reset_index(name="courses_json") 但是当我将dataframe转换为Daskfrom dask import dataframe as dd Input In [37], in <module> 1 from das

浏览 10提问于2022-03-07得票数 0

回答已采纳

2回答

移动dataframe中的所有行

、、、

我想要做的是：import pandas as pd with pd.HDFStore(path) as(我知道该方法还会捕获从有符号值到零的更改)，然后使用布尔序列索引不同的Dask数据帧进行绘图。

浏览 6提问于2015-12-11得票数 6

回答已采纳

1回答

Dask正则表达式提取与NotImplementedError比较失败

我有一个Dask数据帧，看起来像这样： class1 statement class2\dataframe\core.py in __getitem__(self, key) 3350 NotImple

浏览 10提问于2020-01-21得票数 0

回答已采纳

1回答

达克群作为一个独特的框架-怎么做？

、、、

我几乎没有数据：import numpy as np ['2018-01-01 00:00:00',cust_id', 'time'])['device_id'].unique().to_frame() 我试着对达斯克做了同样的事情：我有以下问题： 为什么我不能使用

浏览 0提问于2018-12-29得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云