腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如
何在
Dask
DataFrame
的
特定
索引
中
插入
新
列
?
python-3.x
、
dask
使用pandas,我可以在
特定
位置
插入
一个
新
列
,如下所示: df_all.insert(loc=10, column="label", value=label_column, allow_duplicates=True) 如何使用
dask
将
新
列
添加到
特定
位置?(至
dask
数据帧)
浏览 13
提问于2019-12-24
得票数 1
1
回答
dask
中
的
高效排序diff
python
、
dataframe
、
sorting
、
dask
我如
何在
Dask
中
以一种“高效”
的
方式做以下事情: 我
的
dask
dataframe
有
列
' date‘(日期时间)、' mac’(类别)和'ID‘(int),这些
列
已经按日期排序,我想获得一个
新
列
,其中包含针对给定mac地址
的
http请求到达
的
timedeltas。在pandas
中
,我会这样做:设置一个多
索引
浏览 4
提问于2017-02-27
得票数 3
回答已采纳
1
回答
替换
dask
数据帧分区
dask
我是否可以用我单独创建
的
另一个
dataframe
分区替换一个
dataframe
分区,该分区
的
行数和结构相同?如果是,怎么做? 有可能有不同
的
行数吗?
浏览 3
提问于2018-06-29
得票数 2
回答已采纳
1
回答
在
dataframe
上
的
groupby然后按一
列
排序
pandas-groupby
、
dask
想象一个简单
的
Dask
数据集,它有两
列
:-事务日期-事务数量df = taxi_data.Date.value_counts().compute() 输出如下所示:2019-01-25 291288 2019-01-11 290607
浏览 6
提问于2020-04-17
得票数 1
回答已采纳
3
回答
AttributeError:'
DataFrame
‘对象没有属性'sort_values’
python
、
python-3.x
、
pandas
、
dataframe
、
dask
我只是想通过一个
特定
的
列
来订购
dataframe
。my_ddfnpartitions=1 headers .....这是df.sort_values(columns, ascending=False).head(n)pandas官方
dask
文档
中
的
一个例子--只有pandas --
DASK
答案-- --我不想把它设置为
索引
,因为我只想拥有当前
的
<
浏览 5
提问于2021-01-27
得票数 2
回答已采纳
1
回答
使用另一个
dataframe
的
值创建
新
的
dask
dataframe
列
会导致“块大小未知”错误。
python
、
dask
我正在尝试在
dask
dataframe
中
创建一个
新
列
,它
的
值将是来自另一个
dataframe
的
特定
索引
值。import pandas as pdimport
dask
.
dataframe
as dd holdings=pd.
DataFrame
({'cusip': ['目标是,对于持有量
浏览 0
提问于2019-04-01
得票数 1
回答已采纳
1
回答
用
Dask
、
DataFrame
和Pandas高效读取Timeseries数据目录
python
、
pandas
、
dask
我有一个目录
的
timeseries数据存储为CSV文件,每天一个文件。如何使用有效地加载和处理 免责声明:我坚持达克。
浏览 3
提问于2016-12-24
得票数 6
1
回答
如
何在
map_paritions
中
访问
dask
数据帧
索引
值?
pandas
、
dask
我正在尝试使用
dask
dataframe
map_partition来应用一个函数,该函数可以按顺序访问
dataframe
索引
中
的
值,并创建一个
新
列
。 下面是我尝试过
的
代码。import
dask
.
dataframe
as dd df = pd.
DataFrame
(index = ["row0" , "row
浏览 13
提问于2019-05-25
得票数 1
1
回答
在使用
Dask
pivot_table之后,我丢失了
索引
列
python
、
dask
在我使用pivot_table作为
Dataframe
并将数据保存到Parquet文件后,我正在松散
索引
列
。import
dask
.
dataframe
as dddf["Index"]=[1,2,3,1,2,3] 我可以选择A或B作为
索引
,但是我缺少index
列</e
浏览 4
提问于2017-03-06
得票数 4
回答已采纳
1
回答
用
Dask
DataFrame
计算正向差分?
python
、
dataframe
、
time-series
、
dask
如何使用
Dask
DataFrame
计算第一个离散差分?或者,在“潘达斯之声”
中
,我如
何在
达斯克做?从数学上讲,操作非常简单:从其自身
的
副本
中
减去一个
列
向量,移动一行或多行。我尝试过以以下方式在
Dask
中
实现diff(),但这些方法都没有工作(目前为止): df.value
浏览 5
提问于2016-11-08
得票数 3
回答已采纳
4
回答
如何读取一个非常大
的
CSV
的
一小部分行。熊猫-时间序列-大型数据集
python
、
pandas
、
time-series
、
bigdata
我在一个大
的
文本文件中有一个时间序列。该文件超过4GB。df = pandas.read_csv('super_size_file.log',我可能想要一个块一个块地加载,并重新整理每一块。但在我看来效率很低。 任何想法都欢迎。;)
浏览 0
提问于2019-05-23
得票数 2
回答已采纳
1
回答
找到重复
的
值
python
、
pandas
、
dask
我需要在
dask
DataFrame
中
的
列
中找到副本。Q:,在
dask
中
获取所有重复值
的
最佳方法是什么?我
的
想法:创建一个作为
索引
的
列
,然后是drop_duplicates,然后是join。df = pandas.
浏览 3
提问于2020-10-08
得票数 3
2
回答
将元组
的
列
拆分为两
列
python
、
python-2.7
、
pandas
、
dataframe
、
dask
我正在使用python2.7和
dask
table[col] = table.apply(lambda x: (x[col1],x[col2]), axis = 1, meta = pd.
Dataframe
) table[[col1,col2]] = table[col].apply(pd.Series) 这样做
的<
浏览 7
提问于2017-11-19
得票数 4
回答已采纳
1
回答
从
dask
dataframe
提供程序收集属性
python
、
pandas
、
dask
TL;DR:我如何从分布式读取
中
收集元数据(解析期间
的
错误)到
dataframe
集合
中
。 目前,我有一种专用
的
文件格式,用于输入
dask
.
DataFrame
。我有一个函数,它接受一个文件路径并返回一个pandas.
DataFrame
,
dask
.
DataFrame
成功地在内部使用该函数将多个文件加载到同一个
dask
.
DataFrame
。需要注意
的
是,在合理
的
浏览 7
提问于2016-01-26
得票数 2
回答已采纳
1
回答
在
Dask
DataFrame
中
修改
列
(例如,执行数学函数)
的
最佳方法是什么?
python
、
pandas
、
dataframe
、
dask
我是Pandas
DataFrame
对象
的
老手,但我很难找到一种干净、方便
的
方法来更改
Dask
DataFrame
列
中
的
值。对于一个
特定
的
例子,我试图将numpy.float
列
中
的
正值乘以-1,从而使它们为负值。下面是我当前
的
方法(我正在尝试更改
DataFrame
中
的
最后一
列
浏览 1
提问于2018-03-14
得票数 1
回答已采纳
1
回答
如
何在
dask
.
dataframe
中子集一行?
python
、
dataframe
、
subset
、
dask
我试图使用命令
dask
.
dataframe
从x.loc[0].compute()
中
只选择一行。它返回4行,所有行都有index=0。(我认为我重置是正确
的
,因为我做了reset_index(drop=False),我可以在
新
列
中看到原始
索引
)。我阅读了
dask
.
dataframe
文档,它说明了index=0可能有多个行,这是因为
dask
如何构造块数据。 所以,如果我真的希望通过使用index=0来设置一个行,我如何做
浏览 0
提问于2019-02-02
得票数 4
回答已采纳
3
回答
dask
DataFrame
等同于pandas
DataFrame
sort_values
python
、
dataframe
、
sorting
、
dask
对于
dask
DataFrame
来说,熊猫
中
的
sort_values相当于什么?我正在尝试扩展一些有内存问题
的
熊猫代码,转而使用
dask
DataFrame
。
浏览 2
提问于2016-11-02
得票数 10
2
回答
向
dask
.
dataframe
添加
dask
.array
列
python
、
dataframe
、
dask
我有一个
dask
数据帧和一个
dask
数组,它们以相同
的
逻辑顺序具有相同
的
行数。数据帧行通过字符串进行
索引
。我正在尝试将一个数组
列
添加到数据帧
中
。我尝试了几种方法,但都以其
特定
的
方式失败了。当结构在逻辑上兼容时,将
dask
数组
列
添加到
dask
数据帧
的
正确方法是什么?
浏览 15
提问于2018-01-09
得票数 8
1
回答
如
何在
Dask
中
对级联数据进行复位
索引
python
、
dataframe
、
indexing
、
concatenation
、
dask
我对达斯克并不熟悉,我认为这将是一个简单
的
任务。我希望从多个csv文件中加载数据,并将其合并到一个
Dask
数据框架
中
。在本例
中
,有5个csv文件,每个文件包含10,000行数据。显然,我想给合并
的
dataframe
一个唯一
的
索引
。所以我做了这个:dataframes = [ dd
浏览 1
提问于2020-04-23
得票数 3
回答已采纳
2
回答
如何利用
dask
高效并行化时间序列预测?
python
、
parallel-processing
、
time-series
、
forecasting
、
dask
我正在尝试使用
dask
并行处理python
中
的
时间序列预测。数据
的
格式是,每个时间序列都是一
列
,它们有一个月日期
的
共同
索引
。我有一个自定义预测函数,它返回带有拟合值和预测值
的
时间序列对象。我想要将这个函数应用于
dataframe
的
所有
列
(所有时间序列),并返回一个
新
的
dataframe
,并将所有这些序列上传到DB。npartitions=1) r
浏览 0
提问于2018-03-21
得票数 5
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
肝了3天,整理了90个Pandas案例
pandas从入门到上楼
Python使用DataFrame打印指定列的方法
机器学习之计算工具库(三)
8,二维dataframe——类Series操作
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券