腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Pandas
矢量化
:
基于
JSON
文件
的
累积
和
python
、
json
、
pandas
、
vectorization
我正在尝试根据一个DataFrame
和
两个
json
-files中
的
值对分数求和。我有一个最小
的
示例
和
最小
的
解决方案,但这需要以某种方式向量化,因为在实际情况中有超过一百万行,运行1%
的
行需要大约40分钟。分数应该是从
json
-files检索到
的
累积
总和,具体取决于df中
的
值。 看一下我
的
第一行,我有(var_1=-1, var_2=1, var_3=0)。由于同一行为usage=&
浏览 13
提问于2021-05-11
得票数 1
回答已采纳
2
回答
Python数据框架中
的
滚动
和
累积
标准差
python
、
pandas
、
dataframe
、
standard-deviation
是否有一个
矢量化
操作来计算Python DataFrame
的
累积
和
滚动标准差(SD)?例如,我想添加一个列'c‘,它根据列'a’计算
累积
SD,即在索引0中,它显示由于1个数据点而导致
的
NaN,在索引1中,它
基于
2个数据点计算SD,依此类推。import
pandas</
浏览 59
提问于2017-07-03
得票数 5
1
回答
选择性
累积
和
的
矢量化
pandas
、
numpy
、
vectorization
我有一个
pandas
Series,其中每个元素都是一个包含索引
的
列表:此外,我还有一个数组,其值与每个索引相关联:我希望创建一个新
的
Series,其中包含由输入Series行中
的
索引给出
的
数组元素
的
累积
和
。在本例中,输出Series将包含以下内容: 0 [0
浏览 0
提问于2018-05-08
得票数 0
回答已采纳
1
回答
Pandas
中日期时间转换
的
问题
python
、
python-3.x
、
pandas
、
datetime
、
python-datetime
这里是我
的
问题
的
一个重复
的
例子: "2018-01-13 07:23:36+0100",产出如下:类“
pandas
浏览 2
提问于2019-01-04
得票数 2
2
回答
pandas
中唯一值
的
累积
计数
pandas
我想从熊猫框架中
的
一列中逐周
累积
计算唯一值。2 | 2 | B |+---+---------+------+-----------+print(result)但是我
的
真实数据帧是巨
浏览 26
提问于2019-07-16
得票数 5
回答已采纳
2
回答
pandas
:只保留累计更改了阈值
的
每一行?
python
、
pandas
、
numpy
我感兴趣
的
是提取列值累计上升至少5或累计下降至少5
的
行,然后获得这些
累积
更改
的
符号up_or_down。up_or_down6 4 # -112 16 # +1我
的
数据帧非常大,所以我希望有一种很好
的
矢量化
方法来使用
pandas
的
API来完成这项工作,而不是使用iterrows()遍历它。
浏览 1
提问于2016-09-11
得票数 4
1
回答
从1:n到列表R
的
每个元素
r
、
functional-programming
、
vectorization
、
apply
、
lapply
我试图编写一个函数,如果列表元素小于列表中
的
任何先前值,该函数将向另一个列表中添加一个list元素。我有一个非
矢量化
的
版本,可以:# Return a list问题是,对于list x
的
每个元素x,我需要能够找到子集x[1:n - 1]
的
最小值。这可以在lapply (或其他
矢量化
)中完成吗?如何说“如果元素小于列表中
的</em
浏览 2
提问于2014-05-09
得票数 1
回答已采纳
5
回答
NaN
的
Cumsum重置
python
、
numpy
、
pandas
、
cumsum
如果我有一个名为
pandas
.core.series.Series
的
ts,无论是1还是NaN,都是这样
的
:3381 NaN3369 NaN9 NaN7 NaN3 NaN5 11 NaN我想计算这个意甲
的
累积
和
,但是它应该在NaNs
的
位置被重置(设置为零),如下所示: 33
浏览 21
提问于2013-08-12
得票数 22
回答已采纳
2
回答
使用
pandas
的
累积
运行回报
pandas
、
finance
、
quantitative-finance
我正在做
基于
6个月
的
月度回报
的
滞后
累积
回报。所以这是一个运行
的
总数。我知道在Excel中怎么做。如下图所示。我如何在
Pandas
中做到这一点? ?
浏览 85
提问于2021-11-02
得票数 1
1
回答
pandas
:如何检查浮动列中
的
空值?
pandas
'cancelled_by_user'df 但是我没有得到我想要
的
结果我希望最后两行读取cancelled_by_user,因为stripe_subscription_id列是空
的
。
浏览 94
提问于2019-12-24
得票数 0
回答已采纳
1
回答
数学等价于
Pandas
群与
和
pandas-groupby
、
wolfram-mathematica
从2020年1月起,我将世界卫生组织(WHO)
的
csv
文件
与每个国家
的
新冠肺炎病例一起导入Mathematica。档案以“报告日期”、“国家代码”、“国家名称”、“世卫组织区域”、“新病例”、“
累积
病例”、“新死亡”、“累计死亡”作为列()。我想将这些国家按同一“世卫组织区域”分组,并将“新病例”、“
累积
病例”、“新死亡病例”
和
“累计死亡病例”相加,这些国家
的
“报告日期”相同(例如,每天对欧洲所有
累积
病例进行汇总)。我可以很容易地在Python中使用<
浏览 3
提问于2022-04-02
得票数 2
3
回答
熊猫
的
逐行矢量法洗牌
python
、
pandas
、
numpy
、
permutation
我想洗牌熊猫数据框架
的
列。但是,默认方法(示例)以相同
的
方式对所有列进行洗牌。display(df)当然,
基于
apply
的
解决方案可以工作--但
浏览 0
提问于2021-07-22
得票数 1
回答已采纳
2
回答
不带group by
的
列
的
累积
百分比
python
、
cumsum
我有以下数据帧: import
pandas
as pd data = [['2020-08', 'Peter', 0.5], ['2020-08', 'Tom', 0.29], ['2020-08我想有一个新
的
列与
累积
百分比
的
基础上列“日期”
和
破坏。所需
的
数据帧应如下所示: ? 如果我理解正确的话,数据帧已经是grouped_by了。目标是根据“破坏”获得“日期”列
的
<
浏览 24
提问于2020-10-22
得票数 0
1
回答
平均到数组
的
第一元素
python
、
arrays
、
numpy
、
slice
、
mean
我需要计算数组
的
平均值(长度n),但只需要计算i-ith元素(i<=n)
的
平均值。例如,一个包含骰子卷
的
数组。x_mean_ith[0] = x[0] for i in range(1,n):目前,当数组
的
顺序为n= 10^6时,这部分代码将占用2分钟。是否有一种更明智
的
方法来计算这一点,而不需要花费很多时间,内存
的
使用并不重要。
浏览 2
提问于2022-01-05
得票数 0
回答已采纳
1
回答
熊猫:条件
累积
和
的
矢量化
python
、
pandas
、
vectorization
我正在尝试向量化熊猫中
的
for循环,以提高性能。我有一个由用户、产品、每项服务
的
日期以及提供
的
天数组成
的
数据集。给定以下子集
的
数据: "PRODUCTID":over_under
的
运行
和
,但是如果上一行
的
期望值大于0,则只能将负值之和。1
浏览 0
提问于2016-11-21
得票数 2
回答已采纳
2
回答
pandas
DataFrame
的
矢量化
反向测试创建
python
、
pandas
、
vectorization
这是我在发布了几个可能被糟糕地解决/描述
的
问题之后
的
最后一次尝试。当Signal为==1时,buy_units等于当前balance(来自前一行
的
值)除以price。然后,balance会减少cashflow (即单位x价格*-1)。其余部分应该是不言而喻
的
。问题:计算buy_units不需要迭代,而是以
矢量化
的
方式。谁知道如何解决这个问题?最终,我想用"Calculate units“
和
"calculate balance”方法来设计这个
浏览 1
提问于2016-06-06
得票数 3
1
回答
提高大熊猫群
的
性能
python
、
pandas
当我编写它时,我最初在
Pandas
DataFrames上进行了数据处理,但是当这导致了糟糕
的
性能时,我最终用普通
的
Python重写了它,使用
的
是for循环,而不是
矢量化
的
操作,列表
和
切分,而不是DataFrames由于我
的
手工编码
的
数据处理代码比原来
的
Pandas
代码要大得多,而且更加混乱,所以我还没有完全放弃使用
Pandas
,而且我目前正在尝试优化
Pandas
浏览 1
提问于2017-11-20
得票数 37
回答已采纳
1
回答
如何使用Pyspark将.CSV
文件
转换为.
Json
文件
?
python-3.x
、
eclipse
、
pyspark
、
rdd
、
pydev
我有一个问题,在转换.csv
文件
到多行
json
文件
使用pyspark。import
json
for row in df_
json
浏览 9
提问于2018-12-08
得票数 2
3
回答
如何沿矩阵轴进行滚动求和?
python
、
numpy
、
scipy
、
vectorization
、
array-broadcasting
具有T行
和
列k
的
给定矩阵XH = 10X = np.arange(T).reshape(T,1)*np.ones((T,k))Xcum= np.zeros((T-H,k)) Xcum[t-H,:] = np.sum( X[t-H:t,:], axis=0 ) 注意,最好避免跨步
和
卷积,在广播/
矢量化
最佳实践下。
浏览 1
提问于2014-08-28
得票数 4
3
回答
如何在没有lambda
的
行上使用
pandas
apply函数?
python
、
pandas
、
dataframe
、
pandas-apply
我不太理解apply函数是如何工作
的
。你能告诉我如何使用我
的
函数而不使用lambda函数吗?不会成功
的
。;函数很难看:函数不是泛型
的
,并且绑定到row.a
和
row.bdftest['concat'] = dftest.apply(lambda row: test2(row['a'], row['b']), axis=1) 如果不在复杂函数上使用lambda并使用良好
的
编码实践,
浏览 10
提问于2019-01-25
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python使用pandas读取Excel文件多个WorkSheet的数据并绘制柱状图和热力图
这几个方法颠覆你对Pandas缓慢的观念!
还在抱怨pandas运行速度慢?这几个方法会颠覆你的看法
Pandas 初学者代码优化指南
这样做能让你的 pandas 循环加快 71803 倍
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券