腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
循环
优化
的
Pandas
python
、
pandas
、
for-loop
、
dataframe
、
optimization
我是python
的
新手,虽然我可以毫无问题地编写for
循环
,但我发现它们慢得可怕。下面是我
的
代码: percent = float(percent)match_maker为两个数据帧中
的
每一行调用perc_match,并将输出放在df_match中其各自
的
浏览 0
提问于2018-07-24
得票数 1
1
回答
熊猫-在滚动窗口中计算大于x值
的
最快方法是什么?
python
、
pandas
给定一个熊猫系列a,对于每个值a[i],我需要计算a[i-window:i-1]中有多少值大于a[i]import
pandas
a =
浏览 3
提问于2016-05-22
得票数 1
回答已采纳
1
回答
读取单个数据中
的
多个csv文件
python
、
performance
、
python-3.x
、
csv
、
pandas
我在一个目录中有很多压缩
的
csv文件。我想把所有这些文件都放在一个数据文件里。到目前为止,这就是我所做
的
:for filename in os.listdir(path): df = df.append(temp) 我注意到,上面的代码一开始运行得相当快,但随着读取越来越多
的
文件,它
的
运行速度越来越慢。
浏览 0
提问于2020-01-15
得票数 4
回答已采纳
1
回答
在python中连接Dataframe
的
列?
python
、
pandas
我使用下面的代码生成了一个数据框架:import
pandas
as pd df = pd.DataFrame'Cost':[10000, 5000, 15000, 2000]}) print(df) [A_Music_Theater_10000, B_Poetry_Music_5000,C_Theatre_C
浏览 3
提问于2019-10-16
得票数 1
回答已采纳
1
回答
如何通过
Pandas
DataFrame
优化
循环
python
、
pandas
、
loops
我知道
循环
遍历
Pandas
dataframe通常是个坏主意,但在这种情况下,我不知道还能做什么。我有一个名为DataFrame
的
合并,格式如下,但是有2kk行长。01977 4 7912 NaN 0 我要做
的
是,如果是选举年,根据下面的计算来标记每一行,并将其余
的
观察结果保持为NaNs,并将PostElection列从0更改为1,如果下面的条件为true。下面
浏览 0
提问于2020-06-11
得票数 0
1
回答
优化
循环
中
的
pandas
切片操作
python
、
pandas
这是我
的
数据结构,Date Time是唯一
的
,用作包含700,000行不同日期
的
pandas
数据帧
的
索引。62.23 62.34 62.22 62.29 0我想切片只包含符合以下条件
的
行
的
数据帧- 1.行
的
日期必须与指示符值为1
的
行相同2.只有在时间上向前
的
行应该被切片 代码执行大约需要10-
浏览 0
提问于2020-04-10
得票数 0
1
回答
Python
循环
遍历数据框并在IF中添加2个条件以使其不能达到最终索引和增量将返回错误
python
、
pandas
、
data-science
我正在尝试
循环
一个数据帧,以检查3个连续
的
索引是否满足以下条件: df.loc[idx, "GDP"] > df.loc[idx+1, "GDP"] > df.loc[idx+2, "GDP"] 一旦得到满足2): print(df.loc[idx, "Quarter"], df.loc[idx, "GDP"], len(df.index)-3) 我添加了另一个条件,以防idx在它
的
最大值我收到了正确<em
浏览 7
提问于2020-08-26
得票数 0
2
回答
熊猫DataFrame替换不适用于inplace=True
python
、
pandas
、
numpy
、
jupyter-notebook
、
data-science
在数据框架
的
列中,我
的
版本号(如6.3.5、1.8、5.10.0 )保存为对象,因此很可能是字符串。我不想用任何东西去除点,所以我得到635,18,5100。我
的
密码想法是: row.replace(".","",inplace=True) 问题是,如果我不设置到True
的
位置,它就能工作,但是我们想要覆盖它并保护它。
浏览 0
提问于2018-12-05
得票数 3
回答已采纳
2
回答
迭代熊猫系列/列
的
最快方法
python
、
pandas
、
dataframe
、
series
我更习惯
循环
,但一旦你得到大量数据,它们在熊猫中就会变慢。我一直在寻找迭代、iter.等例子,但想知道是否有更快
的
方法。我现在
的
情况是names = df['name'].tolist() i = i.replace(' ','_') newnames.append不太熟悉熊猫
的
最佳做法,所以我欢迎所有反馈。谢谢
浏览 4
提问于2021-06-30
得票数 0
回答已采纳
2
回答
迭代Py箭头表
的
最快方法
pandas
、
pyarrow
我正在使用Pyarrow库来
优化
Pandas
DataFrame
的
存储。我需要尽可能快地处理吡箭表,而不是把它转换成熊猫DataFrame (它不适合记忆)。除了
循环
和索引寻址之外,还有什么快速
的
方法来迭代Py箭头表吗?
浏览 0
提问于2018-11-05
得票数 11
回答已采纳
1
回答
pandas
是否缩短了运行时间?
python-3.x
、
pandas
、
time
我有一个用python编写
的
代码,其中包含不同
的
矩阵和for
循环
来更改矩阵元素。但是它需要很长时间才能运行。现在
的
问题是,如果我将矩阵改为
pandas
、DataFrames和series,是否会减少运行时间?
浏览 20
提问于2020-04-28
得票数 0
回答已采纳
1
回答
Python -使用Numpy操作
优化
Lambda
python
、
pandas
、
numpy
、
optimization
我在
优化
以下计算时遇到了困难; Inner_diff_grp = np.var(list(map(lambda x : np.percentile(winw2_grp,x[0]) - np.percentile(winw2_grp,x[1]) ,[(i+7,i) for i in range(0,98,7)]))) 'winw2_grp‘是一个小尺寸
的
图像数组(比如5x5)。我
循环
遍历图像,以在每7步找到百分位数,然后计算这些值
的
方差。
循环
中
的
总图像约为100,000个。
浏览 28
提问于2020-06-23
得票数 0
回答已采纳
1
回答
我正在寻找方法来提高使用
Pandas
库
的
python脚本
的
速度
python
、
python-3.x
、
pandas
、
optimization
、
powerbi
我是
Pandas
的
新手,并且已经开始使用这个库来处理Power BI中
的
数据集。我最近不得不写一段代码来对一列整数运行一些计算,但很难将我
的
代码从标准python转换为
Pandas
。代码本质上是将列转换为列表,然后对列表中
的
项运行
循环
,将结果数字附加到一个新列表中,然后我将其添加到它自己
的
列中。 我读到过在
Pandas
中运行
循环
可能会很慢,而且下面代码
的
执行确实看起来很慢。如果能帮我指明正确
浏览 0
提问于2019-12-03
得票数 1
1
回答
“您不应该修改正在迭代
的
东西”。那我该怎么修改呢?
python
、
pandas
我在和这里看到了很多注释,您不应该修改正在迭代
的
东西。name = name+' '+'smith' 但是,--我仍然在编辑我正在上迭代
的
东西备注:我正在处理一个比这更大、更复杂
的
函数,它具有更多
的
条件和api调用等,通过100,000行客户数据。例如,如果客户来自城市X,do this,如果客户来自城市Y,do that等。所以,我不想寻找一个解决方案,这个确切<em
浏览 2
提问于2019-09-18
得票数 3
2
回答
如何
优化
嵌套
循环
中
Pandas
Dataframe
的
性能
python
、
pandas
、
dataframe
、
performance
、
loops
假设下面的dataframe:data = {"Time":["2021-01-10 21:00:00", "2021-01-10 22:00:00",“ID”
的
总生产时间,而不考虑每个时间间隔之间
的
任何潜在时间间隔。”字典中,每个键
的
最后一个键值(ID)将等于它
的
总生成时间。也许我将不得不使用类似于描述
的
或更高效
的
嵌套
循环
之类
的
迭代
浏览 1
提问于2021-09-08
得票数 1
回答已采纳
1
回答
Python
Pandas
与C++解决方案在文本CSV数据导入方面的性能比较
c++
、
python
、
performance
、
csv
、
pandas
我们目前有一个用C++编写
的
数据导入/转换工具,它主要处理文本数据(例如,几种不同格式
的
时间戳),并应用一些标准化/清理。 当前
的
解决方案速度非常快,性能非常关键。例如,我们
优化
以最小化/避免解析
循环
中
的
对象分配,因为这将为我们处理
的
每一行调用,并可能产生严重
的
性能影响。我们想要实现
的
是灵活地添加新
的
输入格式或简单地通过更改脚本/配置文件来应用额外
的
转换,而不
浏览 0
提问于2013-11-08
得票数 2
1
回答
Pandas
优化
python
、
numpy
、
pandas
我写了一个函数来处理
pandas
的
数据。使用我
的
函数
的
%prun
的
分析日志张贴在底部(只有几行)。我想
优化
我
的
代码,因为我需要调用这个我写了超过4000次
的
函数。运行此函数一次需要37.7s。似乎最耗时
的
部分是numpy.ndarray
的
nonzero。因为我几乎所有的操作都是基于
pandas
的
,所以我想知道
pandas
中
的
哪个函数严重依赖于这种
浏览 2
提问于2014-06-24
得票数 0
4
回答
不使用for
循环
检索Pyomo解决方案
pyomo
我正在努力寻找一种有效
的
方法来检索
优化
问题
的
解决方案。解决方案由大约200K个变量组成,我希望在
pandas
DataFrame中使用这些变量。在网上搜索后,我找到
的
访问变量
的
唯一方法是通过一个for
循环
,它看起来像这样: for index in varobject: print
浏览 5
提问于2018-01-27
得票数 3
1
回答
针对ubyte数据(0..255)
的
python
Pandas
优化
python
、
pandas
、
dataframe
、
numpy
、
uint64
如何将
Pandas
df
优化
为ubyte数据类型(0..255)?(对于整数,默认情况下为int64 ) 如果我将数据转换为分类类型,df会占用更少
的
内存吗?或者是
优化
它
的
唯一方法--使用NumPy而不是
Pandas
?
浏览 16
提问于2021-07-01
得票数 0
回答已采纳
2
回答
从dataframe中找到几个对象
python
、
arrays
、
pandas
、
numpy
、
bigdata
如何避免两个for
循环
并
优化
代码以处理大数据?import
pandas
as pd array = np.array([[1,'aaa','bbb'],[2,'ccc','bbb'],[3,'zzzz','
浏览 2
提问于2018-01-17
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
即时通信 IM
活动推荐
运营活动
广告
关闭
领券