在pandas中乘以浮动列需要花费太多的时间

在pandas中乘以浮动列需要花费太多时间的原因可能是由于数据量大或者计算复杂导致的性能瓶颈。针对这个问题，可以考虑以下优化方法：

使用矢量化操作：pandas提供了许多矢量化操作，可以对整个列进行操作，而不是逐行进行计算。这样可以减少循环和条件判断带来的开销，提高计算效率。
优化数据类型：pandas中的数据类型可以影响计算的速度。如果浮动列的精度要求不高，可以考虑将其转换为更低精度的数据类型，如float32，以减少内存占用和提高计算速度。
使用并行计算：pandas支持使用并行计算库，如Dask或multiprocessing，在多个核心或机器上并行计算，以加快计算速度。
分块处理数据：如果数据量太大无法一次加载到内存中，可以考虑使用分块处理的方式，将数据划分为多个块进行计算，然后合并结果。
使用NumPy或Cython加速计算：对于涉及大量数值计算的操作，可以将其转换为NumPy数组或使用Cython编写扩展，以提高计算性能。

推荐的腾讯云相关产品：

腾讯云计算引擎TKE：https://cloud.tencent.com/product/tke
腾讯云容器服务CVM：https://cloud.tencent.com/product/cvm
腾讯云函数计算SCF：https://cloud.tencent.com/product/scf
腾讯云弹性MapReduceEMR：https://cloud.tencent.com/product/emr
腾讯云云数据库CDB：https://cloud.tencent.com/product/cdb
腾讯云对象存储COS：https://cloud.tencent.com/product/cos
腾讯云云原生容器服务Tencent Kubernetes Engine (TKE)：https://cloud.tencent.com/product/tke

请注意，以上仅是腾讯云的一些相关产品示例，提供给您参考。对于具体的场景和需求，还需要根据实际情况选择适合的产品。

在pandas中乘以浮动列需要花费太多的时间

、、、

早上，我有一个460.000行的DataFrame，有15列。我尝试将另外两列的乘积赋值给另一列，代码如下 df[df.colx == 'S']['prd'] = df['col1']*df['col2'] prd、col1和col2的数据类型都是float64。我在其他列上执行了许多操作，没有任何问题，包括日期差异，它们几乎是立即执行的。如果我尝试 df['prd']

浏览 6提问于2019-06-11得票数 1

回答已采纳

1回答

熊猫分类特征组占用了太多的内存和时间

、、

我试图理解为什么熊猫的分类特性占用了太多的RAM，因此执行起来花费了太多的时间。，cat_4都是int64，列value是浮动的。我可以使用groupby命令轻松地计算列value的平均值，如下所示： df.groupby(['cat_1', 'cat_2', 'cat_3', 'cat_4']).ag

浏览 6提问于2019-11-20得票数 1

回答已采纳

1回答

我有一个目标列Value_0，Value_n和索引列idx_0。idx_k I想得到相应的列Value_{idx_0}，.Value_{idx_k}但是我有这三个困难。索引列类型为float索引列可以有NaN值如果索引列有NaN值，我希望输出列在相同的位置返回NaN值。我怎样才能有效地做到这一点(以一种粗制滥造的方式，不需要循环)？我怀疑写像Value[Idx[~np.isnan(Idx)].astype(int)

浏览 2提问于2021-07-19得票数 0

2回答

将不同的值乘以其他列的组合作为pandas列

、、、

下面是示例数据，对于每个name和skill1组合，我想将score列乘以2,3： ? 输出： ? 我尝试了下面的代码，但它花费了400 skill1太多的时间。 ?

浏览 33提问于2021-06-26得票数 0

2回答

熊猫散列函数的矢量化

、、

我有以下数据集(具有不同的值，只乘以相同的行)。我需要组合这些列并对它们进行散列，特别是使用库hashlib和提供的算法。问题是它花费的时间太长了，不知怎么的，我觉得我可以将函数向量化，但我不是专家。我正在处理数以百万计的行，这需要花费几个小时，即使散列4列

浏览 6提问于2021-09-07得票数 0

回答已采纳

1回答

如何在数据量巨大的数据库表中添加新的列

、、

我在表格中有大量的数据，比如TB data.While的数量，在表格中添加新的列，这需要花费很多时间。假设发布了2.0版，如果我们想要将每个客户的数据库升级到2.0版，我们将在表中添加新的列。为每个客户花费大量时间进行升级。根据我们的要求，每个版本都会在数据库表中添加新<em

浏览 25提问于2020-01-23得票数 0

2回答

通过从不同的数据帧中获取值并对其执行一些数学运算来创建新的pandas数据帧

、、

假设我有一个16列、大约1000行的pandas数据帧，格式如下x_sec01 y_sec01 x_sec02 y_sec02 x_sec03 y_sec03 x_sec04 y_sec04 x_sec05 y_sec05 x_sec06其中每列的值需要乘以

浏览 10提问于2017-01-11得票数 2

回答已采纳

1回答

使用Pandas - Python将date+hour列划分为两列(格式化日期、数字)

、、

我想把这两列分成两列，因为Excel提取函数占用了太多的时间，我想我可以用Python和Jupyter Notebook来做，使用Pandas。我试着使用excel，但它总是花费很长时间。

浏览 5提问于2019-07-18得票数 0

回答已采纳

2回答

有什么方法可以加速Pandas的文件读写吗？

、

我在Pandas中读写中等大小的excel文件有困难。我有5个文件，每个约300 MB大。我需要将这些文件合并为一个文件，进行一些处理，然后保存它(最好是excel )：f2 =f2,f3,f4,f5], axis=0, ignore_index=True, sort=False) FULL.to_excel('filename.xlsx'

浏览 3提问于2020-01-23得票数 2

回答已采纳

1回答

分离数据柱

、、

我目前的困境：当我下载一个csv文件时，我认为它将被分成三个单独的列，分别是Nouveaux cas和Cumulatif de cas，但是情况并非如此，这三个文件都被合并成一个列，只有一个我只想要与新手卡相关的数据，它在中间。我试图将其转换为tsv文件，并更改分离的数据部分，但这花费了太多时间。有更简单的方法吗？我用来读取文件的代码：df=pandas</em

浏览 4提问于2021-05-17得票数 0

回答已采纳

2回答

地图功能花费太多时间(Pandas* DataFrame)*

、、、

我有一个熊猫Dataframe的形状:12.000.000x2(行x列)，我需要应用一个映射函数，但是，当它只需要比较第1列的每个日期和给定的日期时，需要花费太多的时间，例如，今天。║ ║╚════════════╩══════════╝import pandas as pd fr

浏览 5提问于2020-02-11得票数 1

回答已采纳

2回答

通过python中的300万条记录搜索子字符串

、

我有一个巨大的数据框架，它有3M记录，其中有一个名为description的列。此外，我有可能的子字符串集约5k。 if (bool(re.search(ss,desc))):问题是，搜索5k乘以3M循环花费了太多的时间

浏览 0提问于2018-04-13得票数 1

回答已采纳

1回答

wp8.1运行时:如何让网格视图项目先向右，然后向下？

、、、

在默认的Hub模板中，网格视图项首先放在底部，然后放在右边。例如：2 4 6 8 但是在这种情况下，如果有许多图像，Hub滚动起来会很长，而且到达第二部分需要花费太多时间。如何让它们以这种方式浮动？

浏览 3提问于2014-10-03得票数 1

3回答

数据库插入机制

、、

我有一个关于不同数据库中的插入机制的问题。假设一个表只有一个自动生成的列主键(如标识列)，那么在插入新记录时，整个表是否会被锁定？如果插入花费了太多时间，其他事务是否需要等待更多时间？

浏览 1提问于2012-02-13得票数 4

回答已采纳

2回答

在中获取用户时间的总计

、、、

对于正在开发的应用程序，我们需要跟踪我们的用户(作为一个整体)花费多少时间观看与特定实体相关的内容。我们试图通过用户时间来实现这一目标，包括类别“实体名称”、变量“实体ID”(例如，类别"Band“、ID”“)。这使得获得每个实体观看内容的平均用户时间(花费的时间)非常容易，但我们也需要计算全部内容。似乎没有办法进行计算，这似乎很奇怪，因为这只是平均数<

浏览 0提问于2014-03-27得票数 0

1回答

流灯加载列数据花费了太多时间。

、、

我在streamlit中使用了简单的代码片段，它显示了由我拥有的excel组成的数据帧。问题是，在流光区域的过滤器列中加载数据需要花费太多时间。在那个过滤区域，我搜索材料的名称，但它甚至需要30秒来加载和显示我要选择的数据。如何解决这一问题，使其快速选择数据？守则是：import pandas as

浏览 1提问于2020-01-29得票数 0

2回答

使用python绘制csv文件系列

、

从csv文件中读取数据，然后生成不同列的图形，其中每一列以不同的颜色绘制，这是一种非常有效的方法？我感兴趣的是一种可以推广到多个列的方法。我尝试的方法运行起来花费了太多的时间。我尝试过使用matplotlib.pyplot的pandas.DataFrame.from_csv，但我的实现可能不正

浏览 0提问于2014-10-26得票数 0

2回答

如何避免unordered_map在插入过程中的滞后调整

、、、、

我在MSVC 2010中使用unordered_map。如果我在其中插入许多元素，它就会开始调整大小。在此过程中，它复制所有对并重新散列它们。当有太多的对象时，需要花费太多的时间。

浏览 2提问于2012-07-25得票数 3

回答已采纳

2回答

如何在包含3000万行的mysql表中查找重复值

、

在Mysql中，我有一个包含两列(id、uuid)的表。然后我向其中插入了3000万个值。(ps: uuid可以重复) 现在，我想使用Mysql语法在表中查找重复值，但是sql花费了太多时间。我想搜索所有列，但这需要很多时间，所以我尝试查询前一百万行，这花费了8秒。然后我尝试了1000万行，它花了5分钟，然后2000万行，服务器似乎死了。

浏览 15提问于2019-01-30得票数 0

回答已采纳

1回答

包含大数据的已选择下拉列表

、、、

我使用了一个选择的下拉列表，我将数据从DB表显示到选择的下拉列表中，它有将近90k行的数据。在选择的下拉列表中加载数据需要花费太多的时间&因此页面加载也需要花费太多的时间。有没有人能帮我在选择的下拉列表中减少页面加载时间和数据加载？

浏览 2提问于2018-07-05得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在pandas中乘以浮动列需要花费太多的时间

相关·内容

在pandas中乘以浮动列需要花费太多的时间

熊猫分类特征组占用了太多的内存和时间

从索引中获取相应的值

将不同的值乘以其他列的组合作为pandas列

熊猫散列函数的矢量化

如何在数据量巨大的数据库表中添加新的列

通过从不同的数据帧中获取值并对其执行一些数学运算来创建新的pandas数据帧

使用Pandas - Python将date+hour列划分为两列(格式化日期、数字)

有什么方法可以加速Pandas的文件读写吗？

分离数据柱

地图功能花费太多时间(Pandas* DataFrame)*

通过python中的300万条记录搜索子字符串

wp8.1运行时:如何让网格视图项目先向右，然后向下？

数据库插入机制

在中获取用户时间的总计

流灯加载列数据花费了太多时间。

使用python绘制csv文件系列

如何避免unordered_map在插入过程中的滞后调整

如何在包含3000万行的mysql表中查找重复值

包含大数据的已选择下拉列表

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐