pandas使用两个数据帧向量化函数_使用interpolate向pandas数据帧添加行_使用for循环向pandas数据帧追加字典 - 腾讯云开发者社区

apache-spark、user-defined-functions

假设我在python中创建了一个函数，所以将一个数字求幂为2： def squared(s):%sql select id, squaredWithPython(id) as id_squared from test 那么，如果数据分布在工作节点的内存上，squaredWithPython函数是否会在群集的工

浏览 33提问于2019-10-10得票数 0

回答已采纳

1回答

pandas_udf和to_pandas的区别是什么？

pyspark、user-defined-functions

当我用熊猫清理大数据的时候，我有两种方法:一种是从pyspark 2.3+清洁数据中使用sdf，另一种是通过toPandas()将sdf转换成pdf，然后使用熊猫进行清洁。

浏览 1提问于2019-01-21得票数 1

回答已采纳

1回答

pandas使用两个数据帧向量化函数

pandas、numpy、vectorization、apply、matrix-multiplication

我有以下操作： import pandas as pd x = x.set_index('Cat') df2 = df1.groupby('Cat').sum().reset_index() 我想使用来自df1的相对数据点在每个df2行上运行some_calc。我可能在这里做错了什么……) 我目前

浏览 25提问于2021-11-19得票数 3

2回答

在pandas数据帧中插入sklearn CountVectorizer的结果

python、pandas、machine-learning、scikit-learn

我有一堆14784个文本文档，我正在尝试对它们进行矢量化，这样我就可以运行一些分析。我使用sklearn中的CountVectorizer将文档转换为特征向量。vectorizer = CountVectorizer其中examples是所有文本文档的数组现在，我正在尝试使用其他功能为此，我将这些特性存储在一个pandas数据帧中。目前，我的pandas数据

浏览 0提问于2016-11-02得票数 14

1回答

使用矢量化在pandas中创建列

python、pandas

我正尝试在一个pandas数据帧上使用矢量化来创建一个新列。数据帧相当庞大(数百万条记录)。我在这里展示了一个虚拟的例子。我展示了一个非矢量化的版本，它可以工作，但效率不是很高。我试图在使用函数的同时实现矢量化版本(实际的函数比这里显示的函数要复杂得多)。import pandas as pd df = p

浏览 4提问于2018-08-31得票数 0

1回答

向量化Python Pandas Dataframe

python、pandas、data-cleaning

我有csv文件，我正在将其读入Python Pandas Dataframe。我想对操作进行矢量化，以便使用针对某些列的一组用户定义函数对列运行数据清理，并将结果附加到数据帧中。我可以读取记录并逐个处理它们，但我想通过Pandas使用一个函数对1整列进行操作来向量化操作。输入数据帧0 a b c d 1 t

浏览 3提问于2019-11-01得票数 1

2回答

如何避免这个python脚本中的for循环

python-3.x、pandas、numpy、pandas-groupby

我正在做一些数据分析任务，使用这个python脚本我可以得到我想要的结果，但是它非常慢，可能是由于for循环，我必须处理数百万的数据行，有什么方法可以把这个脚本改得更快吗？

浏览 0提问于2019-11-04得票数 1

1回答

numba:使用字符串输入/返回向量化函数

python、pandas、string、vectorization、numba

我有一个样例函数，我想用numba向量化它：def test(x: str):和一只熊猫数据帧：现在，如果我想调用该<em

浏览 0提问于2020-11-30得票数 1

3回答

如何在python中组合csv数据

python、pandas、csv、merge

我有两个CSV文件，我想将它们合并到一个文件中。

浏览 24提问于2019-07-10得票数 1

回答已采纳

1回答

将两个浮点数据帧合并为一个字符串数据帧

python、pandas

因此，假设我有两个数据帧，其中一个包含标称值，另一个包含标称值的不确定性： [7.1, 8.1]) 我想把这两个文件合并成字符串数据帧：最好是以矢量化和高效的方式。如果有比将它们转换为字符串更聪明的方法，我也

浏览 10提问于2021-02-17得票数 1

回答已采纳

2回答

减去在多个列值上连接的两个Pandas DataFrames

python、python-3.x、pandas

我正在尝试从DataFrame B中的列的值中减去DataFrame A中的列的值，但前提是多个列值彼此相等。假设(虚构的)： DataFrame A:1 Sales Cars 2019-1 1503 Sales Furniture 2019-1 110 4 IT

浏览 15提问于2019-02-06得票数 3

回答已采纳

1回答

Pandas数据帧净现值向量化(函数向量化)

python、pandas、numpy、vectorization

我有以下数据帧：import pandas as pdNPV_Var1_2014 = np.npv(0.7,[0]+Var1_2014) 但是，我不知道如何将函数向量化以直

浏览 0提问于2018-10-20得票数 0

2回答

如何在pandas中使用向量化而不是for循环

python、pandas、dataframe、for-loop、vectorization

我用于训练和测试的数据有17k行和20列。我试着在另外两个列的基础上添加一个新列，但是我编写的for循环太慢了(需要3秒才能执行) for i in range(0, len(model_olculeri)): model_olculeri["Waist to Hip Ratio"][i] = sum_column 我读过关于pandas和numpy向量化<

浏览 59提问于2021-10-25得票数 0

回答已采纳

2回答

对两个DataFrames逐个应用函数元素

python、pandas

如何应用DataFrame X和Y中相同大小的函数z_ij = f(x_ij, y_ij)并将结果保存到DataFrame Z

浏览 2提问于2017-02-16得票数 4

回答已采纳

2回答

提取数据帧中正在更改值的元组

python、python-3.x、pandas、dataframe

我有两个相似的结构数据帧。取一个数据帧A： Name | Col3 | Col4 P | 5 | 9 -1 Q | 0 | 1

浏览 15提问于2020-06-23得票数 1

2回答

基于pandas中的其他列内容对列进行操作

python、string、python-3.x、pandas、dataframe

来自R，我不知道如何通过利用其他列在一个数据帧列上进行某种向量化操作，例如：df = pd.DataFrame({'s':['Big bear eats cat现在我只想按行替换(其他操作可以拆分)s中的a的出现，这样看起来就像这样：1 cute ANIMAL sleeps 在R data.table (使用矢量化函数)中，我只需要编写如下内

浏览 4提问于2018-08-08得票数 2

回答已采纳

1回答

为什么numpy select比apply方法的自定义函数慢？

python、pandas、numpy

假设，我有以下数据帧： df = pd.DataFrame({'a':['a','b','c (not a)', 'this is (random)']*10000}) 我想生成以下输出： array(['same as column', 'b', 'c', 'this is']*10000, dtype=object) 为此，我定义了下面的函数，并通过p

浏览 20提问于2020-12-30得票数 2

回答已采纳

1回答

Dataframe.iterrows()或Dataframe.itertuples()的替代方案？

python、pandas、dataframe、vectorization

我对Pandas数据帧向量化(通过Pandas向量化本身或通过Numpy)的理解是将一个函数应用于数组，类似于.apply() (如果我错了，请纠正我)。假设我有以下数据帧：df = pd.DataFrame({'color' : ['red','blue','yellow','oran

浏览 0提问于2018-11-01得票数 0

1回答

如何根据一个数据帧中行的条件向量化查找另一个数据帧的行索引

pandas、vectorization

我有两个具有相同列的pandas数据帧，例如df2 = pd.DataFrame({'A':[0,1在Pandas中向量化这个操作的正确方法是什么？

浏览 19提问于2020-11-18得票数 1

回答已采纳

1回答

Pandas Dataframe中两个大列之间的计算

python、pandas、lambda

我有一个有2列邮政编码的数据帧，我想添加另一列与它们的距离值，我能够做到这一点与相当少的行数，但我现在使用的数据帧有大约500,000行用于计算。我的代码可以工作，但在我目前的数据帧上，它已经运行了大约30分钟，仍然没有完成，所以我觉得我正在做的事情效率非常低。

浏览 10提问于2020-05-28得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Spark中的用户定义函数(UDF)是否在集群工作节点上并行运行？

pandas_udf和to_pandas的区别是什么？

pandas使用两个数据帧向量化函数

在pandas数据帧中插入sklearn CountVectorizer的结果

使用矢量化在pandas中创建列

向量化Python Pandas Dataframe

如何避免这个python脚本中的for循环

numba:使用字符串输入/返回向量化函数

如何在python中组合csv数据

将两个浮点数据帧合并为一个字符串数据帧

减去在多个列值上连接的两个Pandas DataFrames

Pandas数据帧净现值向量化(函数向量化)

如何在pandas中使用向量化而不是for循环

对两个DataFrames逐个应用函数元素

提取数据帧中正在更改值的元组

基于pandas中的其他列内容对列进行操作

为什么numpy select比apply方法的自定义函数慢？

Dataframe.iterrows()或Dataframe.itertuples()的替代方案？

如何根据一个数据帧中行的条件向量化查找另一个数据帧的行索引

Pandas Dataframe中两个大列之间的计算

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐