使用表达式变量在Dataframe上创建列

、、

我需要用下面的表达式在DataFrame上创建一个加权平均列： wa = pd.Dataframe() wa[0][i] = 1/(2**i) 我需要一个这样的DataFrame： wa = Index:[1/(2**10),1/(2**9),1/(2**8)...1/(2**0)]

浏览 7提问于2020-09-15得票数 0

回答已采纳

1回答

应用于星火DataFrame多列转换的优化方法

、、

在我的火花作业中，我必须对两个用例在多列上进行转换： columnsDefs.foldLeft，我使用它来执行计算n个多列来创建n个新列(1输入值表

浏览 6提问于2021-11-01得票数 0

2回答

用增量重命名数据帧的列名

、、

我有一个脚本生成一个带有多个列的数据have，名为1，2，3->n an expression that would c

浏览 6提问于2022-11-21得票数 0

回答已采纳

1回答

如何计算包含在DataFrame中的逐行表达式(如DataFrame()但动态表达式)？

、

假设您有一个包含表达式(引用其他列)的列的DataFrame，那么可以计算包含在该列中的表达式吗？import pandas as pd然后你可以写现在

浏览 0提问于2019-01-29得票数 3

回答已采纳

1回答

如何编写多个条件下的星火数据？

、、、

我必须连接两个数据帧，并根据某些条件选择它的所有列。对于所有列，是否有任何方法不重复条件？这是数据帧一号。此外，当我打印exprsExtended时，我在输出列中得到 coalesce(LineItemSequence_1, LineItemSequence) AS `LineItemSequence`,

浏览 0提问于2018-01-30得票数 3

回答已采纳

2回答

在Pandas列中查找正则表达式模式

、

在pandas DataFrame中，我有以下列： df1 = pd.DataFrame({'id': [1,2], 'coords':['-43.22 -22.15 -43.16 -22.19','-43.32 -22.18 -43.136 -22.149']}) 'coords'列包含纬度值和经度值。因此，在'coords'列中，我需要创建两个<e

浏览 37提问于2019-09-24得票数 4

回答已采纳

1回答

Spark 2 Python重命名列并设置列数据类型

、、

我使用DataFrame读入HDFS文件，并使用正则表达式提取数据。是否可以在不单独重命名或转换列的情况下重新定义DataFrame的模式？我的计划是将DataFrame转换为RDD，然后使用模式将RDD转换回DataFrame。我不确定这是不是一个好主意。

浏览 4提问于2018-08-06得票数 0

回答已采纳

1回答

如何在函数中使用lambda

、、

我正在尝试创建一个函数来使用数据帧的列执行操作，但最后它给了我一个错误，因为在定义lambda : x.variable时，变量实际上是这样做的，我如何分配它的值？变量在x中。import pandas as pddf = pd.DataFrame(data=d) def example(dataFrame</

浏览 7提问于2022-03-16得票数 1

回答已采纳

1回答

使用列表中的模式从dataframe列求和groupby的值

、、

上下文:我试图通过使用dataframe列上的模式列表来获取使用group创建的组的总和。4,5,7],'312_Pattern1_Z':[8,2,4]})基本上，“连接”在给定列名上具有特定模式的所有列

浏览 2提问于2022-08-08得票数 1

回答已采纳

1回答

使用for循环在y轴上绘制来自数据帧的多列？

、、

我有一个具有相同变量名的数据帧列表。我可以使用for循环遍历和创建所需的绘图；但是，我只能在y轴上绘制一列，而不是多列。例如，我需要在所有数据帧的y轴上绘制每小时的温度和湿度值。到目前为止我的代码是： plt.plot(dataframe['time'], dataframe['temp']) 这可以用来绘制温度，但我也需要湿度

浏览 5提问于2021-03-13得票数 1

回答已采纳

2回答

将正则表达式应用于熊猫dataframe列

、、

我试图应用一些已编码的正则表达式，可以针对变量运行，但我希望将其应用于dataframe列，然后将结果传递给一个新列。df["Details"] is my dataframeprint(time.group(0)) 1st: 01:12.98 然后，我希望

浏览 0提问于2019-06-22得票数 2

回答已采纳

2回答

在R中使用100多个lm函数

、

假设我有一个由101列组成的数据帧，其中前100列被命名为data1 to data100，第101列被命名为y。如果我想在R中使用lm函数，其中data1到data100是功能。+data100, dataframe) 有没有更好的方法呢？

浏览 13提问于2020-11-11得票数 0

1回答

星图DataFrame中布尔表达式的动态求值

、、

假设我有一个星火DataFrame (在Scala中)，类似| a| b| expr|创建eval(expr)的最佳方法是什么也就是说，如何在星火DataFrame中创建一个列来计算引用DataFrame中其他列的布尔表达式列</

浏览 8提问于2022-09-28得票数 3

回答已采纳

1回答

使用other pandas列在Series.contains中指定正则表达式

、、

我有一个数据帧，它有一个长文本字段和一个短字符串，它本质上是一个类别。我的目标是利用正则表达式在dataframe中创建一个新列，该列与是否存在匹配项相对应。正则表达式以类别为条件。is mad and sad 50', 'the cat is happy']regex = ['[0-9]{2}', '[0-9]{

浏览 7提问于2020-02-11得票数 3

回答已采纳

1回答

为什么selectExpr更改模式(包括id列)？

、

更新(这会使警报变为虚假和无效)$ .= false) root 在玩selectExpr时(在今天的主版的selectExpr中)，我注意到模式更改为包含id列。bigin

浏览 8提问于2017-03-27得票数 4

2回答

如何使用dataframe创建长度不定的excel电子表格？

、、、

我是python的一个新用户，我一直在编写一个程序，在这里我需要创建一个包含不定列数的excel电子表格。因此，我之前创建4列的代码是：df1 = pd.DataFrame({'Species 1' : evolution[0]}) df2

浏览 3提问于2017-06-20得票数 1

回答已采纳

1回答

如何将连续变量映射为图形颜色？

、、

我试着把一个连续的变量映射成颜色。在R中，我可以通过将颜色参数设置为log(pop)来做到这一点。在第九步中，我尝试了这个选项，它产生了这样的错误： ValueError: 300573x430像素的图像大小太大了。在每个方向上必须小于2^16。

浏览 1提问于2019-09-08得票数 0

回答已采纳

1回答

我正在尝试将rfc2822日期时间列转换为时间戳列。如果我正在处理数据文件之外的变量，它就工作了。但是在数据文件中，我会收到一条错误消息。pyspark.sql.column import *from email.utils import parsedate_to_datetime 在dataframespark.createDataFrame(["Thu Sep 12 2019 15:58:30 GMT-0500 (ho

浏览 1提问于2019-11-23得票数 1

1回答

熊猫:如何在一栏中计算方程

、

ResultB 10 7*Bits+8 78我想要创建一个列结果，它计算列Eq中的表达式。但是，方程中使用的变量将是dataframe中的一个或多个列名。我该怎么做才能做到这一点？我知道Pandas有eval方法，但在我的例子中，每行方程可能不同。谢谢你的建议。

浏览 4提问于2022-05-10得票数 0

回答已采纳

2回答

R dataframe:具有for-循环和正则表达式的新变量

、、、

在R中，我希望通过在特定的现有变量之间进行一些计算来在数据框架中创建新的变量。新变量的变量名以及计算中使用的特定现有变量由正则表达式定义(或应该使用)。我知道描述有点混乱，所以这里有一个虚拟数据集的例子，其中一些变量(V1、V2、V3)是在两个不同的时间点(T1、T2)测量的： dataframe <- data.frame(matrix(

浏览 4提问于2016-05-26得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

应用于星火DataFrame多列转换的优化方法

用增量重命名数据帧的列名

如何计算包含在DataFrame中的逐行表达式(如DataFrame()但动态表达式)？

如何编写多个条件下的星火数据？

在Pandas列中查找正则表达式模式

Spark 2 Python重命名列并设置列数据类型

如何在函数中使用lambda

使用列表中的模式从dataframe列求和groupby的值

使用for循环在y轴上绘制来自数据帧的多列？

将正则表达式应用于熊猫dataframe列

在R中使用100多个lm函数

星图DataFrame中布尔表达式的动态求值

使用other pandas列在Series.contains中指定正则表达式

为什么selectExpr更改模式(包括id列)？

如何使用dataframe创建长度不定的excel电子表格？

如何将连续变量映射为图形颜色？

将rfc 2822列转换为类型标记列

熊猫:如何在一栏中计算方程

R dataframe:具有for-循环和正则表达式的新变量

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐