腾讯云

文章/答案/技术大牛

发布

社区首页 >问答首页 >创建具有任意数量的子句的PySpark .when()语句

问创建具有任意数量的子句的PySpark .when()语句
EN

Stack Overflow用户

提问于 2020-11-06 12:42:22

回答 1查看 57关注 0票数 1

我是PySpark的新手，我正在尝试创建一个通用的.when()函数，它可以接受任意数量的when-子句，而不必在函数中列出它们。

我们希望从某种数据结构中驱动它，因此可以概括形式的一个函数：

(
    df.when(
        df.value == 1, 'one'
    ).when(
        df.value == 2, 'two'
    ).when(
        df.N == N, 'N'
    )
)

变成类似这样的东西：

(
    df.when(
       **when_clauses
    )
)

我怀疑我将不得不使用**kwargs来允许这种行为的发生，但我不确定Spark是否已经支持这种行为。

python

apache-spark

pyspark

apache-spark-sql

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-11-06 12:49:43

您可能正在寻找df.replace。它会就地替换，所以如果您想保留原始列，可以使用df.withColumn('value2', 'value')复制它。

mapping = {1: 'one', 2: 'two', ...}

df.replace(mapping)

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/64714897

复制

Reactive UI -- 反应式编程UI框架入门学习 (转载非原创)

react api 编程算法 .net

反应式编程是一种相对于命令式的编程范式，由函数式的组合声明来构建异步数据流。要理解这个概念，可以简单的借助Excel中的单元格函数。

wxilejun

2022/08/09

2.3K0

Problem: Delete Number Problem

ios

这题可以使用贪心策略，每次从高位向低位数，删除高位比低位数字小的那位上的数字，直到删除了k位之后，得到的数字肯定是最大值。

宅男潇涧

2018/08/01

4180

Problem: Vertext Cover Problem

编程算法 ios

给定一个N个点M条边的无向图G（点的编号从1至N），问是否存在一个不超过K个点的集合S，使得G中的每条边都至少有一个点在集合S中。

宅男潇涧

2018/08/01

5470

Problem: Matrix Chain Problem

编程算法 python

矩阵链乘问题是最典型的动态规划问题，本文介绍如何用动规算法解决这个问题，要理解下面的内容请先阅读这篇动态规划的总结。

宅男潇涧

2018/08/01

5430

LIS + Problem

编程算法

让我们举个例子：求 2 7 1 5 6 4 3 8 9 的最长上升子序列。我们定义d(i) (i∈[1,n])来表示前i个数以A[i]结尾的最长上升子序列长度。

AngelNH

2020/04/16

4210

Jmetal Problem和Problem Set的变量范围

编程算法

ProblemSet的变量范围 //注意MATP1是一个ProblemSet,其中有50个任务，即有50个Problem //其变量上下界的范围使用getUnified函数获得 double unilw= problemSet.getUnifiedLowerLimit(); double uniup=problemSet.getUnifiedUpperLimit(); System.out.println("unilw "+unilw+" "+"uniup

演化计算与人工智能

2020/08/14

6780

LCS + Problem

编程算法

最长公共子序列，。其定义是，一个序列 S ，如果分别是两个或多个已知序列的子序列，且是所有符合此条件序列中最长的，则 S 称为已知序列的最长公共子序列。

AngelNH

2020/04/16

5380

A problem is easy

人工智能 ios

When Teddy was a child , he was always thinking about some simple math problems ,such as “What it’s 1 cup of water plus 1 pile of dough ..” , “100 yuan buy 100 pig” .etc..

书童小二

2018/09/03

3720

Dual Problem & KKT

function optimization set svm time

I have written a note with respect to SVM. Unfortunately , I was not familiar with convex optimizati

西红柿炒鸡蛋

2020/07/20

5660

Train Problem I

数组

思路：我们很容易想到用一个栈就可以解决~~ 然后还要用字符型的不定数组来存火车的标号；不能用整数型的，具体为什么自己想一想就明白了

杨鹏伟

2020/09/11

2860

2301: [HAOI2011]Problem b

其他

2301: [HAOI2011]Problem b Time Limit: 50 Sec Memory Limit: 256 MB Submit: 1737 Solved: 749 [Submit][Status][Discuss] Description 对于给出的n个询问，每次求有多少个数对(x,y)，满足a≤x≤b，c≤y≤d，且gcd(x,y) = k，gcd(x,y)函数为x和y的最大公约数。 Input 第一行一个整数n，接下来n行每行五个整数，分别表示a、b、c、d、k Outp

HansBug

2018/04/11

6080

Backpack problem

1、01背包 /* 一共有n件物品，背包容量为m，每件物品有体积weight 和value，求背包可以装的最大价值。 01背包是最简单的背包问题，每件物品只有选与不选两种情况： dp[i][j] :表示选第i件物品时重量为j的最大价值。 1.不选第i件物品 dp[i][j] = dp[i-1][j] 2.选第i件物品的最大值（背包容量足够） dp[i][j] = max(dp[i-1][j],dp[i-1][j-weight[i]] + value[i]) */ #include<iostream>

AngelNH

2020/04/16

3810

Year 2038 problem

服务端函数开发设计源码

已经知道,对于int了tinyint了这些MySql类型,后面那个4或者11没啥实际意义,只是说(当位数不足时)前面填充多少个0,然后使之变为4位或者11位,对这个类型的字段实际能存的长度没啥影响.

fliter

2023/09/23

2200

2018 MCM Problem A notes

point reflection surface

2018 MCM Problem A: Multi-hop HF Radio Propagation(bk1)

magic2728

2019/09/27

4470

D. Minimax Problem

编程算法

time limit per test:5 seconds memory limit per test:512 megabytes inputstandard input outputstandard output

某些人

2020/04/09

2940

HDOJ 1000 A + B Problem

java

Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 513689 Accepted Submission(s): 162876

谙忆

2021/01/19

3060

ZOJ Problem Set - 3870

原理

原理：异或 #include <cstdio> #include <cstring> #include <algorithm> using namespace std; const int MaxN = 1e5 + 10; int a[MaxN], bit[50]; // bit[i]表示有多少个数的最高位的1在第i位上 void solve(int x) { int l = 31; while(l >= 0) { if(x & (1<<l)) {

Gabriel

2022/11/15

1370

A+B Problem（V）

其他

做了A+B Problem之后，Yougth感觉太简单了，于是他想让你求出两个数反转后相加的值。帮帮他吧

书童小二

2018/09/03

4450

【HDU 5105】Math Problem

max

　　b≠0，f为二次函数，最大值点在区间端点或者x0=c/(2*b)，当L≤x0≤R时，ans=max{f(L),f(R),f(x0)}。

饶文津

2020/06/02

2530

点击加载更多

相似问题

表单语义UI反应

本机反应语义-ui-反应

语义-ui图像属性不工作语义-ui-反应

语义UI反应不显示

213

语义UI反应，下拉选择

113

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问创建具有任意数量的子句的PySpark .when()语句
EN

回答 1

Stack Overflow用户

表单语义UI反应

本机反应语义-ui-反应

语义-ui图像属性不工作语义-ui-反应

语义UI反应不显示

语义UI反应，下拉选择

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问创建具有任意数量的子句的PySpark .when()语句EN

回答 1

Stack Overflow用户

表单语义UI反应

本机反应语义-ui-反应

语义-ui图像属性不工作语义-ui-反应

语义UI反应不显示

语义UI反应，下拉选择

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问创建具有任意数量的子句的PySpark .when()语句
EN