腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
多
条件
withColumn
性能
建议
、
、
我的问题是,有没有另一种方法来检查数据库行是否符合我所要求的
条件
?提前感谢您的
建议
Output = (db.
withColumn
('Puhelin', F.when(F.col('source_browser_platform')=='Android OS' ,F.lit('1')).otherwise(F.lit('0'))) .
withColumn
('Puhelin', F.when(F.
浏览 18
提问于2021-02-05
得票数 1
回答已采纳
3
回答
如何在相同
条件
下更新具有不同值的两列?
、
我可以解决这个问题,做两次相同的事情: .
withColumn
('c',when(df.a == 'something', 'y')) 我想避免做两次相同的事情,因为b和c被更新的
条件
是相同的,而且对于列a也有很多情况。
withColumn
“可以接受
多
列吗?
浏览 19
提问于2022-09-13
得票数 3
回答已采纳
2
回答
如何避免在Scala中反复使用
withColumn
?
、
、
、
目前,我们有一个具有迭代使用
withColumn
的代码。当-否则有
条件
的检查&我们在此基础上进行算术计算。样本代码: df.
withColumn
(colName1, when((col(amountToSubtract).<("0")) && (col(colName1).===(
浏览 0
提问于2019-08-13
得票数 1
回答已采纳
1
回答
StackOverflowError失败
、
、
、
= pd.read_json(schema_path) df = df.
withColumn
浏览 8
提问于2021-11-10
得票数 0
回答已采纳
1
回答
应用于星火DataFrame
多
列转换的优化方法
、
、
在我的火花作业中,我必须对两个用例在
多
列上进行转换: columnsDefs.foldLeft(inputDf) { } 正如您所看到的,我使用FoldLeft方法和
withColumn
。因此,多次调用它,例如,通过循环来添加多个列,可以生成可能导致
性能
问题甚至S
浏览 6
提问于2021-11-01
得票数 0
1
回答
性能
差异映射()与
withColumn
()
、
、
、
我有一张有100
多
列的桌子。我需要从某些列中删除双引号。我找到了两种方法,使用
withColumn
()和map()cols_to_fix = ["col1", ..., "col20"] df = df.
withColumn
(col, regexp_replace(df[col], "\"", ""))def remove_quo
浏览 0
提问于2020-10-20
得票数 1
回答已采纳
1
回答
使用PySpark "functions.expr()“对查询有
性能
影响吗?
、
、
、
、
在许多情况下,可以使用functions.expr("[SQL]")作为查询的替代方式,例如: "WHEN gender = 'F' THEN 'Female' ELSE 'unknown' END"))df2=df.
w
浏览 10
提问于2022-09-07
得票数 1
回答已采纳
1
回答
在火花/火花中使用多重时的最佳实践
、
、
、
、
下面是一个代码片段,它使用多个when子句(它只是一对,但很可能是10s或更多): when(df.some_col.isin.when(df.some_col.isin(val_list),"val_2")当我们有多个这样的when
条件
,这些
条件
可以很容易地写在一个循环中以减少代码行时,我应该这么做还是会显著影响
浏览 5
提问于2022-09-07
得票数 0
回答已采纳
2
回答
在火花放电中优化"
withColumn
时“的
性能
、
、
、
现有的代码,除了冗长之外,还会导致一些
性能
问题,如:非常感谢!(courriers["Vague"])) courriers = courriers.
withColumn
('Vague',when(courriers["Vague"] == "XXX Fevrier
浏览 2
提问于2021-10-17
得票数 2
回答已采纳
3
回答
当
条件
使用火花放电时,如何使用for循环?
我正在尝试检查多个列值,如果它们是否为0,则在时间和其他
条件
下进行检查。我们拥有从1到11的列,并且需要检查它们的值。目前,我的代码如下:- df3 =df3.
withColumn
('Status', when((col("1") ==0)|(col("2") ==0)|(col("3") ==0)| (col("4"col("9") ==0)|(col("10") ==0)| (col("11")
浏览 4
提问于2019-11-20
得票数 4
回答已采纳
3
回答
基于udf的火花拼写校正
、
、
、
、
不幸的是,一种天真的方法 .
withColumn
("A", when('A === "error1", "replacement1").otherwise('A)) .<e
浏览 7
提问于2016-11-21
得票数 0
回答已采纳
1
回答
如何基于动态
条件
在PySpark中创建新列
、
但是,创建这个新列的
条件
是动态的。示例: 'update_date', substringsubstring(df['update_date_string'], -8, 8), )" df = df.
withColumn</em
浏览 7
提问于2022-06-17
得票数 0
回答已采纳
0
回答
ng-repeat :自定义过滤器,用于在一个验证
条件
下显示同一用户的所有行
、
我有一个ng-repeat循环遍历用户
建议
的操作列表。每个用户可以有一对
多
的操作。如果这些
建议
的操作之一验证了
条件
(位置),则应显示此用户的所有
建议
的操作。更抽象地说,当其中一行具有验证
条件
的另一个属性时,如何显示具有特定属性的所有行?也许我可以依赖angular的一些更高
性能
的内置特性,因此我提出了这个问题。
浏览 3
提问于2017-06-08
得票数 1
2
回答
Apache spark case在不同列上有多个when子句
、
、
给定以下结构:我想再写一个WHEN
条件
浏览 13
提问于2017-02-21
得票数 5
2
回答
UDF的
性能
改进-获取pyspark中每行最小值的列名
、
、
、
我使用这个udf:df = df.
withColumn
("mycol有什么改进
性能
的
建议
吗?我使用的是Pyspark 2.3
浏览 0
提问于2020-09-10
得票数 2
1
回答
使用Spring和Hibernate在
多
租户环境中访问数据的策略
、
、
、
、
我是在一个
多
租户环境中工作的,在这个环境中,可以使用webapplication (rest)前端从大约10个不同的数据源(和实体管理器)访问数据。目前,在创建hibernate会话和通过hibernate
条件
创建查询之前,我正在使用存储库层中的方法调用setDistrict(1)。当我同步存储库方法时,我担心
性能
会很糟糕。谢谢你的
建议
。
浏览 0
提问于2016-06-28
得票数 2
回答已采纳
1
回答
当‘不使用'<’或'>‘’时,
withColumn
‘
、
、
我试图在相同的dataframe中创建一个新列,该列的某些
条件
大于或小于“when”,如下所示: "new_col",我甚至在这里看到另一篇文章,
建议
一个用户在像我这样的
withColumn
中使用一个包含
withColumn
的解决方案,但是我也尝试在结果中做lit,没有什么好处
浏览 5
提问于2022-03-18
得票数 0
3
回答
火花-如何在拆分后将新列添加到原始数据文件中?
、
、
、
并将单列替换为
多
列。f,f | p | b | null|因此,我用以下方式拆分了该列: .
withColumn
("col_a", split($"col3", "\\,").getItem(0)) .
浏览 2
提问于2019-04-15
得票数 0
3
回答
将列值的不同区间映射为整数
、
我在斯派克有个数据仓库:-------------------- B 17既包括客户,也包括年龄列的字符串类型。 customer_new | age_new A
浏览 4
提问于2018-05-21
得票数 0
1
回答
SparkSQL:使用两列的
条件
求和
、
、
、
、
(4, "b", "2015-12-15", "2015-01-01", 100).
withColumn
("dateIns", to_date($"dateIns") .
withColumn
("dateTrans", to_da
浏览 0
提问于2015-11-23
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
ABAP程序效率优化系列之②——开发优化之ABAP时间
性能测试的测试内容有哪些?有什么用途?
你现在用的手机多少钱?
《MySQL系列》之 性能优化总结(一)
更快的Python(一)
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券