腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
PySpark
:
如何
删除
DataFrame
中
的
非
数字
列
?
、
我想
删除
DataFrame
中所有
非
数字
的
列
。我正在尝试复制一些Pandas代码,如下所示:对于
PySpark
DataFrame
,我该
如何
做到这一点
浏览 13
提问于2020-03-12
得票数 0
回答已采纳
3
回答
如何
在
PySpark
中用零替换句号?
、
、
我试图用
PySpark
中
的
0值替换原始数据
中
的
句号。 from
pyspark
.sql import functions as F
dataframe
2 =
dataframe
1.withColumn("test_col", F.when(((F.co
浏览 8
提问于2019-09-01
得票数 1
1
回答
在
pyspark
数据帧中用
数字
替换字符串
、
我刚接触
pyspark
,我想在
pyspark
dataframe
列
中
动态地用
数字
替换名称,因为我
的
dataframe
中有超过500,000个名称。
如何
继续?
浏览 9
提问于2019-07-25
得票数 0
1
回答
如何
使用
PySpark
的
RegexTokenizer从字符串
中
删除
数字
?
、
、
我想使用
PySpark
的
RegexTokenizer从
DataFrame
列
中
删除
5位或更多位
的
数字
。我可以使用下面的代码提取这些
数字
,但有人知道我
如何
删除
它们吗?我
的
代码: regexTokenizer = RegexTokenizer(inputCol="description", outputCol="tokenized_description&q
浏览 0
提问于2019-02-13
得票数 0
2
回答
如何
筛选出包含符号
的
所有行“
、
我想过滤掉所有包含符号“在
列
”"Col1“
中
的
行。11" A123456 A343535 ACol1 Col2252653 A为此,我决定过滤掉所有
非
数字
值: df.filter(when(is_digit_udf(df["Col1"]))).s
浏览 0
提问于2019-07-08
得票数 1
回答已采纳
1
回答
FInd数据帧
中
的
第一个
非
零元素
、
、
我正在处理一个
pyspark
dataframe
,并尝试查看是否有一种方法可以提取spark
dataframe
中
第一个
非
零元素
的
索引。我自己添加了索引
列
,因为
pyspark
不支持它,而不是pandas。
浏览 29
提问于2021-10-08
得票数 0
1
回答
列
在Pandas
Dataframe
追加期间意外下降。
、
下面是我
的
代码,它简单地组合在一起,并平均设置行。为了我
的
一生,我不明白为什么在最终结果中会有一
列
被
删除
。import pandas as pd incr = 10 fori in range(0,len(
dataframe
1.index),incr): tmp =
dataframe</em
浏览 2
提问于2017-03-30
得票数 1
回答已采纳
2
回答
从
PySpark
DataFrame
列
中
删除
元素
我知道
PySpark
DataFrames是不可变
的
,所以我想创建一个新
列
,该
列
是根据应用到
PySpark
DataFrame
的
现有
列
的
转换生成
的
。我
的
数据太大了,无法使用collect()。该
列
是唯一int列表(在给定列表
中
不重复int),例如:[1,2][2,3] 上面是一个玩具例子,因为我
的
实际
DataF
浏览 9
提问于2017-01-12
得票数 1
回答已采纳
7
回答
如何
检查
中
的
字符串列是否都是
数字
列
、
、
、
、
我有一个
PySpark
Dataframe
,其中有一
列
strings。
如何
检查其中
的
哪些行是
数字
行。我在
PySpark
的
中
找不到任何函数。values,['ID',])+-----++-----+|75647||8758K|+-----+ 在Python
中
,有一个函数.isDigit(),如果string
浏览 0
提问于2018-12-12
得票数 17
回答已采纳
4
回答
从熊猫
DataFrame
中
删除
非
数字
列
、
在我
的
应用程序
中
,我加载了如下结构
的
文本文件: source = pandas.read_table(inpu
浏览 2
提问于2012-10-04
得票数 54
回答已采纳
1
回答
如何
在
pyspark
中
对
dataframe
行排序
我有一个包含两
列
的
数据帧,其中包含
数字
,我需要按行而不是按
列
对数据帧进行排序。到处都给出了
如何
按
列
对
dataframe
进行排序,但我找不到
如何
在
pyspark
中
对
dataframe
的
所有行进行排序。
浏览 0
提问于2017-11-14
得票数 1
2
回答
如何
过滤熊猫
的
数据以包含特定
的
值?
、
、
、
如果
dataframe
中
的
任何
列
包含
非
二进制(0或1)
数字
,
如何
排除行。不是根据特定
的
列
排除,而是针对所有的
列
。 [0, 0, 0, 0, 0, 1, 0],df = pd.
Da
浏览 2
提问于2020-09-18
得票数 1
回答已采纳
2
回答
通过JDBC从
pyspark
dataframe
插入到外部数据库表时
的
重复键更新
、
、
、
、
嗯,我使用
的
是
PySpark
,我有一个Spark
dataframe
,我使用它将数据插入到mysql表
中
。df.write.jdbc(url=url, table="myTable", mode="append") 我希望通过
列
值和特定
数字
的
总和来更新
浏览 4
提问于2015-09-16
得票数 12
1
回答
在
Dataframe
中
,
如何
根据条件从行
中
删除
列
?
、
当该行上
的
列
值为零时,我想从行
中
删除
该
列
。我不想从
Dataframe
中
删除
该
列
。仅当
列
值为零时,我才从该特定行
中
删除
该
列
。我用
的
是
Pyspark
。
浏览 19
提问于2020-04-09
得票数 0
3
回答
Pyspark
可空uuid类型uuid但表达式
的
类型是变化
的
、
、
、
给出一个具有
非
空uuid
列
和可空uuid
列
的
表设计,
如何
使用Python3.7.9与Pysmack2.4.3数据table和PostgreSQL42.2.18.jar驱动程序进行插入?
Pyspark
没有生成正确
的
INSERT语句,或者postgres驱动程序将单词NULL视为字符而不是关键字。在
pyspark
.sql.types
中
没有uuid类型
的
条目。剩下
的
唯一方法似乎是将
datafram
浏览 9
提问于2020-11-03
得票数 4
7
回答
如何
删除
pyspark
dataframe
中
的
列
、
、
>>> a>>> b>>> a.join(b, a.id==b.id, 'outer')
DataFrame
[id: bigint, julian_dateuser_id: bigi
浏览 219
提问于2015-04-13
得票数 123
4
回答
如何
在Python中排除Spark
dataframe
中
的
多
列
、
、
、
我发现
PySpark
有一个名为drop
的
方法,但它似乎一次只能
删除
一
列
。关于
如何
同时
删除
多个列有什么想法吗?selectedMachineView = machineView.drop([['GpuName','GPU1_TwoPartHwID']]) /usr/hdp/current/spark-client/python/
pyspark
/sql/
浏览 1
提问于2016-02-28
得票数 42
回答已采纳
2
回答
如果某些值为空,
如何
在SUM
中
返回空?
、
、
、
我遇到过这样
的
情况:我
的
列
中
可能有空值,需要在一个组
中
求和。 如果我在组
中
遇到null,我希望该组
的
和为null。但是默认情况下,
Pyspark
似乎会忽略null行,并对其余
非
NULL值求和。
dataframe
=
dataframe
.groupBy('
dataframe
.product', '
dataframe
.price'
浏览 87
提问于2021-01-18
得票数 1
回答已采纳
5
回答
pyspark
: ValueError:某些类型在推断后无法确定
、
、
、
、
spark_my_df = sc.createDataFrame(my_df) 388
浏览 1
提问于2016-11-10
得票数 34
2
回答
如何
在
pyspark
中
合并重复
的
列
?
、
、
我有一个
pyspark
dataframe
,其中一些
列
具有相同
的
名称。我想将具有相同名称
的
所有
列
合并到一
列
中
。例如,输入
dataframe
: ? 我
如何
在
pyspark
中
做到这一点?
浏览 57
提问于2021-06-18
得票数 2
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券