腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如
何在
pyspark
中
删除
列
中
的
连
字符
?
、
、
、
我想从
pyspark
数据框架
的
一个
列
的
元素
中
删除
所有-。111-345-789 144-900-888 ....
浏览 7
提问于2021-02-26
得票数 0
回答已采纳
1
回答
PySpark
Count () CASE WHEN [duplicate]
这个问题在这里已经有答案了 : 如
何在
Spark SQL中使用
连
字符
转义列名 (3个答案) 列名
中
包含破折号/
连
字符
的
PySpark
Sql (1个答案) 使用selectExpr选择其中包含特殊
字符
的
spark dataframe
列
(1个答案) 如
何在
SparkContext
中
处理dash
的
SQL请求 (1个答案) 3个月前
浏览 70
提问于2020-11-30
得票数 0
1
回答
在同一分区
列
中
删除
具有不同日期格式
的
单元格
中
的
分区
、
、
、
字符
串数据类型
的
分区
列
中有两种类型
的
值:例如,有分区
列
值20200301、2020-03-05、2020-05-07、20200701等。我需要使用DDL语句
删除
分区小于20200501
的
分区,
如
当我使用yyyy-MM-dd格式
删除
分区时,只
删除
2020-03-0
浏览 4
提问于2020-07-17
得票数 1
回答已采纳
1
回答
PySpark
数据帧写入orc不允许使用
连
字符
的
列名
、
、
、
、
我是
PySpark
的
新手。我有一个列名
中
包含
连
字符
的
csv文件。我可以成功地将文件读取到数据帧
中
。然而,当将df写入orc文件时,我得到一个错误,如下所示-当我通过
删除
连
字符
来重命名列时,我可以将数据帧写入但是我需要列名有
连
字符
,因为
浏览 32
提问于2021-02-13
得票数 0
10
回答
如
何在
c#
中
从普通
字符
串
中
插入/
删除
连
字符
?
、
、
我有一根这样
的
绳子;我有一个方法,我想插入逻辑,在4个
字符
后面添加
连
字符
到'text‘变量。所以,输出应该是这样
的
;在上述“文本”变量逻辑
中
添加
连
字符
应在此方法
中
;{// append
浏览 3
提问于2012-07-11
得票数 6
回答已采纳
2
回答
pyspark
: dataframe头部转换
、
、
、
、
我正在将csv加载到
pyspark
dataframe
中
。我正在尝试
删除
列
标题中
的
空格和更多特殊
字符
,
如
"(",")“和"/”。 我可以
删除
列
标题中
的
空格,如下所示。它只
删除
列
中
的
空格,而不
删除
特殊
字符
。 我试了一下,它起作用了。df.withColumnRen
浏览 63
提问于2020-12-15
得票数 0
回答已采纳
2
回答
如何根据大小更改
列
值
、
、
、
我在
PySpark
设置中有一个dataframe。我想更改一个
列
,比如它叫做A,它
的
数据类型是"string“。我想根据它们
的
长度来改变它
的
价值。特别是,如果一行
中
只有一个
字符
,则希望将0
连
接到末尾。“修改”
列
的
名称必须仍然是A。这是用于使用
PySpark
3
的
木星笔记本。这就是我迄今尝试过
的
: df = df.withColumn("A&quo
浏览 2
提问于2019-06-17
得票数 1
回答已采纳
1
回答
移除R
中
字符
串末尾
的
连
字符
、
我在R中有一
列
数据,
如
:我想移除
字符
串末尾
的
连
字符
,同时将
连
字符
保持在
字符
串中间。("+-\\w", "", names$name) # the desired output is "ABC", &quo
浏览 2
提问于2015-02-05
得票数 1
回答已采纳
1
回答
使用自定义模式创建一个拼花文件
、
、
我有这样
的
要求:我们有一个API,它将给我们
列
的
模式。emp_name是
字符
串(50),emp_salary是十进制(7,4),joining_date是时间戳等等。 我必须使用来自API
的
模式创建一个parqu
浏览 4
提问于2022-07-30
得票数 -1
回答已采纳
2
回答
在
pyspark
DataFrame
中
创建某个类型
的
空数组
列
、
、
、
我尝试向df添加一个包含
字符
串数组
的
空数组
的
列
,但最终添加了一个
字符
串数组
的
列
。我试过这个: import
pyspark
.sql.functions as F df = df.withColumn('newCol', F.array([])) 我如
何在
pyspark
中
做到这一点?
浏览 91
提问于2019-08-28
得票数 9
回答已采纳
2
回答
子
字符
串
PySpark
2.2
中
数组
列
的
每个元素
、
、
、
我想在
PySpark
2.2
中
子串数组
列
的
每个元素。我
的
df类似于下面的df,它类似于this,尽管我
的
df
中
的
每个元素在
连
字符
分隔符之前都有相同
的
长度。hiiii, abbbb, xyzhu] | +---------------------------------+----------------------+ 我试着根据this答案调整前一个问题中
的
自定义函数,以获得上面ne
浏览 24
提问于2021-09-09
得票数 0
回答已采纳
1
回答
在csv
的
特定
列
中用空
字符
串替换
连
字符
我有一个30
列
的
csv文件。我只需要从第30
列
删除
连
字符
。(第3
列
和第4
列
包含
连
字符
,但不应该
删除
它。)我尝试了下面的awk命令来实现这一点。但它
删除
的
记录很少,我找不到原因。awk -f=',' 'gsub= "\\-","",$30)' OFS=, input.csv > o
浏览 0
提问于2018-11-20
得票数 0
4
回答
在sql表
中
的
列
中
添加
连
字符
、
我需要帮助了解如
何在
值为8601881,9700,800,2170
的
列
中
添加
连
字符
预期产出如下: 860188-1,970080-0,217-0
浏览 0
提问于2019-07-23
得票数 0
回答已采纳
2
回答
电火花数据格式
中
的
纵倾
字符
串
、
假设我有dataframe,其中包含
列
中
的
值,
如
:ABC93890380380XYZ3898302MGE8983_ABZ我想要修剪这些值,例如,
删除
前3个
字符
和
删除
最后3个
字符
,如果它以ABZ结尾。from
pyspark
.sql import functions as f new_df = df.withColumn("new_column
浏览 6
提问于2022-04-08
得票数 2
回答已采纳
1
回答
如何像scala .drop
中
那样
删除
rdd
列
、
、
、
、
文件videos.csv如下所示099acca-8888-48ca,Action,Comedy 在Scala
中
,Scala可以使用.drop(1)
删除
RDD
列
1,以便对所有行
删除
rdd
列
1,例如482cal-2792-48da和099acca-8888-48ca。我想知道如
何在
PySpark
rdd
中
PySpark
中
这样做,如下所示,在第2行代码<e
浏览 2
提问于2016-12-29
得票数 3
2
回答
在
中
过滤数组
、
、
、
、
火花版本: 2.3.0 Array Col['strawberry', 'raspberry']我想要过滤每个数
浏览 3
提问于2021-10-01
得票数 1
回答已采纳
2
回答
Apache :无法将分组数据保存为CSV
、
、
、
我想做一件简单
的
事。我想把所有的事件统计成2分钟
的
时间戳。File "/usr/hdp/current/spark2-client/python/
pyspark
answer, self.gateway_client, self.target_id, self.name) File "/usr
浏览 1
提问于2018-05-15
得票数 1
回答已采纳
2
回答
如果
字符
串以指定
字符
开头或结尾,则替换
字符
串
中
的
字符
、
、
我
的
数据库中有一个
列
,其中包含以
连
字符
开头或结尾
的
条目。我希望找到这些行,如果它是
字符
串
中
的
最后一个或第一个(或两个)
字符
,则
删除
/替换
连
字符
。我现在所拥有的:sample-value-two-sample-value-foursample-valu
浏览 16
提问于2017-02-03
得票数 1
回答已采纳
1
回答
处理多个派生
列
函数
我有一个SSIS任务,它将平面文件导入到sql
中
。有没有比简单地为所有150
列
创建一个表达式更快
的
方法呢?
列
按顺序
浏览 1
提问于2012-02-28
得票数 0
1
回答
如何使用
连
字符
和逗号分隔concat函数
中
的
列
?
、
这是我在创建下面存储
的
进程时得到
的
错误:Incorrect syntax near ','。我试图用
连
字符
和逗号分隔CONCAT函数
中
的
列
,但如果我
删除
连
字符
和逗号,它就可以工作。我试图用
连
字符
分隔concat函数
中
的
第一
列
和第二
列
,使用逗号分隔第二
列
和第三
列</e
浏览 42
提问于2019-07-31
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券