腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(6929)
视频
沙龙
2
回答
如
何在
pyspark
数据
帧
中
拆分
数字
并
添加
连
字符
?
、
、
、
、
我想在一列
中
拆分
所有
数字
。 编号:123456789012 成为123-4567890-12 所以我想在位置4和10
添加
-。 我不想做新的专栏
浏览 7
提问于2021-02-05
得票数 2
回答已采纳
1
回答
PySpark
中
连
字符
分隔符上的分割
数据
帧
列
我很难根据
连
字符
分隔符将
数据
帧
列
拆分
为两行。from
pyspark
.mllib.linalg.distributed import IndexedRow +----------+| 12-cheese||11-almonds|所以我想要两个列,一个是
数字</e
浏览 0
提问于2019-05-10
得票数 0
回答已采纳
1
回答
将列有条件地
添加
到
数据
帧
中
、
、
、
、
我在
PySpark
中有一个
数据
帧
。我想有条件地在
数据
框架
中
添加
一列。 如果
数据
帧
没有列,那么
添加
一个带有null值的列。如果列存在,则不执行任何操作,
并
返回与新
数据
帧
相同的
数据
帧
。如
何在
PySpark
中
传递条件语句
浏览 6
提问于2017-01-20
得票数 0
回答已采纳
1
回答
Python spark从dataframe中提取
字符
、
、
我在spark中有一个
数据
帧
,大概是这样的:------ | ----2 | SOMEOTHERCHARACTERS3 | ANOTHERSTRING我想要做的是从列中提取前5个
字符
加上第8个
字符
,
并
创建一个新列,如下所示:1 | STRIN_F 2 | SOM
浏览 0
提问于2016-12-02
得票数 13
回答已采纳
1
回答
使用map函数将Spark Dataframe转换为RDD
、
、
我正在尝试将spark
数据
框
中
的列
拆分
为多个值。因此,我分隔了要
拆分
的列,
并
检查了其类型:O:
pyspark
.sql.dataframe.DataFrameO:
pyspark
.rdd.PipelinedRDD 如
何在
拆分
此列的同时保持
数据
框属
浏览 0
提问于2016-06-22
得票数 0
3
回答
Pandas:有没有一种方法可以在不遇到AttributeError的情况下使用.str访问器来检查对象是否真的是一个
字符
串?
、
、
我使用toPandas()将
pyspark
数据
帧
转换为pandas
数据
帧
。但是,因为某些
数据
类型不对齐,所以pandas会将
数据
帧
中
的某些列强制转换为object。(作为参考,我尝试做的是,如果
数据
帧
中
的列实际上具有
字符
串值,则执行一个str.split()。) 有什么想法吗?注意:我很想知道Pandas方面的答案,而不必事先显式地确定哪些列实际上有
字符<
浏览 1
提问于2020-06-23
得票数 1
1
回答
使用
pyspark
中
的regex将
数字
添加
到
字符
串中最后一个
字符
之前
、
、
、
、
我需要使用
pyspark
在
字符
串的最后一个
字符
(即在spark
数据
帧
的列
中
)之前
添加
相同的
数字
。例如,假设我有
字符
串2020_week4或2021_week5。我需要在4和5的前面
添加
一个0,如下所示:2020_week04或2021_week05。更大的背景是,替换是个位数周的条件-only。col("week")) == 10, regexp_replace(week, REGEX_PATTE
浏览 35
提问于2021-01-26
得票数 0
回答已采纳
2
回答
更改
数据
类型
拆分
后的星火RDD如
何在
不更改
数据
类型的情况下
拆分
、
、
我已经将
数据
从文本文件加载到Spark,在
数据
类型
拆分
更改之后。如
何在
不更改
数据
类型的情况下
拆分
数据
,或者如何将
拆分
的
数据
转换为原始
数据
类型?我的代码conf = SparkConf().setMaster("local").setAppName("Movietimestamp
浏览 2
提问于2020-10-22
得票数 0
1
回答
我如何检测或正确识别奇怪
字符
的长度?
、
、
、
我正在通过编程将软
连
字符
插入到长词
中
,并且遇到异常
字符
的问题,特别是:然后,我的脚本遍历每个单词,测量长度(mb_strlen(
浏览 3
提问于2011-12-23
得票数 0
回答已采纳
5
回答
如何使用Excel计算单元格
中
特定
字符
的数目
我试图通过
拆分
行来规范
数据
库,以便每行只包含一个条目。如
何在
Excel
中
查找/计
数字符
串。我知道你可以为整个细胞做值我需要搜索一个单元,找出有多少
连
字符
浏览 7
提问于2014-01-27
得票数 2
回答已采纳
2
回答
熊猫-如何将一个
字符
串列分割成几个列,由特定
字符
的索引?
、
、
、
、
我希望从名为"filename“的
字符
串列中提取用户ID,
并
根据原始
字符
串
中
特定
字符
的索引创建一个新的ID列。“文件名”
中
字符
串的两个示例,ID为2或3位
数字
: df['ID &
浏览 11
提问于2021-12-22
得票数 2
3
回答
R:将
字符
串
拆分
为
数字
,并将平均值作为
数据
帧
中
的新列返回。
、
、
、
我有一个大的
数据
框架,列是一个
数字
字符
串,
如
"1,2,3,4“。我想增加一个新的栏,这是这些
数字
的平均数。4", "2, 4, 6, 8", "3, 6, 9, 12") df$a <- as.character(df$a) 现在,我可以使用str
拆分
来
拆分
字符
串,
并
返回给定行的平均值,其中[1]指定了第一行
浏览 3
提问于2015-06-16
得票数 4
回答已采纳
2
回答
非
连
字符
的Regex匹配
、
、
我试图在Python
中
为非
连
字符
的单词创建regex表达式,但我无法理解正确的语法。 应匹配的示例词:1 1
浏览 7
提问于2019-11-15
得票数 2
回答已采纳
3
回答
拆分
和连接在JavaScript
中
是如何工作的?
、
但是仍然不理解:因为在输入框中最初没有
数据
,但是当用户开始键入函数时开始调用其中的方法,但是第一行将$(this).val().split("-").join("");将查找要
拆分
的
连
字符
...但是,如果用户键入的
数据
包含任何
连
字符
就像你上面解释的那样,例如,"a-b-c“上的
拆分
(”-“)将给出"a","b","c”....this
数据</em
浏览 1
提问于2016-09-28
得票数 0
3
回答
通过正则表达式捕获组
拆分
spark dataframe列
中
的
字符
串
、
、
、
给定下面的
数据
框,我想将numbers列
拆分
为一个数组,数组中原始
数字
的每个元素包含3个
字符
+---+------------------+|744| 000000|+---+------------------+ 预期的
数据
帧
---+-----------------
浏览 0
提问于2018-11-01
得票数 2
回答已采纳
1
回答
PySpark
将列
拆分
到具有应用架构的新
数据
帧
、
、
、
如何通过逗号将
字符
串列
拆分
为具有应用模式的新
数据
帧
?作为示例,下面是一个包含两列(id和value)的
pyspark
DataFrame df = sc.parallelize([(1, "200,201,hello"), (2, "23,24,hi")]).toDF(["id", "value"]) 我希望获取value列并将其
拆分
到一个新的DataFrame
中
,
并
应用以
浏览 18
提问于2021-11-10
得票数 1
1
回答
将数组
拆分
为列
pyspark
-array length变量
、
、
、
在
pyspark
中
,我遇到了将数组
拆分
成单独列的问题。数组长度可变(范围为0-2064)。我试图重用我发现的一段代码,但由于
数据
太大,它不起作用。这是我在将数组转换为
字符
串(dec_spec_str)后尝试的部分。这需要永远的时间。任何帮助都是非常感谢的。alias("val") .groupBy("hashval").pivot("name").agg(f.first("val")) 我还想到了一个想法
浏览 82
提问于2020-11-01
得票数 0
4
回答
在j2ee应用程序中正确建模isbn编号
、
、
我曾经读过很多使用它们的教程....Some应该是一个10位
数字
,你会遇到像0-85131-041-9这样的
数字
,它不能很长。例如,使用不带
连
字符
的
数字
。 那么,应该是哪种类型呢?有什么建议吗?
浏览 2
提问于2011-06-14
得票数 4
回答已采纳
1
回答
PySpark
LSH approxSimilarityJoin花了太多时间
、
、
、
、
我想为下面的
数据
集找到Jaccard索引,下面是我的方法:1 [dde,jhb..]db_matches.write.parquet(file_location) 现在,它运行了大约4个小时,但它仍然没有完成,我相信它不应该花这么多时间,因为
数据
不是那么大
浏览 11
提问于2022-10-11
得票数 0
1
回答
Pandas -带有小数位计数的列
、
我有一个包含以下列的
数据
帧
(dtype='O'): OUTPUT0NaN5.67
并
希望
添加
一个新列,其中包含小于0的
数字
的小数位数: OUTPUT DECIMAL_PLACES1 03e-09 90.4 1 5.67 0 我天真地尝试转换为
字符
串,然后
拆分
(‘.’)但是科学记数法不喜欢它注意:我有一个很大的
浏览 12
提问于2019-08-27
得票数 3
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券