腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
0
回答
Spark
DataFrame
中
的
结构
排序
数组
、
、
(nullable = false)除了使用自定义函数之外,有没有其他方法可以按value对arr进行
排序
我见过org.apache.
spark
.sql.functions.sort_array,这个方法在复杂
数组
元素
的
情况下到底是做什么
的
?是否按第一个元素(即id?)对
数组
进行
排序
?
浏览 12
提问于2017-11-27
得票数 5
回答已采纳
1
回答
如何在不使用
Spark
的
情况下对
Spark
中
的
数据进行
排序
?
、
、
我现在正在使用
Spark
,但是我发现在
Spark
中使用对
DataFrame
进行
排序
非常缓慢。那么,如何在没有
Spark
的
情况下对
DataFrame
进行
排序
呢?
浏览 4
提问于2015-04-20
得票数 2
回答已采纳
1
回答
如何将数据架构
的
字符串拆分为每个
结构
、
、
我想将
dataframe
的
架构拆分为一个集合。我正在尝试这个方法,但是模式被打印成一个字符串。我是否可以将其拆分为每个StructType
的
集合,以便对其进行操作(比如只从输出中提取
数组
列)?我试图平平一个复杂
的
多层次
的
结构
+
数组
数据。output.toList 目前
的
输出是 identifyArrayColumns: (
dataFrame
: org.ap
浏览 0
提问于2018-03-09
得票数 0
回答已采纳
1
回答
在
Spark
-Scala
中
,如何将
数组
列表复制到
DataFrame
中
?
、
我想构建一个
DataFrame
,它
的
结构
由以下语法描述:val trainingVectors.dense(1.3, 1.0)),)).toDF("label", "features")目前我
的
数据在
数组
浏览 6
提问于2016-09-25
得票数 0
1
回答
如何从火花放电
中
的
字符串
中
创建相同
的
结构
数组
?
、
、
、
、
我编写了将字符串转换为
结构
数组
的
代码。我也想在python上做同样
的
事情。你知道我该怎么做吗?import org.apache.
spark
.sql.
DataFrame
import org.apache.
spark
.sql.Columnval df:
DataFrame
= Seq( "adserviceCalculateCpcAlgori
浏览 3
提问于2022-08-02
得票数 0
回答已采纳
3
回答
如何在
Spark
DataFrame
中
按特定列对
结构
类型
的
数组
进行
排序
?
、
、
给定以下代码:import org.apache.
spark
.sql.SparkSession import
spark</e
浏览 3
提问于2018-04-05
得票数 6
回答已采纳
1
回答
在
Spark
中
对
DataFrame
进行
排序
时,幕后会发生什么?
在
Spark
中
对
DataFrame
进行
排序
时,幕后会发生什么?例如,df.sort(i) 我知道当您将数据读取到
DataFrame
时会发生什么,但是我很好奇当您
排序
时会发生什么
浏览 2
提问于2018-08-14
得票数 0
2
回答
使用Scala/Java API基于外部
数组
内容
的
自定义
排序
、
、
、
---------+| SuperiorCard|| Distinguish|我有一个自定义顺序
的
数组
,我希望数据集按
数组
中
给定
的
顺序
排序
。+-------------+| Vista|| SuperiorCard|如何使用
spark
Java API实现
浏览 0
提问于2019-05-08
得票数 2
1
回答
使用
spark
对包含多列
的
大型
DataFrame
进行
排序
,原因超过
spark
.driver.maxResultSize
、
、
,但有以下例外: 我有大约330个列,其中一些列相当大(
结构
数组
等),
DataFrame
的
总容量约为200 in。我使用
的
是EMR (5.30,
Spark
2.4.5)集群,由9xc5.
浏览 10
提问于2020-07-08
得票数 1
1
回答
我有一个pyspark
dataframe
,其中我必须连接两列,按升序
排序
,并只从中取最高值。
、
‘代表EG: A B | B | c | |--------| | G | | None | 如何将两者作为一个
数组
进行
排序
浏览 0
提问于2020-06-05
得票数 1
1
回答
对SparkSQL
中
数组
列
的
每个元素执行UDF (需要另一个火花作业)吗?
、
、
、
、
单元表(tbl_a)
的
结构
如下:A | [1,7,13,25168,992]C | nullid | new_id2 | 'ficnw' ...我打算创建一个新
的
hive表,使其具有与tbl_a相同
的
结构</e
浏览 4
提问于2017-06-01
得票数 1
回答已采纳
1
回答
使用嵌套
的
Python字典和Numpy
数组
从Pandas
Dataframe
创建
Spark
Dataframe
、
、
、
、
我有一个包含numpy
数组
和字典
的
pandas数据帧: results_df.head(1) best_params cv_results: 3, 'min_impurity_decrease': 0.2} {'mean_fit_time': [0.6320801575978597, 1.08473]} 我希望能够创建一个包含类似嵌套
结构
的
Spark
Dataframe
(如
浏览 61
提问于2020-08-16
得票数 0
1
回答
Spark
Dataframe
中
的
聚合
数组
类型
我有一个
DataFrame
订单:| Id| Order |我正在使用org.apache.
spark
.sql.functions包,代码如下所示:
浏览 0
提问于2016-06-30
得票数 3
回答已采纳
2
回答
Spark
Dataframe
/RDD无法通过计算另一列
的
内容来创建新列
、
、
我有一个
Spark
RDD (或
Dataframe
-转换成两者都不是问题),它有以下列(每个
结构
的
示例):org.apache.
spark
.sql.
DataFrame
= [id: string, list: array<string&g
浏览 27
提问于2017-07-07
得票数 0
回答已采纳
1
回答
为什么写入
的
数据帧在读取后没有保持顺序?
、
我按照前两列
的
顺序将数据帧写入HDFS: final = <
dataframe
>.select('Pais','Anho','NumPatentes','TotalCitas','MediaCitas") final.write.format("csv").save("<path>", header = 'true') 然后,我使用以下命令从HDFS
浏览 11
提问于2019-12-03
得票数 2
回答已采纳
2
回答
当NullType位于StructType内时,将空值写入
Spark
中
的
拼图
、
、
、
我正在将一个集合从MongodB导入到
Spark
。所有文档都有字段'data‘,该字段又是一个
结构
,并具有字段'configurationName’(始终为空)。("collection", collectionName).load() 对于结果
DataFrame
中
的
data列,我得到以下类型: StructType(StructField(configurationName: AnalysisException: Parquet数据源不支持struct 看起来问题
浏览 24
提问于2021-08-11
得票数 1
2
回答
我们是否应该像在训练之前并行化Seq一样来并行化
DataFrame
、
、
、
、
考虑这里给出
的
代码, val training = sparkContext.parallelize我们是否应该继续这样做或者,当传递
dataFrame
时,fit函数将自动处理计算/数据
的
并行化 致以敬
浏览 0
提问于2016-06-01
得票数 14
回答已采纳
1
回答
如何使用
spark
将
数组
转换为
Dataframe
?
、
由pandas构建
的
第一个
数组
: lst = np.array([[1,2,3],[1,2,3],[1,2,3]]) 我想将lst转换为
spark
Dataframe
,
结构
如下: 01 [1, 2, 3] 2 [1, 2, 3] 我做到了: x_train =
spark
.createDataFrame(lst) 错误: TypeError: Can not
浏览 75
提问于2019-08-31
得票数 0
1
回答
将csv.writer(csv.writer())- Python更改为PySpark
、
、
、
我正在尝试应用一个用Python语言编写
的
函数,以便在PySpark上可读。 open()函数在PySpark
中
不可读。在这种情况下如何更换?我有一个需要
排序
的
非
结构
化列表: import csvmy_list = [ ] # Sorting this list
浏览 29
提问于2021-10-15
得票数 0
2
回答
如何使用扁平嵌套Json
结构
、
、
、
、
试图使用
dataframe
来平平嵌套
的
json响应。我成功地平平了“调查”
结构
,但当我尝试使用相同
的
“问题”代码时,会出现错误。附加
的
是我正在使用
的
json响应和databricks代码。file_exists(ta_team_customer_experience_survey_raw_path): ta_team_customer_experience_survey_raw =
spark
.read
浏览 13
提问于2022-04-25
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据结构中的各类排序方法
C语言-整型数组中的数据从小到大排序
算法:100.删除排序数组中的重复数字
算法:101.删除排序数组中的重复数字 II
使用Spark将本地文件读取并封装为DataFrame的完整指南
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券