腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
蜂巢收集列表无法处理数百万条记录。
、
我在使用
collect_list
的外部查询中有一个单元查询。内部查询我有一个有180万条记录的有序列表。当我每次运行查询时,500-600条记录会给出错误的结果,并在模式中丢失
顺序
。select concat_ws('','',
collect_list
(host)), concat_ws('
浏览 3
提问于2017-03-28
得票数 0
2
回答
蜂巢的
collect_list
命令了吗?
、
说
collect_list
:那份名单订好了吗?例如,查询结果的
顺序
?
浏览 8
提问于2015-07-10
得票数 5
回答已采纳
2
回答
在使用sparklyr调用
collect_list
时根据另一个变量保留
顺序
、
这个问题本质上是对的重复,除了我在R中工作之外,这个问题的解决方案看起来很可靠,但我还没有找到如何在窗口函数上以同样的方式在sparklyr中应用
collect_list
。对5000名用户的测试中,3%的人没有按正确的
顺序
排列“城市”栏。 dplyr::group_by(userid) %>% dplyr::summarise(cities = paste(
collect_list
浏览 2
提问于2019-05-10
得票数 0
回答已采纳
1
回答
在Spark中的一个查询中使用多个
collect_list
、
、
、
string |-- rating: doubleval result = sqlContext.sql("select userId,
collect_list
(product),
collect_list
(rating) from data group by userId") 我的问题是,聚合数组中的product和rating是否相互匹配?更新:从Spark2.0.0开始,可以对struct类型执行
collect_list
,所以我们可以在合并列上执行
浏览 2
提问于2016-11-03
得票数 8
回答已采纳
2
回答
在配置单元中使用"
Collect_List
()“函数时出错
、
、
、
每当我在配置单元上运行函数"
collect_list
“时,它总是抛出一个错误:Total jobs = 1Failedorg.apache.hadoop.hive.ql.exec.tez.TezTask数据:1 A2 C我在hive的终端上运行查询,下面是我的查询: SELECT id,
collect_list
(value) FROM something
浏览 5
提问于2017-04-21
得票数 0
1
回答
使用配置单元函数对数据进行排序
我希望结果表看起来像这样-1, c->a->bjourney列按每个id的时间升序排列select id , concat_ws(">",
collect_list
浏览 2
提问于2018-06-23
得票数 0
1
回答
Spark :如何在数据帧的分区中使用collect_set保持
顺序
?
、
、
、
|123 |3 |+-------+---------+----+ 现在我想要下面的输出,StudentIds的数组按列的
顺序
排列|2 |[1234, 908] ||cl
浏览 216
提问于2021-07-05
得票数 0
回答已采纳
1
回答
在配置单元中使用分隔符合并多行
、
、
、
我可以使用collect_set或
collect_list
,但不能在两者之间插入分隔符。 有什么变通方法吗?
浏览 1
提问于2017-03-22
得票数 15
回答已采纳
1
回答
为什么星火不把过滤器向下推到groupBy和
collect_list
之前?
(isnotnull(year#0L) AND (year#0L = 2020))对于为何不是这种情况,以及是否有办法解决这个问题,有何意见?
浏览 1
提问于2020-07-04
得票数 5
回答已采纳
1
回答
按不同列( Hive )排列的sort_array
顺序
、
、
Bookmark 2016-07-10101 Book2 2016-01-03select
COLLECT_LIST
(Product) as Prod_List,from tablename作为:101 ["Book","Bookma
浏览 2
提问于2017-04-14
得票数 4
回答已采纳
1
回答
如何在MySQL中对concat_ws(',',
collect_list
(a))进行排序?
、
、
、
我有一个表,其中包含两列时间和文本,我希望按时间
顺序
连接文本。谢谢。
浏览 17
提问于2021-07-21
得票数 0
2
回答
合并多行,具有不同的值
、
、
、
01 english 1.groupby('ID','Date')\.withColumn("class", conca
浏览 32
提问于2021-02-11
得票数 0
回答已采纳
1
回答
collect_list
()是否维护行的相对排序?
、
、
5|+---+-----------+------------+df.groupBy("id")
collect_list
($"featureValue").as("val")) 我是否保证 "idx“和"val”将被聚合并保持其相对
顺序</e
浏览 7
提问于2017-06-09
得票数 21
回答已采纳
2
回答
用字符串操作合并火花放电中的行
、
我希望从以下几个方面合并多个重复行:对此:我需要在合并行的每个句子之后有一个句号。我试着合并()和collect_set(),但是无法在收集的窗口/组中执行字符串操作。
浏览 3
提问于2022-05-04
得票数 1
回答已采纳
2
回答
按
顺序
排列的串联字符串列
1,1,2,1,3],['Eggs','Salad','Peaches','Bread','Water']],index=['User','Order','Food']).T)df.groupBy("User").agg(concat_ws(" $ ",
collect_list
("Fo
浏览 1
提问于2019-08-28
得票数 2
回答已采纳
1
回答
如何在Spark SQL中追加列值?
、
、
、
、
我有下表:|movieId|movieName| genre|| 1| example1| action|| 1| example1| romance|| 2| example2| action|我试图实现的是将类型值附加到id和name相同的
浏览 7
提问于2018-01-15
得票数 0
回答已采纳
2
回答
按计数对collect_set进行排序
、
、
我知道collect_set可以有一个随机的
顺序
。是否有不同的方法按计数排序collect_set?我希望基于一个独立id列的组,为单个列提供一个最受欢迎的项数组。您会有一个
collect_list
,然后对其进行计数吗?
浏览 5
提问于2021-09-29
得票数 1
回答已采纳
3
回答
collect_list
保持
顺序
(sql/ scala)
、
、
最终列表必须只包含按
顺序
排列的城市。因此,我尝试在sql或scala中使用
collect_list
,但是在使用它之后,我们似乎失去了排序。 你能帮我解决这个问题吗?
浏览 1
提问于2019-09-27
得票数 3
回答已采纳
10
回答
基于另一个变量保持
顺序
的
collect_list
、
、
我尝试使用
collect_list
,如下所示:ordered_df = input_df.orderBy(['id','date= True)但是,即使我在聚合之前按日期对输入数据帧进行排序,
collect_list
有人能帮助如何通过保持基于第二个(日期)变量的
顺序</
浏览 8
提问于2017-10-05
得票数 82
回答已采纳
2
回答
在群访问和收集期间,跨列数据的火花维护
顺序
、
、
)1, [Person1, Person2], [B,A], [15,12]1, [Person1, Person2], [A,B], [12,15]任何建议都是非常感谢的。
浏览 3
提问于2020-06-10
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
pdf如何调整页面顺序,教你调整pdf页面顺序的方法
反转单词顺序列
Css样式书写顺序
pairs 的遍历顺序
Mongodb-比较顺序
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券