腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
配置
单元
collect_set
(),
但
删除
连续
的
重复
项
、
、
、
、
我想在使用hive时
删除
数组中
的
连续
重复
项
。 collect_list()保留所有副本,而
collect_set
()只保留不同
的
条目。我需要一些中庸之道。44f 14f 8h9 4 h9 7 我想得到这样
的
东西
浏览 16
提问于2019-05-04
得票数 4
1
回答
配置
单元
中
collect_set
上
的
Where条件
、
、
、
有没有办法在
配置
单元
的
collect_set
输出中过滤掉不
连续
的
数字?请看下面的示例,突出显示
的
行没有
连续
的
数字,我只需要这样
的
输出 ? 这个数字可以是[5,6,9]或[4,5,7,8,],我希望从数组中
的
值不
连续
的
配置
单元
查询中筛选出所有这样
的
行。
浏览 23
提问于2021-03-25
得票数 2
回答已采纳
1
回答
HQL抛出ArrayList不能转换为org.apache.hadoop.io.Text
、
、
最相关
的
部分是:SELECTCASE WHEN rn=1 THEN prov_id ELSE NULL END) OVER (partition by yyyy_mm_dd, h_id) as primary_prov, t.yyyy_mm_dd,
浏览 3
提问于2020-06-22
得票数 0
回答已采纳
1
回答
Spark
collect_set
与distinct
、
如果我
的
目标是将列中
的
不同值收集为列表,使用这两种方法是否会有性能差异或优缺点?df.select(column).distinct().collect()...df.select(
collect_set
(column)).first()...
浏览 1
提问于2020-08-28
得票数 2
3
回答
配置
单元
中
的
列到逗号分隔值
、
有人问过并回答了SQL (),上面提到
的
方法中有没有哪种方法可以在Hive中工作,例如从这个开始:| Col1 | Col2 || a
浏览 0
提问于2014-03-28
得票数 11
回答已采纳
1
回答
在
配置
单元
中使用a组合两行
、
、
我正在尝试在HIVE中实现如下所示
的
功能。Col5 A3 B3 C3 D3 E3行1和行2相似,只是输入中
的
Col3
浏览 1
提问于2017-01-20
得票数 1
回答已采纳
1
回答
有没有办法从Hive中以逗号分隔
的
字符串值中提取唯一值?
、
、
我想从
配置
单元
表中以逗号分隔
的
字符串值中提取唯一值。
浏览 19
提问于2019-05-06
得票数 0
回答已采纳
2
回答
基于组
的
数组类型
的
collect_set
、
下面的表包含id上
的
重复
项
和每个id
的
值数组,我想找出每个id
的
唯一值,如何做到这一点?CREATE TABLE test(values array<string>)错误: 失败: UDFArgumentTypeException只接受基本类型参数,
浏览 3
提问于2017-05-02
得票数 3
回答已采纳
2
回答
PYSPARKSQL中
的
枢轴
、
、
、
、
我需要在下面的桌子上使用枢轴。102,1,96102,1,37101,2,282102,2,78102,3,60101,3,220输出102 96,37 212,78 123,60我在下面的代码中尝试过,但是只有在特定id上有一个记录时,它才能工作。 df.groupBy(
浏览 2
提问于2017-12-28
得票数 0
回答已采纳
1
回答
Hive:如何消除
重复
的
子字符串
、
、
配置
单元
表格: create table T (i int, s string); (1, "a1&b2"), (2, "c1"); S列包含由&分隔
的
值 所需
的
输出应按第1列分组,并连接s列,
但
只有一个唯一
的
子字串值(用&分隔): i gr
浏览 100
提问于2020-04-05
得票数 1
回答已采纳
4
回答
将多行合并为一个空格分隔
的
字符串
、
、
所以我有5行这样
的
行--------------1, b2, d我该如何进行查询,使其看起来像这样1,
浏览 6
提问于2010-09-14
得票数 14
回答已采纳
4
回答
如何在
配置
单元
中减去
项
、
3,4,5 25 4,5 5,8Customer_id ItemListB_A 26 8,9,10我不知道如何从Hive中
的
两个字符串中减去
项
。我知道
COLLECT_SET
,但它可以
删除
重
浏览 0
提问于2017-06-01
得票数 0
1
回答
collect_set
上
的
数组操作
、
、
、
、
我正在处理大型数据集上
的
单元
格,我有带有colum数组
的
表,colum
的
内容如下。20190313Prod4""20190315Prod4""20190317Prod1"我需要一套根据asc日期
的
产品,例如,我需要修剪日期从array和应用
collect_set
,以获得以下结果
浏览 0
提问于2019-08-23
得票数 1
回答已采纳
2
回答
如何从Hive group by operator获取元素数组/包?
、
、
、
、
我希望通过给定
的
字段进行分组,并获得包含分组字段
的
输出。下面是我正在尝试实现
的
一个示例:F1 F2001 222002 222003555001 [111, 222, 123]003 [555]grouped_relation=
浏览 1
提问于2013-05-08
得票数 25
回答已采纳
1
回答
蜂巢-如何在A和B列上组合一个组,在C列上组合一个不同
的
组
、
、
、
我需要创建一个查询,从特定
的
表中选择具有多个、不同电子邮件
的
用户。为了区分用户,我根据两个字段对用户进行分组:姓名和年龄。让我们用一个例子来看这个。:Carol 22 Carol@du, Carol@pt有了这个查询,我就能够解决这个问题,并且我有了想要<em
浏览 0
提问于2018-03-01
得票数 2
回答已采纳
1
回答
通过使用hive查询,我可以将表数据转换为复杂类型
的
list<structure>吗?
、
、
下面是表
的
详细信息a {"col1":"11.0","col2":30.0} bcol2":25.0} c {"col1":"13.0","col
浏览 0
提问于2015-12-31
得票数 0
3
回答
在dataframe中找到副本,并且只保留最高
的
副本。
、
、
、
、
我试图为每个较高
的
组在dataframe中找到
重复
项
,以便稍后可以根据索引从另一个dataframe中
删除
这些副本,这样主dataframe就没有
重复
,只有最低值。基本上,假设我们有这样
的
数据: 1 1 402 3 2 4062 416 6 2 406 7 1
浏览 8
提问于2021-11-10
得票数 0
回答已采纳
4
回答
删除
xml文件中不带排序或唯一
的
重复
连续
行
、
、
、
、
我有一个xml文件,其中我需要保持标记
的
顺序,但有一个名为media
的
标记,它具有
连续
顺序中
的
重复
行。我想
删除
一个
重复
的
媒体标签,
但
想保留所有的父标签-(它们也是
连续
和
重复
的
)。我想知道是否有一个awk解决方案,只有当一个模式匹配时才能
删除
。duplicate, want to delete this<
浏览 0
提问于2015-01-07
得票数 4
2
回答
删除
特定数字
的
连续
值- Python Dataframe
、
、
、
、
如何
删除
特定值
的
连续
重复
项
? 我知道groupby()函数,但它会
删除
任何值
的
连续
重复
项
。 请参阅下面的示例代码。特定值为2,其中我想要
删除
重复
项
import pandas as pd# This
浏览 8
提问于2020-08-04
得票数 1
1
回答
Apache hive -如何将数组列值与联接中
的
其他列进行比较?
、
、
我是新来
的
蜂巢。有谁能帮助解决以下问题吗?Cart Open12 Cart Add14 Cart View输出:加入这些table1后
的
,table1 column2.1, colum2.2, column2.10 with table2 column1 values(1,2,10,11,12,13,14,20)和在table1中制作新
的
column
浏览 3
提问于2015-08-24
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
删除数据重复项,Excel中的这3种方法简单高效
Excel快速删除重复项的几种方法,适用于各种版本,简单高效
看似简单但使用率非常高的7个Excel技巧,都在此文,速度围观!
【Excel技巧】Day23:每天一个Excel使用小技巧,Excel用的好,天天都能下班早!
【excel技巧】巧用重复项 快速去重
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券