我遇到了一个处理数据序列的奇怪问题。我的原始数据看上去-
Roll-on, Marker
1,1
2,0
3,0
5,1
8,1
9,0
10,1
标记列只能有两个值,即1和0。
如果roll列在序列中,则标记值1表示序列的开始,其余的roll将在该序列中具有标记值0。因此,对于roll序列1-3,标记值为1表示roll NO1,对其余部分为0。但是,如果roll不属于序列(如ROLNO8),则标记值为1。
Roll range
1
2
3
1-3
5
5-5
8
9
10
8-10
意思是-
这怎麽可能?
提前谢谢你的帮助。
发布于 2022-05-15 08:26:53
这似乎是一个孤岛和空隙问题。
如果我正确理解,我们可以尝试使用带有条件的SUM
窗口函数来实现它。
生成行号的间隙,然后通过以下方法获得min
和max
组
SELECT CONCAT(MIN(Roll),'-',MAX(Roll))
FROM (
SELECT *,
SUM(CASE WHEN Marker = 1 THEN 1 ELSE 0 END) OVER(ORDER BY Roll) grp
FROM T
) t1
GROUP BY grp
由于我不确定8-10
的逻辑(为什么不是8-9
和10-10
)来自您的expect结果和列描述,我想我们可以尝试判断滚动的Max
,然后做一些算术。
SELECT CONCAT(MIN(Roll),'-',MAX(Roll))
FROM (
SELECT *,
SUM(CASE WHEN Marker = 1 THEN 1 ELSE 0 END) OVER(ORDER BY Roll) + IIF(MAX(Roll) OVER() = Roll, - Marker,0) grp
FROM T
) t1
GROUP BY grp
这样,最终的查询就可以结合结果集,我们可以使用UNION ALL
;WITH CTE AS (
SELECT *,
SUM(CASE WHEN Marker = 1 THEN 1 ELSE 0 END) OVER(ORDER BY Roll) + IIF(MAX(Roll) OVER() = Roll, - Marker,0) grp
FROM T
)
SELECT [Roll range]
FROM (
SELECT CONCAT(MIN(Roll),'-',MAX(Roll)) 'Roll range',MAX(Roll) seq
FROM CTE t1
GROUP BY grp
UNION ALL
SELECT CAST(Roll AS VARCHAR(5)),Roll
FROM CTE t1
) t1
ORDER BY seq
https://stackoverflow.com/questions/72246564
复制相似问题