文章/答案/技术大牛

发布

社区首页 >问答首页 >PostgreSQL -在数组中查找最常见的子字符串()

问PostgreSQL -在数组中查找最常见的子字符串()
EN

Stack Overflow用户

提问于 2020-08-03 16:48:34

回答 2查看 132关注 0票数 1

我需要找到一种方法从PostgreSQL中的数组中确定最常见的子字符串。

我在PostgreSQL的一个列中有一个单维数组，它存储CPV值(一个嵌套的分类词汇表- https://simap.ted.europa.eu/cpv)。这些代码由数字字符组成，但作为varchar存储，因为某些记录具有前导零，如下所示：

["45331110", "50721000", "45251250", "42160000", "39715000", "45315000", "09323000", "71321200", "45331100", "50720000"]

我想使用PostgreSQL从这个数组中提取最常见的两位数字，在示例中是45。

arrays

postgresql

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-08-03 16:59:11

如果您想获得每个行最常见的两位数字，那么您可以使用：

WITH data_rows(id, cpv_values) AS (
    VALUES (1, ARRAY ['45331110', '50721000', '45251250','42160000','39715000','45315000', '09323000','71321200','45331100', '50720000'])
         , (2, ARRAY ['50721000']) -- second test case
)
SELECT id, leading_two_digits
FROM data_rows
-- for every row in `data_rows` (your table),
-- select the most common `leading_two_digits` (through GROUP BY/ORDER BY/LIMIT 1)
JOIN LATERAL (
    SELECT left(code, 2) AS leading_two_digits
    FROM unnest(cpv_values) AS f(code)
    GROUP BY left(code, 2)
    ORDER BY COUNT(*) DESC
    LIMIT 1
) s ON true

+--+------------------+
|id|leading_two_digits|
+--+------------------+
|1 |45                |
|2 |50                |
+--+------------------+

如果您想在所有行中获得最常见的两位数字，可以使用：

WITH data_rows(cpv_values) AS (
    VALUES (ARRAY ['45331110', '50721000', '45251250','42160000','39715000','45315000', '09323000','71321200','45331100', '50720000']),
           (ARRAY ['45'])
)
SELECT left(code, 2) AS leading_two_digits
FROM data_rows, unnest(cpv_values) AS f(code)
GROUP BY left(code, 2)
ORDER BY COUNT(*) DESC
LIMIT 1

票数 2

Stack Overflow用户

发布于 2020-08-03 17:04:31

这个查询可以满足您的需要。

select substr(t, 1, 2) mc
 from unnest(array['45331110', '50721000', '45251250', '42160000', '39715000', '45315000', '09323000', '71321200', '45331100', '50720000']) t 
 group by mc
 order by count(1) desc
 limit 1;

结果：

Name|Value|
----|-----|
mc  |45   |

您可以使用上面的thie作为子查询来提取每行最常见的子字符串。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/63233614

复制

相似问题

问PostgreSQL -在数组中查找最常见的子字符串()
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问PostgreSQL -在数组中查找最常见的子字符串()EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问PostgreSQL -在数组中查找最常见的子字符串()
EN