前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >MySQL分割一行为多行的思路

MySQL分割一行为多行的思路

作者头像
干货满满张哈希
发布于 2021-04-12 06:35:36
发布于 2021-04-12 06:35:36
3.2K00
代码可运行
举报
运行总次数:0
代码可运行

最近数据分析有需求,分析运营活动短信用户,但是发送短信的用户是通过 JSON 字符串数组存储在一个 text 字段的。内容类似于:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
["user1", "user2", "user3"....]

数据分析想分析这些用户,那么就需要 in 这些用户查询。自己手动拼 SQL 太蛋疼,而且好几万几十万的用户,拼成SQL,复制粘贴也够蛋疼的。那么可以考虑将这一行分割为多行,作为一个字段。

mysql.help_topic 是啥

网上的思路是利用 mysql.help_topic 这个记录表,这个表是存储 mysql 各种帮助文档目录的,主要因为他有一个从零开始自增的 id 字段,所以采用这张表作为帮助表。其实他不是用来干这个的。并且,有时候我们精简安装,或者是云服务里面的 mysql,他们的这张表里面的内容,是空的,所以我们不能靠这张表。

如何自己实现呢?

思路主要是如下,首先处理数据,将 JSON 字符串数组处理成:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
user1,user2,user3

通过:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
select replace(replace(replace(replace(a,'[',''),']',''), '"', ''),' ','') processed_data from 表

然后,我们通过substring_index函数,可以提取出user1user2user3这些用户 id。分别是:substring_index(substring_index(processed_data,',',1),',',-1)substring_index(substring_index(processed_data,',',2),',',-1)substring_index(substring_index(processed_data,',',3),',',-1).可以看出,如果我们能提供一个数字,这个数字从1开始,一直到,的个数 + 1,这样就能使用substring_index函数,将每个 userId 提取出来,也就是将数据转换成:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
+-------------------+----+
| processed_data    | id |
| user1,user2,user3 | 1  |
| user1,user2,user3 | 2  |
| user1,user2,user3 | 3  |

哪里有这么一张表呢?我们可以创建一个表,里面只有一列 id,从0或者1开始,这里我们从0开始,一直到你的,可能的最多个数,我们这里是 200 万。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
+----+
| id |
+----+
|  0 |
|  1 |
|  2 |
|  3 |
|  4 |
|  5 |

这样,通过 join 这张表,用 id < ,的个数为条件,就能得出上面的processed_dataid join 的数据。

最后的SQL:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
SELECT
	substring_index( substring_index( processed_data, ',', b.id + 1 ), ',',- 1 ) user_id 
FROM
(
SELECT REPLACE
	(
		REPLACE ( REPLACE ( REPLACE (数据字段, '[', '' ), ']', '' ), '"', '' ),
		' ',
		'' 
	) processed_data 
FROM) temp
JOIN help表 b ON b.id < ( length( temp.processed_data ) - length( REPLACE ( temp.processed_data, ',', '' ) ) + 1 )

其中的 help 表就是里面只有一列 id,从0或者1开始,这里我们从0开始,一直到你的,可能的最多个数的这张表

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020/04/15 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • mysql.help_topic 是啥
  • 如何自己实现呢?
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档