前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >WordPress 技巧:去除非法字符

WordPress 技巧:去除非法字符

作者头像
Denis
发布2023-04-15 10:35:31
6930
发布2023-04-15 10:35:31
举报
文章被收录于专栏:WordPress果酱WordPress果酱

最新版的 WordPress 数据字段格式已经升级为:utf8mb4,就是说支持 emoji 等4个字节的字符,但是在开发的时候发现用户还是会输入一些 utf8mb4 还不支持的字符,都不知道这些神人怎么输入的。

那么怎么去掉这些字符呢?可以使用下面这个函数:

代码语言:javascript
复制
function wpjam_strip_invalid_text($str){
	$regex = '/
	(
		(?: [\x00-\x7F]                  # single-byte sequences   0xxxxxxx
		|   [\xC2-\xDF][\x80-\xBF]       # double-byte sequences   110xxxxx 10xxxxxx
		|   \xE0[\xA0-\xBF][\x80-\xBF]   # triple-byte sequences   1110xxxx 10xxxxxx * 2
		|   [\xE1-\xEC][\x80-\xBF]{2}
		|   \xED[\x80-\x9F][\x80-\xBF]
		|   [\xEE-\xEF][\x80-\xBF]{2}
		|    \xF0[\x90-\xBF][\x80-\xBF]{2} # four-byte sequences   11110xxx 10xxxxxx * 3
		|    [\xF1-\xF3][\x80-\xBF]{3}
		|    \xF4[\x80-\x8F][\x80-\xBF]{2}
		){1,50}                          # ...one or more times
	)
	| .                                  # anything else
	/x';

	return preg_replace($regex, '$1', $str);
}

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档