专栏首页郭家一诺千金Java 存储mysql数据库时如何进行Emoji表情转换和处理

Java 存储mysql数据库时如何进行Emoji表情转换和处理

当保存字符串到数据库里出现\xF0\x9F\x92\x94类似问题时,发现竟是因为输入了Emoji表情的原因,由于我的mysql数据库是utf8字符集,而且Emoji表情等特殊符号要占四个字节,所以导致数据库不能正常存入。 找了很多方法,都没有从根源上解决问题,很是头疼。最后还是发现github上有个很牛逼的轻量级开源工具叫emoji-java,通过这个工具类基本上解决了我大部分的问题,同时配合前端限制Emoji表情输入,才算把问题解决。github地址:https://github.com/vdurmont/emoji-java。 下面附上完整的java解决Emoji表情工具类:

package com.im.app.api.util;

import com.github.binarywang.java.emoji.EmojiConverter;
import com.vdurmont.emoji.EmojiParser;
import org.apache.commons.lang3.StringUtils;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * @Author: guo
 * @Description: ${description}
 * @Date: 2019/4/18 18:48
 * @Version: 1.0
 */
public class EmojiFilterUtil {
    private static EmojiConverter emojiConverter = EmojiConverter.getInstance();

    /**
     * 判断字符串中是否含有表情
     * @param source
     * @return
    */
    public static boolean containsEmoji(String source) {
        int len = source.length();
        boolean isEmoji = false;
        for (int i = 0; i < len; i++) {
            char hs = source.charAt(i);
            if (0xd800 <= hs && hs <= 0xdbff) {
                if (source.length() > 1) {
                    char ls = source.charAt(i + 1);
                    int uc = ((hs - 0xd800) * 0x400) + (ls - 0xdc00) + 0x10000;
                    if (0x1d000 <= uc && uc <= 0x1f77f) {
                        return true;
                    }
                }
            } else {
                // non surrogate
                if (0x2100 <= hs && hs <= 0x27ff && hs != 0x263b) {
                    return true;
                } else if (0x2B05 <= hs && hs <= 0x2b07) {
                    return true;
                } else if (0x2934 <= hs && hs <= 0x2935) {
                    return true;
                } else if (0x3297 <= hs && hs <= 0x3299) {
                    return true;
                } else if (hs == 0xa9 || hs == 0xae || hs == 0x303d
                        || hs == 0x3030 || hs == 0x2b55 || hs == 0x2b1c
                        || hs == 0x2b1b || hs == 0x2b50 || hs == 0x231a) {
                    return true;
                }
                if (!isEmoji && source.length() > 1 && i < source.length() - 1) {
                    char ls = source.charAt(i + 1);
                    if (ls == 0x20e3) {
                        return true;
                    }
                }
            }
        }
        return isEmoji;
    }

    /**
     * 判断某个字符是不是表情
     * @param codePoint
     * @return
     */
    private static boolean isEmojiCharacter(char codePoint) {
        return (codePoint == 0x0) || (codePoint == 0x9) || (codePoint == 0xA)
                || (codePoint == 0xD)
                || ((codePoint >= 0x20) && (codePoint <= 0xD7FF))
                || ((codePoint >= 0xE000) && (codePoint <= 0xFFFD))
                || ((codePoint >= 0x10000) && (codePoint <= 0x10FFFF));
    }

    /**
     * 过滤emoji 或者 其他非文字类型的字符
     *
     * @param source
     * @return
     */
    public static String filterEmoji(String source) {
        if (StringUtils.isBlank(source)) {
            return source;
        }
        StringBuilder buf = null;
        int len = source.length();
        for (int i = 0; i < len; i++) {
            char codePoint = source.charAt(i);
            if (isEmojiCharacter(codePoint)) {
                if (buf == null) {
                    buf = new StringBuilder(source.length());
                }
                buf.append(codePoint);
            }
        }
        if (buf == null) {
            return source;
        } else {
            if (buf.length() == len) {
                buf = null;
                return source;
            } else {
                return buf.toString();
            }
        }
    }

    /**
     * 判断字符串中是否含有表情
     * @param source
     * @return
     */
    public static boolean hasEmoji(String source){
        if (containsEmoji(source)){
            return true;
        }
        source = StringUtils.isEmpty(source) ? "" : source.trim();
        String noEmojiStr = EmojiParser.removeAllEmojis(source);//移除所有的表情之后的字符串8
        if (noEmojiStr.length()<source.length()){
            return true;
        }
        return false;
    }
    /**
     * 将emojiStr转为 带有表情的字符
     * @param emojiStr
     * @return
     */
    public static String emojiConverterUnicodeStr(String emojiStr){
        String result = emojiConverter.toUnicode(emojiStr);
        return result;
    }

    /**
     * 带有表情的字符串转换为编码
     * @param str
     * @return
     */
    public static String emojiConverterToAlias(String str){
        String result=emojiConverter.toAlias(str);
        return result;
    }
    public static void main(String[] args) {
        String string = "✌";
        System.out.println(containsEmoji(string));
        System.out.println(filterEmoji(string));
        System.out.println(hasEmoji(string));
        System.out.println(emojiConverterToAlias(string));
        System.out.println(emojiConverterUnicodeStr(string));

    }
}

其中pom.xml文件如下:

        <!-- 后加的关于过滤表情的,可以去掉 -->
        <dependency>
            <groupId>com.github.binarywang</groupId>
            <artifactId>java-emoji-converter</artifactId>
            <version>0.1.1</version>
        </dependency>

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • JAVA按比例压缩图片

    有时候项目中会遇到前端上传图片,后台需要前端返回原图和按原图比例缩小的压缩图片,此时就需要JAVA来进行图片压缩了,赶紧上代码:

    一诺千金
  • JAVA 通过RSA获取公钥私钥工具类

    一诺千金
  • java判断一个字符串是否为字母

    一诺千金
  • 一些你不知道到Cookie安全登录防范

    作为一个web开发者,避免不了用户登录功能,但是有多少知道用户登录的一些安全防范技术呢?

    IMWeb前端团队
  • 一些你不知道到Cookie安全登录防范

    本文作者:IMWeb 谢华良 原文出处:IMWeb社区 未经同意,禁止转载 作为一个web开发者,避免不了用户登录功能,但是有多少知道用户登录的一些安...

    IMWeb前端团队
  • spring boot 整合mybaits 怎么在控制台打印sql语句

    在上一篇《spring boot 和mybatis整合打印sql语句》有网友说这样打印不出来。今天凯哥就给大家介绍第二种打印方式: 在resource文件夹下新...

    凯哥Java
  • NextCloud手动添加文件并列出

    NextCloud 自带的数据目录在列目录时都是通过数据库查询,如果需要手动在磁盘目录上添加文件并使用nextcloud列出就需要手动扫描。

    宋天伦
  • Redis数据迁移至Codis集群方案

    随着公司项目的发展,单台redis的性能逐渐达到瓶颈,为了保证业务的正常运行,必须对单台redis进行扩展,组建redis的集群。在这次集群组建的过程中我们采用...

    后场技术
  • Redis单个key存储的value很大

    可以像第一种做法一样,分拆成几个key-value, 也可以将这个存储在一个hash中,每个field代表一个具体的属性,使用hget,hmget来获取部分的...

    日薪月亿
  • Redis 单key值过大 优化方式

    由于redis是单线程运行的,如果一次操作的value很大会对整个redis的响应时间造成负面影响,所以,业务上能拆则拆,下面举几个典型的分拆方案。

    高广超

扫码关注云+社区

领取腾讯云代金券