码迷,mamicode.com
首页 > 编程语言 > 详细

Java 解决Emoji表情过滤问题

时间:2019-01-07 21:11:35      阅读:480      评论:0      收藏:0      [点我收藏+]

标签:alt   方法   lse   http   问题   static   git   point   nbsp   

 

Emoji表情从三方数据中获取没有过滤,导致存入DB的时候报错。

技术分享图片

原因:

UTF-8编码有可能是两个、三个、四个字节。Emoji表情是4个字节,而Mysql的utf8编码最多3个字节,所以数据插不进去。

 

 

方法1.将已经建好的表也转换成utf8mb4

 

2,写个工具类:过滤掉emoji表情符号


public class EmojiFilter {


private static boolean isEmojiCharacter(char codePoint) {
return (codePoint == 0x0) || (codePoint == 0x9) || (codePoint == 0xA)
|| (codePoint == 0xD)
|| ((codePoint >= 0x20) && (codePoint <= 0xD7FF))
|| ((codePoint >= 0xE000) && (codePoint <= 0xFFFD))
|| ((codePoint >= 0x10000) && (codePoint <= 0x10FFFF));
}

/**
* 过滤emoji 或者 其他非文字类型的字符
*
* @param source
* @return
*/
public static String filterEmoji(String source) {
if (StringUtils.isBlank(source)) {
return source;
}
StringBuilder buf = null;
int len = source.length();
for (int i = 0; i < len; i++) {
char codePoint = source.charAt(i);
if (isEmojiCharacter(codePoint)) {
if (buf == null) {
buf = new StringBuilder(source.length());
}
buf.append(codePoint);
}
}
if (buf == null) {
return source;
} else {
if (buf.length() == len) {
buf = null;
return source;
} else {
return buf.toString();
}
}
}

3,使用别人封装的一个类,专门解决emoji问题的。这个在git上有开源的代码。在pom工程中引入(最方便)

<dependency>
<groupId>com.vdurmont</groupId>
<artifactId>emoji-java</artifactId>
<version>4.0.0</version>
</dependency>

 

Java 解决Emoji表情过滤问题

标签:alt   方法   lse   http   问题   static   git   point   nbsp   

原文地址:https://www.cnblogs.com/shenhaha520/p/10234742.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!