Emoji表情符号在MySQL数据库中的存储

本是古典 何须时尚 2021-09-29 13:16 506阅读 0赞

在Android手机或者iPhone的各种输入法键盘中,会自带一些Emoji表情符号,如IPhone手机系统键盘包含的表情符号有:

![Image 1][]

IPhone Emoji.png

如果在移动端发布文本内容时包含了这种Emoji表情符号,通过接口传递到服务器端,服务器端再存入MySQL数据库:

  • 对gbk 字符集的数据库,写入数据库的数据,在回显时,变成 ‘口口’ 无法回显;
  • 对utf8 字符集的数据库,则根本无法写入数据库,程序直接报出异常信息
    java.io.exception xxxxxxxx.

原因分析:

Emoji表情符号为4个字节的字符,而 utf8 字符集只支持1-3个字节的字符,导致无法写入数据库。

解决方案:

  1. 遍历输入的文本,把四字节长度的字符,修正为自定义的字符替换掉。
  2. 修改MySQL数据库字符集, 把数据库字符集从utf8 修改为支持1-4 个字节字符的utf8mb4。

事实上可以看出,第一种方案的工作量较大,并不可取。推荐使用第二种方案,修改数据库字符集。从MySQL 5.5.3版本开始,数据库可支持4个字节的utf8mb4 字符集,一个字符最多可以有4个字节,所以能支持更多的字符集,故能存储Emoji表情符号。从 mysql 5.5.3 之后版本基本可以无缝升级到 utf8mb4 字符集。同时,utf8mb4兼容utf8字符集,utf8 字符的编码、位置、存储在utf8mb4与utf8字符集里一样的,不会对有现有数据带来损坏。

升级方案:

  1. 修改数据库字符集character-set-server=utf8mb4 重启数据库生效。
  2. 修改database 的字符集为 utf8mb4 alter database dbname character set utf8mb4
  3. 修改表的字符集 为utf8mb4 , alter table character set = utf8mb4

附上:

Emoji 全编码字符集:IOS Emoji

  1. 作者:亦枫
  2. 链接:http://www.jianshu.com/p/20740071d854
  3. 來源:简书
  4. 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

转载于:https://www.cnblogs.com/AllenChou/p/7687072.html

[Image 1]:

发表评论

表情:
评论列表 (有 0 条评论,506人围观)

还没有评论,来说两句吧...

相关阅读

    相关 mysql存储表情符号报错

    前言 博主再开发微信公众号获取用户姓名的时候,出现了很大的问题,一开始只是设计的数据库的编码为UTF-8,但是在当用户的nickName设置为表情的符号的时候就会出错,

    相关 java存储表情符号

    > 需求:项目中需要对用户设置姓名支持输入表情符号 > 解决方案:解决的办法很简单,比如用户名字段数据库设置为varchar类型,只需要把数据库表里面这个用户名字段的字符集修