关于MySQL实现指定编码遇到的坑

写在前面

环境:mysql5.7+,mysql数据库字符编码实现为utf8,表也为utf8

场景:微信授权获取用户信息(包括昵称)并保存到数据库,有的用户成功了,少数用户却失败了

那么为什么会失败呢?

贴上报错日志

incorrect string value: ‘\xf0\x9f\x98\x98\xf0\x9f…’ for column ‘nickname’ at row 1

是因为失败的用户微信昵称中带有emoji符号导致的

剖析:

mysql支持多种字符编码集,如utf-8、gb2312、gbk等

可以通过 show charset 命令查看。

通常我们会建议使用 utf-8 作为默认的字符编码方式。

从上图我们可以看到,mysql数据库有两套 utf-8 编码实现。

  • utf8:utf8 编码只支持三个字节以内。在 utf8 编码中,中文是占了3个字节,其他的英文、数字、符号都是占1个字节。但是emoji符号占4个字节,一些比较复杂的文字、繁体字也是占4个字节。
  • utf8mb4:utf-8编码的完整实现。最多可支持4个字节,所以,可以用来存储emoji符号。

查阅资料,官方解释:

最后

tips:如果有需要保存emoji符号的字段,记得一定要指定编码为 utf8mb4 。

到此这篇关于一个关于mysql指定编码实现的小坑的文章就介绍到这了,更多相关mysql指定编码内容请搜索www.887551.com以前的文章或继续浏览下面的相关文章希望大家以后多多支持www.887551.com!

(0)
上一篇 2022年3月21日
下一篇 2022年3月21日

相关推荐