判断字符串中是否含有 emoji 表情移除字符串中的 emoji 表情含有 emoji 表情的字符串在 mysql 中的储存utf-8 编码的 emoji 表情或者某些特殊字符占用 4 个字节。utf-8 编码的常用中文字符占用 3 个字节。
判断字符串中是否含有 emoji 表情
三个 php 内置函数:
mb_strlenmixed mb_strlen ( string $str [, string $encoding = mb_internal_encoding() ] )// 返回具有 encoding 编码的字符串 str 包含的字符数。 多字节的字符被计为 1。// 如果给定的 encoding 无效则返回 false。
mb_substrstring mb_substr ( string $str , int $start [, int $length = null [, string $encoding = mb_internal_encoding() ]] )// 根据字符数执行一个多字节安全的 substr() 操作。 位置是从 str 的开始位置进行计数。 第一个字符的位置是 0。第二个字符的位置是 1。// mb_substr() 函数根据 start 和 length 参数返回 str 中指定的部分。
strlenint strlen ( string $string )// 返回给定的字符串 string 的长度。
函数如下:
function haveemojichar($str){ $mblen = mb_strlen($str); $strarr = []; for ($i = 0; $i < $mblen; $i++) { $strarr[] = mb_substr($str, $i, 1, 'utf-8'); if (strlen($strarr[$i]) >= 4) { return true; } } return false;}
移除字符串中的 emoji 表情
函数如下:
function removeemojichar($str){ $mblen = mb_strlen($str); $strarr = []; for ($i = 0; $i < $mblen; $i++) { $mbsubstr = mb_substr($str, $i, 1, 'utf-8'); if (strlen($mbsubstr) >= 4) { continue; } $strarr[] = $mbsubstr; } return implode('', $strarr);}
含有 emoji 表情的字符串在 mysql 中的储存
1、mysql 中使用 utf8mb4 字符集。
2、php 对字符串进行 base64 编码,从数据库中取出时再对字符串进行解码。
3、直接移除字符串中的 emoji 表情(该方法简单粗暴)
以上就是php处理字符中的emoji表情(判断/移除/存储)的详细内容。
