一、中文编码
urlencode()函数urlencode()函数可以对中文字符进行编码,将其转换为%xx的形式,其中xx是该字符在字符集中的十六进制表示。例如“中文”这个词,在使用urlencode()函数之后,会被转换为“%e4%b8%ad%e6%96%87”。
例子:
$str = 中文;echo urlencode($str); // 输出 %e4%b8%ad%e6%96%87
rawurlencode()函数rawurlencode()函数与urlencode()函数的作用基本相同,不同的是rawurlencode()函数不会对空格进行编码,而是将其转换为“+”号。
例子:
$str = 中文 test;echo rawurlencode($str); // 输出 %e4%b8%ad%e6%96%87+test
urldecode()函数urldecode()函数可以对使用urlencode()函数编码过的字符串进行解码,将其中的%xx形式的字符转换为相应的中文字符。
例子:
$str = %e4%b8%ad%e6%96%87;echo urldecode($str); // 输出 中文
rawurldecode()函数rawurldecode()函数与urldecode()函数作用相同,不同的是rawurldecode()函数会将“+”号转换为空格。
例子:
$str = %e4%b8%ad%e6%96%87+test;echo rawurldecode($str); // 输出 中文 test
二、中文转换
iconv()函数iconv()函数可以完成不同编码间的转换,包括utf-8、gbk、big5等常用的编码格式。其语法格式为:
iconv($in_charset, $out_charset, $string);
其中$in_charset表示输入字符串的编码格式,$out_charset表示输出字符串的编码格式,$string表示要转换的字符串。
例如将utf-8编码的字符串转换为gbk编码的字符串:
$str = 中文;$str = iconv(utf-8, gbk, $str);echo $str; // 输出乱码,应该在gbk编码的环境下查看
注意:iconv()函数转换后可能出现乱码的情况,这主要由于对于某个字符在两个编码中的对应关系可能不存在,因此无法正确转换。解决该问题的方法可以使用unicode转换方法。
mb_convert_encoding()函数mb_convert_encoding()函数也可以完成不同编码之间的转换,与iconv()函数的区别在于其使用更加灵活,可以指定更多的转换选项。其语法格式为:
mb_convert_encoding($string, $to_encoding, $from_encoding);
其中$string表示要转换的字符串,$to_encoding表示转换后的编码格式,$from_encoding表示原始字符串的编码格式。
例如将utf-8编码的字符串转换为gbk编码的字符串:
$str = 中文;$str = mb_convert_encoding($str, gbk, utf-8);echo $str; // 输出乱码,应该在gbk编码的环境下查看
utf8_encode()函数和utf8_decode()函数utf8_encode()函数可以将iso-8859-1编码的字符串转换为utf-8编码的字符串,而utf8_decode()函数则可以将utf-8编码的字符串转换为iso-8859-1编码的字符串。
例如将iso-8859-1编码的字符串转换为utf-8编码的字符串:
$str = 中文;$str = utf8_encode($str);echo $str; // 输出䏿–‡
注意:utf8_encode()函数转换后可能出现乱码的情况,应当谨慎使用。
chr()函数和ord()函数chr()函数可以将给定的ascii码值转换为相应的字符,而ord()函数则可以将给定的字符转换为相应的ascii码值。特别的,在utf-8编码中,每个字符可以由1到4个字节组成。对于某个字符的utf-8编码,可以通过ord()函数得到其十进制值,然后再使用chr()函数将其转换为字符。
例如将字符“中”转换为其utf-8编码:
$ord1 = ord(中); // 取得字符中的utf-8编码的第一个字节的值$ord2 = ord(substr(中, 1)); // 取得字符中的utf-8编码的第二个字节的值$str = chr(0xe4) . chr(0xb8) . chr(0xad); // 使用chr()函数转换为utf-8编码的字符串echo $str; // 输出 中
注意:在使用chr()函数和ord()函数时,要仔细考虑不同字符集的编码差异。
三、中文长度判断
strlen()函数strlen()函数是用来计算字符串长度的,包括中文和英文字符。但是由于中文字符在不同编码下所占的字节数不同,因此在计算中文字符串的长度时无法准确统计中文字符的个数。例如使用strlen()函数计算“中文”的长度,结果为6。
例子:
$str = 中文;echo strlen($str); // 输出 6
mb_strlen()函数mb_strlen()函数可以准确计算中文字符串的长度,不同编码的字符串都可以计算。
例子:
$str = 中文;echo mb_strlen($str); // 输出 2
注意:在使用mb_strlen()函数时,要指定正确的中文字符集。如果不知道字符集,可以使用mb_detect_encoding()函数进行检测。
以上就是详解php的中文转换函数的详细内容。
