php上传文件是最最基础的一个技术点,但是深入进去也有不少问题需要解决,这不,上传中文文件后,文件名变成了乱码。
下面是问题代码,很简单:
1.问题代码html部分: 1 html> 2 body> 3 4 form action=upload_file.php method=post 5 enctype=multipart/form-data> 6 label for=file>filename:label> 7 input type=file name=file id=file /> 8 br /> 9 input type=submit name=submit value=submit />10 form>11 12 body>13 html>
php部分:
1 php 2 if ($_files[file][error] > 0) 3 { 4 echo return code: . $_files[file][error] .
; 5 }else 7 { 8 echo upload: . $_files[file][name] .
; 9 echo type: . $_files[file][type] .
;10 echo size: . ($_files[file][size] / 1024) . kb
;11 echo temp file: . $_files[file][tmp_name] .
;12 13 if (file_exists(upload/ . $_files[file][name]))14 {15 echo $_files[file][name] . already exists. ;16 }17 else18 {19 move_uploaded_file($_files[file][tmp_name],20 upload/ . $_files[file][name]);
}
}
上传了一个文件名为“测试数据.txt”的文件,oh ho,文件是传上去了,但是文件名为乱码。
2.初试网上搜索一下解决方案,将
move_uploaded_file($_files[file][tmp_name], upload/ . $_files[file][name]);
改成
move_uploaded_file($_files[file][tmp_name],upload/ . iconv(utf-8,gbk,$_files[file][name]));
结果发现iconv函数返回值为false。
查一下函数手册,发现第二个参数有特别的用法,简单翻译一下就是我可以在编码的后面追加//translit 或 //ignore ,前者会将无法翻译的字符转成最接近的字符,后者就是直接忽略不能转化的字符。
试一下:
1 var_dump( iconv(utf-8,gbk//translit,$_files[file][name]));2 var_dump( iconv(utf-8,gbk//ignore,$_files[file][name]));
结果:
bool(false) string(4) .txt
也就是说中文都没法转化,甚至连接近的字符都没有,看来网上介绍的方法也并非万能。
3.网上介绍方法失败,再尝试猜测一下,也许我的系统在创建中文文件的时候会乱码,于是我将代码改写了一下:
move_uploaded_file($_files[file][tmp_name], upload/测试数据.txt);
结果创建成功,没有乱码。。。也就是说不是系统问题。
想一下,我的php文件本身是utf8编码的,那么
move_uploaded_file($_files[file][tmp_name],upload/测试数据.txt);
这个语句肯定使用的是utf8编码,那么之前上传的文件名肯定就不是utf8编码了,那么以下的语句肯定是错误的,因为源字符串本身就不是utf8编码的:
iconv(utf-8,gbk//translit,$_files[file][name]);
使用函数检查源字符串的编码:
1 $e=mb_detect_encoding($text, array(‘utf-8’, ‘gbk’,’gb2312’));2 echo $e;
结果是cp936,也就是源字符串编码是gbk。
试一下
move_uploaded_file($_files[file][tmp_name],upload/ . iconv(gbk,utf-8,$_files[file][name]));
问题解决,不再乱码
4.另一种解决办法实际上还有一种解决办法,就是在html文件的head标签中间加入
meta http-equiv=content-type content=text/html; charset=utf-8 />
从而使编码保持统一,也就不需要再转码了
5.下面是结论使用iconv函数可以解决上传中文文件名乱码的问题,实际上iconv能解决各种各样的由于编码不统一造成的乱码问题。使用iconv函数请先检查源字符串的编码,除非你已经确定了源字符串的编码。尽量保证所有的代码的编码一致,万不得已才使用iconv函数。吐槽一下,尽量不使用中文文件名作为服务器上保存的文件名,请将文件名转化成自己的文件名(即使是英文文件名也请转化一下)。
