前不久同事调接口时发现了一个奇怪的问题,直接使用curl请求接口,返回没有问题;而通过socket请求时返回的信息多了两行。查看http响应头发现,有时候会指定content-length,有时则是transfer-encoding: chunked。当chunked编码时,通过socket请求就出错。而如果此时服务端指定返回的长度则没问题。
问题就出在此!通常情况下会通过content-length来指定返回内容的长度,而有些时候无法确定长度时,可采用chunked编码动态返回。
chunked描述
http://blog.csdn.net/zhangboyj/article/details/6236780
一般http通信时,会使用content-length头信息性来通知用户代理(通常意义上是浏览器)服务器发送的文档内容长度,该头信息定义于http1.0协议rfc 1945 10.4章节中。浏览器接收到此头信息后,接受完content-length中定义的长度字节后开始解析页面,但如果服务端有部分数据延迟发送吗,则会出现浏览器白屏,造成比较糟糕的用户体验。
解决方案是在http1.1协议中,rfc 2616中14.41章节中定义的transfer-encoding: chunked的头信息,chunked编码定义在3.6.1中,所有http1.1 应用都支持此使用trunked编码动态的提供body内容的长度的方式。进行chunked编码传输的http数据要在消息头部设置:transfer-encoding: chunked表示content body将用chunked编码传输内容。根据定义,浏览器不需要等到内容字节全部下载完成,只要接收到一个chunked块就可解析页面.并且可以下载html中定义的页面内容,包括js,css,image等。
格式
http://zh.wikipedia.org/wiki/%e5%88%86%e5%9d%97%e4%bc%a0%e8%be%93%e7%bc%96%e7%a0%81
如果一个http消息(请求消息或应答消息)的transfer-encoding消息头的值为chunked,那么,消息体由数量未定的块组成,并以最后一个大小为0的块为结束。
每一个非空的块都以该块包含数据的字节数(字节数以十六进制表示)开始,跟随一个crlf (回车及换行),然后是数据本身,最后块crlf结束。在一些实现中,块大小和crlf之间填充有白空格(0x20)。
最后一块是单行,由块大小(0),一些可选的填充白空格,以及crlf。最后一块不再包含任何数据,但是可以发送可选的尾部,包括消息头字段。
消息最后以crlf结尾。
模拟socket请求
模拟请求后请求数据和返回数据如下图:
transfer-encoding指定chunked编码,并且分成两段,分别对应长度和内容,以0结束。可以对照上面的格式查看。
编码解析
通常这种问题发生在使用自己封装的socket方法时,并且http版本使用1.1时会有该问题,所以可以使用1.0避免chunked编码解析的问题,或者使用curl或者其他封装好的方法。
如果想解析chunked编码,也可参考手册上的方法
http://cn2.php.net/manual/en/function.fsockopen.php
function unchunkhttpresponse($str=null){ if (!is_string($str) or strlen($str) 原文地址:chunked编码, 感谢原作者分享。
