您好,欢迎来到三六零分类信息网!老站,搜索引擎当天收录,欢迎发信息

采集网站内容,停止在多少行!如何操作!

2024/2/22 23:34:45发布20次查看
function get_content_by_socket($url){ $url = eregi_replace('^http://', '', $url);$temp = explode('/', $url);$host = array_shift($temp);$url = ''.implode('/', $temp);$temp = explode(':', $host);$host = $temp[0];$port = isset($temp[1]) ? $temp[1] : 80;//echo $url;//echo $host; $fp = fsockopen($host, 80) or die(open . $url . failed); $header = get /.$url . http/1.1\r\n; $header .= accept: */*\r\n; $header .= accept-language: zh-cn\r\n; $header .= accept-encoding: gzip, deflate\r\n; $header .= if-modified-since: tue, 06 apr 2010 07:56:03 gmt; length=2235\r\n; $header .= user-agent: mozilla/4.0 (compatible; msie 6.0; windows nt 5.1; sv1; gtb6.4)\r\n; $header .= host: . $host .\r\n; $header .= referer: http://video.baidu.com/v?word=11&ct=301989888&rn=20&pn=0&db=0&s=0&fbl=800\r\n; //fputs($content, referer: $domainrn);//伪造部分 $header .= connection: keep-alive\r\n; $header .= cookie: baiduid=5f96971273579588527a980f307e8b7a:fg=1\r\n\r\n; //$header .= connection: close\r\n\r\n; fwrite($fp, $header); while (!feof($fp)) { $contents .= fgets($fp, 8192); } fclose($fp); return $contents; }
以这个函数与为例
只要读取到第10行,下面的就不取了直接结束输出内容!这样取到了自己想要的,节省时间资源!
或者只读取到
 自定义哪个字段
可实现吗
回复讨论(解决方案) $i = 0;
while(!eof($f) and $i  xxxx;
 $i++;
}
该用户其它信息

VIP推荐

免费发布信息,免费发布B2B信息网站平台 - 三六零分类信息网 沪ICP备09012988号-2
企业名录 Product