您好,欢迎来到三六零分类信息网!老站,搜索引擎当天收录,欢迎发信息

PHP 简易爬虫

2025/3/8 5:26:51发布39次查看
function get_urls($url) { $url_array=array(); $the_first_content=file_get_contents($url); $the_second_content=file_get_contents($url); $pattern1 = /http:\/\/[a-za-z0-9\.\?\/\-\=\&\:\+\-\_\'\]+/; $pattern2=/http:\/\/[a-za-z0-9\.]+/; preg_match_all($pattern2, $the_second_content, $matches2); preg_match_all($pattern1, $the_first_content, $matches1); $new_array1=array_unique($matches1[0]); $new_array2=array_unique($matches2[0]); $final_array=array_merge($new_array1,$new_array2); $final_array=array_unique($final_array); for($i=0;$i { echo $final_array[$i].
; } } get_urls(http://www.baidu.com);
复制代码
该用户其它信息

VIP推荐

免费发布信息,免费发布B2B信息网站平台 - 三六零分类信息网 沪ICP备09012988号-2
企业名录 Product