请教下各位大牛,如何抓取一个页面然后匹配页面中的所有链接是js的。目前我这么做的
php codefunction getlink($code){ preg_match_all(/src=[\'\]{0,1}([^>\'\]*).*js/i),$code,$link); return $link[1];}
可是调用的时候碰到页面理的js链接如下的时候就输出不正常了。
http://www.test.com/1.js?ego
-----这个只能输出http://www.test.com/1.
http://www.test.com/2.js
-----这个能正常输出http://www.test.com/2.js
求指点
------解决方案--------------------
preg_match_all(/src=[\'\]{0,1}([^>\'\]*.*js?)/i),$code,$link); //这样呢?
------解决方案--------------------
preg_match_all(/src=[\'\]{0,1}([^>\'\]*.*js)/iu,$code,$link);
结果中会包含 mre_src 部分的内容,若不想要,则
preg_match_all(/\bsrc=[\'\]{0,1}([^>\'\]*.*js)/iu,$s,$link);
------解决方案--------------------
php code$str='';$pattern='/\bsrc=[\']?([^\']+\.js)/u';preg_match_all($pattern,$str,$matches);print_r($matches);
