curl_setopt ($ch, curlopt_url,$vo);
$content = curl_exec($ch);
preg_match_all(/\
(.*)\|\/,$content,$match); if(!emptyempty ( $match[2][1])){
$list[$j]['content']=$match[2][1];
$list[$j]['title']=$match[1][0];
$j++;
}
}
print_r($list);
}
?>
很容易看出
$list就是收集到的新闻,形式是一个二维数组
如果要把他保存到你的数据库,我就不解释了...
其中注意判断是否与你数据库的文章重复
可以通过md5加密标题然后与你数据库的文章标题md5加密后比对,若真.,则表示你数据库有同样的文章
注意这里希望大家复制不要手工复制,请查看源代码方法复制.....
因为表面的代码跟实际代码貌似有出入
如果你是thinkphp的话..www.2cto.com..那就跟我的一样了...下面贴出更方便的代码直接添加数据库,包括重复数据判断:
$vo){
curl_setopt ($ch, curlopt_url,$vo);
$content = curl_exec($ch);
preg_match_all(/\
(.*)\|\/,$content,$match); if(!emptyempty($match[2][1])){
$list[$j]['content']=$match[2][1];
$list[$j]['title']=$match[1][0];
$j++;
}
}
$db=m('news');
$news=$db->where(uid=.$uid)->select();
$flag=true;
foreach($list as $i=>$vo){
foreach($news as $j=>$value){
if(md5($value['title'])==md5($vo['title'])){
$flag=false;
break;
}
}
if($flag){
$vo['uid']=$uid;
$vo['date']=date('y-j-m h:i:s');
$vo['author']=session::get(admin);
$vo['iscommand']=1;
$rs=$db->add($vo);
}
$flag=true;
}
}
?>
摘自 zouhao619的专栏
http://www.bkjia.com/phpjc/478488.htmlwww.bkjia.comtruehttp://www.bkjia.com/phpjc/478488.htmltecharticle?php function csdn(){//$uid采集文章的分类 $url=http://www.csdn.net; $ch = curl_init(); curl_setopt ($ch, curlopt_url,$url); curl_setopt ($ch, curlopt_returntransfer, 1); cur...