您好,欢迎来到三六零分类信息网!老站,搜索引擎当天收录,欢迎发信息

php采集csdn首页新闻_PHP教程

2024/3/13 3:13:23发布27次查看
$vo){ 
        curl_setopt ($ch, curlopt_url,$vo); 
        $content = curl_exec($ch); 
        preg_match_all(/\
(.*)\|\/,$content,$match);          if(!emptyempty ( $match[2][1])){ 
            $list[$j]['content']=$match[2][1]; 
            $list[$j]['title']=$match[1][0]; 
            $j++; 
        } 
    } 
    print_r($list); 

?>
很容易看出
$list就是收集到的新闻,形式是一个二维数组
如果要把他保存到你的数据库,我就不解释了...
其中注意判断是否与你数据库的文章重复
可以通过md5加密标题然后与你数据库的文章标题md5加密后比对,若真.,则表示你数据库有同样的文章
注意这里希望大家复制不要手工复制,请查看源代码方法复制.....
因为表面的代码跟实际代码貌似有出入
如果你是thinkphp的话..www.2cto.com..那就跟我的一样了...下面贴出更方便的代码直接添加数据库,包括重复数据判断:
$vo){ 
        curl_setopt ($ch, curlopt_url,$vo); 
        $content = curl_exec($ch); 
        preg_match_all(/\
(.*)\|\/,$content,$match);          if(!emptyempty($match[2][1])){ 
            $list[$j]['content']=$match[2][1]; 
            $list[$j]['title']=$match[1][0]; 
            $j++; 
        } 
    } 
    $db=m('news'); 
    $news=$db->where(uid=.$uid)->select(); 
    $flag=true; 
    foreach($list as $i=>$vo){ 
        foreach($news as $j=>$value){ 
            if(md5($value['title'])==md5($vo['title'])){ 
                $flag=false; 
                break; 
            } 
        } 
        if($flag){ 
            $vo['uid']=$uid; 
            $vo['date']=date('y-j-m h:i:s'); 
            $vo['author']=session::get(admin); 
            $vo['iscommand']=1; 
            $rs=$db->add($vo); 
        } 
        $flag=true; 
    } 

?>
摘自 zouhao619的专栏
http://www.bkjia.com/phpjc/478488.htmlwww.bkjia.comtruehttp://www.bkjia.com/phpjc/478488.htmltecharticle?php function csdn(){//$uid采集文章的分类 $url=http://www.csdn.net; $ch = curl_init(); curl_setopt ($ch, curlopt_url,$url); curl_setopt ($ch, curlopt_returntransfer, 1); cur...
该用户其它信息

VIP推荐

免费发布信息,免费发布B2B信息网站平台 - 三六零分类信息网 沪ICP备09012988号-2
企业名录 Product