+ -
当前位置:首页 → 问答吧 → 采集登录之后网站的内容

采集登录之后网站的内容

时间:2011-09-08

来源:互联网

在写采集程序的时候,有时候网站的某一个板块的内容只允许该网站的会员才能浏览,但我又想通过采集程序获取这种类型的信息,所以就必须得通过登录来完成.
但是遇到的问题是如果这个网站需要登录并且还是带有验证码功能的,请问如何实现采集功能?
之前自己也曾写过模拟登录,但登录之后只能访问一次页面,如果要再次访问下一个链接的话又要重新登录,这样好麻烦,有没有更好的方法呢?
比如说实现一次登录之后就可以一直采集网站中的内容了!
在此请高手指一条明路!

作者: fltn03   发布时间: 2011-09-08



登陆cookie存储至自定义目录

$cookie_dir = tempnam('.', 'cookie');
curl_setopt($curl, CURLOPT_COOKIEJAR, $cookie_dir);

二次采集时调用

curl_setopt($curl, CURLOPT_COOKIEFILE, $cookie_dir);//读取cookie文件


详情请咨询手册

作者: xxfs91   发布时间: 2011-09-08

不会,同求

作者: fireye   发布时间: 2011-09-08

登陆cookie存储至自定义目录

$cookie_dir = tempnam('.', 'cookie');
curl_setopt($curl, CURLOPT_COOKIEJ ...
xxfs91 发表于 2011-9-8 11:01



    好的.我试试.这会正在学习curl方法呢.

作者: fltn03   发布时间: 2011-09-08

回复 fltn03


   

作者: xxfs91   发布时间: 2011-09-08

回复 fltn03


    好像win下要tempnam('./','cookie')...留意下

作者: xxfs91   发布时间: 2011-09-08

相关阅读 更多