采集登录之后网站的内容
时间:2011-09-08
来源:互联网
在写采集程序的时候,有时候网站的某一个板块的内容只允许该网站的会员才能浏览,但我又想通过采集程序获取这种类型的信息,所以就必须得通过登录来完成.
但是遇到的问题是如果这个网站需要登录并且还是带有验证码功能的,请问如何实现采集功能?
之前自己也曾写过模拟登录,但登录之后只能访问一次页面,如果要再次访问下一个链接的话又要重新登录,这样好麻烦,有没有更好的方法呢?
比如说实现一次登录之后就可以一直采集网站中的内容了!
在此请高手指一条明路!
但是遇到的问题是如果这个网站需要登录并且还是带有验证码功能的,请问如何实现采集功能?
之前自己也曾写过模拟登录,但登录之后只能访问一次页面,如果要再次访问下一个链接的话又要重新登录,这样好麻烦,有没有更好的方法呢?
比如说实现一次登录之后就可以一直采集网站中的内容了!
在此请高手指一条明路!
作者: fltn03 发布时间: 2011-09-08
登陆cookie存储至自定义目录
$cookie_dir = tempnam('.', 'cookie');
curl_setopt($curl, CURLOPT_COOKIEJAR, $cookie_dir);
二次采集时调用
curl_setopt($curl, CURLOPT_COOKIEFILE, $cookie_dir);//读取cookie文件
详情请咨询手册

作者: xxfs91 发布时间: 2011-09-08
不会,同求
作者: fireye 发布时间: 2011-09-08
登陆cookie存储至自定义目录
$cookie_dir = tempnam('.', 'cookie');
curl_setopt($curl, CURLOPT_COOKIEJ ...
xxfs91 发表于 2011-9-8 11:01
$cookie_dir = tempnam('.', 'cookie');
curl_setopt($curl, CURLOPT_COOKIEJ ...
xxfs91 发表于 2011-9-8 11:01
好的.我试试.这会正在学习curl方法呢.
作者: fltn03 发布时间: 2011-09-08
回复 fltn03

作者: xxfs91 发布时间: 2011-09-08
回复 fltn03
好像win下要tempnam('./','cookie')...留意下
好像win下要tempnam('./','cookie')...留意下
作者: xxfs91 发布时间: 2011-09-08
热门阅读
-
office 2019专业增强版最新2021版激活秘钥/序列号/激活码推荐 附激活工具
阅读:74
-
如何安装mysql8.0
阅读:31
-
Word快速设置标题样式步骤详解
阅读:28
-
20+道必知必会的Vue面试题(附答案解析)
阅读:37
-
HTML如何制作表单
阅读:22
-
百词斩可以改天数吗?当然可以,4个步骤轻松修改天数!
阅读:31
-
ET文件格式和XLS格式文件之间如何转化?
阅读:24
-
react和vue的区别及优缺点是什么
阅读:121
-
支付宝人脸识别如何关闭?
阅读:21
-
腾讯微云怎么修改照片或视频备份路径?
阅读:28