+ -
当前位置:首页 → 问答吧 → Python scrapy 在抓取页面url链接时,如何获取死链接 或者重定向链接 的url

Python scrapy 在抓取页面url链接时,如何获取死链接 或者重定向链接 的url

时间:2011-11-30

来源:互联网

本人用scrapy框架,基本上可以抓取指定网站,但是由于要做分类分析,需要得到页面上出现死链接的url如何解决。麻烦大虾帮忙。

作者: sqi007   发布时间: 2011-11-30

死链接可以通过检查scrapy.http.Response的一个属性status(正常为200,常见异常为404).

关于重定向,不知这个http://groups.google.com/group/scrapy-users/browse_thread/thread/99c77d798e47db4d是否有用.

作者: panghuhu250   发布时间: 2011-11-30