首页手机软件手机游戏单机游戏资讯文章专题下载游戏合集文章合集 php下载 php教程电脑软件

+ -

当前位置：首页 → 问答吧 → CkSpider抓取的页面不包含 exe,jpg,pdf等等结尾的页面，求解决

CkSpider抓取的页面不包含 exe,jpg,pdf等等结尾的页面，求解决

时间：2011-04-21

来源：互联网

Python code

import chilkat

def spider_main(url):
        spider = chilkat.CkSpider()
        spider.put_ConnectTimeout(2)
        spider.put_ReadTimeout(3)
        spider.Initialize(url)
        #  Add the 1st URL:
        spider.AddUnspidered("http://"+url)
        for i in range(0,1000):
                success = spider.CrawlNext()
                if (success == True):
                        aa=spider.lastUrl()
                        print aa
                        i = i + 1
                else:
                        if (spider.get_NumUnspidered() == 0):
                                print "No more URLs to spider"
                                break
                        else:
                                print spider.lastErrorText()
        print i

if __name__=="__main__":
        spider_main('www.yxlink.com')
        raw_input()

为什么爬不到exe后缀名，jpg后缀名的页面呢？求解释

作者: vivre_1 发布时间: 2011-04-21

爬图片做什么？图片里又没有可以抓取的文字信息。

作者: iambic 发布时间: 2011-04-21

需要一个网站所有的链接。包括jpg，exe，pdf等等等。各种类型的

作者: vivre_1 发布时间: 2011-04-21

引用 1 楼 iambic 的回复:

爬图片做什么？图片里又没有可以抓取的文字信息。

beautifulsoup中对于格式不规范的或者我a标签写错的不能解析会报'herf'错误。试过了。

作者: vivre_1 发布时间: 2011-04-21

相关阅读更多

微信文件传输助手网页版在哪找-微信传输助手网页版使用教程详解

时间：2025-12-14
俄罗斯搜索引擎Yandex官网直达-Yandex俄罗斯搜索引擎国际版免登录直达入口

时间：2025-12-14
网页版抖音登录入口-抖音电脑版官方网页免费登录教程

时间：2025-12-14
poki游戏官网正版入口-poki游戏官方正版安全无忧通道

时间：2025-12-14
无付费韩漫画入口永久免费热榜更新-无付费韩漫入口永久免费热更推荐

时间：2025-12-14

热门阅读

office 2019专业增强版最新2021版激活秘钥/序列号/激活码推荐附激活工具
阅读：74
如何安装mysql8.0
阅读：31
Word快速设置标题样式步骤详解
阅读：28
20+道必知必会的Vue面试题（附答案解析）
阅读：37
HTML如何制作表单
阅读：22
百词斩可以改天数吗？当然可以，4个步骤轻松修改天数！
阅读：31
ET文件格式和XLS格式文件之间如何转化？
阅读：24
react和vue的区别及优缺点是什么
阅读：121
支付宝人脸识别如何关闭?
阅读：21
腾讯微云怎么修改照片或视频备份路径?
阅读：28

热门下载

更多

团队枪战中文版
飞行射击 360.29MB

下载
团队枪战内置MOD菜单
飞行射击 360.29MB

下载
欢乐消除开心假日小游戏
休闲益智 990.49MB

下载
方块消消消最新版
休闲益智 51.32MB

下载
豆腐女孩微信小程序
休闲益智 84.52MB

下载
像素公路狂飙车辆全解锁
赛车竞速 53.88MB

下载
警车驾驶模拟器无限金币版
赛车竞速 97.08MB

下载
胡了三国内购
棋牌卡牌 64.43MB

下载
蒸汽传说时之旅手游
棋牌卡牌 345.08MB

下载
萌仙记
角色扮演 3.13MB

下载