
python爬取138看书网小说源码
- 类型:php下载
-
评分:
- 版本:v2.9
- 语言:简体中文
- 大小: 1KB
- 更新:2022-11-05
- python爬取138看书网小说源码由论坛用户制作并分享,适用于138小说网,能够帮助用户爬取网站获取小说资源,软件提供分类搜索查找的功能,支持目录爬取,还附带书签功能,用户使用这款软件能够更加轻松地看小说,非常实用。
内容介绍
python爬取138看书网小说源码由论坛用户制作并分享,适用于138小说网,能够帮助用户爬取网站获取小说资源,软件提供分类搜索查找的功能,支持目录爬取,还附带书签功能,用户使用这款软件能够更加轻松地看小说,非常实用。
软件说明
记录一下今天爬的第二个小说网,第二次弄起来比较熟练了,不像第一次弄一半就得找教程边看边搞。
但实际上爬小说应该是最简单的事情了吧,涉及的技术也没有那么深。
把代码发出来让想刚入门却不知道从何下手的同萌新们看看吧,看教程总是云里雾里的,还是还得上手多练练才能加深印象。
这个小说爬虫还是有点垃圾,多线程没有,而且有些函数也是用的跟*一样,这玩意该怎么改进也没有头绪。
演示一览
import requests
import lxml
import re
headers = {
'user-agent': 'User-AgentMozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'
}
print ('本脚本仅适用于138看书网:https://www.13800100.com/')
#url_list = 'https://www.13800100.com/list/72262/'
url_list = (input('粘贴小说目录url,必须是小说目录,小说首页不支持'))
downurl = 'https://www.13800100.com/article/'
url_list = requests.get(url_list)
text_list = url_list.text
#爬小说书名
text_title = re.findall(r'
(.*?)',text_list,re.S)[0]应用截图
最新文章
更多- 如何快速修改浏览器主页 简单三步设置个性化主页教程 2025-08-24
- 如何快速准确地验证MD5值 完整步骤与工具推荐 2025-08-24
- 修复LSP的最佳方法:快速解决语言服务协议问题的详细教程 2025-08-24
- 如何快速修改IP地址?简单三步轻松搞定网络设置 2025-08-24
- 如何彻底卸载搜狗浏览器 电脑快速清理卸载残留教程 2025-08-24
- IE浏览器崩溃修复指南:快速解决常见问题的6种有效方法 2025-08-24
最新更新
- 1 炫彩文本转换器
- 2 小鸟会议
- 3 自动操作魔法师增强版
- 4 佳易王酒水寄存管理系统
- 5 自动操作魔法师
- 6 ShowCockpit
- 7 兴达快递单打印软件加密狗版
- 8 蜗牛CRM客户管理系统
- 9 万商联小票打印模板编辑器
- 10 方正飞腾创艺