首页手机软件手机游戏单机游戏资讯文章专题下载游戏合集文章合集 php下载 php教程电脑软件

+ -

当前位置：首页 → 问答吧 → python 编码问题伤透心了

python 编码问题伤透心了

时间：2011-06-23

来源：互联网

关于搜狐的问题：

从搜狐页面上抓取源码，取到标题，建立目录，出错WindowsError: [Error 267] : '/chen/\xcc\xc0\xc4\xb7\xca\xe5\xca\xe5\xb5\xc4\xd0\xa1\xce\xdd:\xd2\xbb\xb2\xbf\xd2\xfd\xb7\xa2\xc4\xcf\xb1\xb1\x
d5\xbd\xd5\xf9\xc8\xb4\xbe\xc8\xc1\xcb\xc3\xc0\xb9\xfa\xba\xcd\xc8\xab\xca\xc0\xbd\xe7\xb5\xc4\xca\xe9/'

代码如下：
u = urllib2.urlopen(url)
html = u.read()
u.close()

for b in re.findall(r'<h1>(.*?)</h1>',html ):
d += b

folderName = '/chen/' + d + '/'
if not os.path.exists(folderName):
os.makedirs(folderName)

我尝试在html = u.read()之后，用各种编码解码编码，html = html .decode('gb18030').encode('UTF-8') 均无效
但print出来是汉字，请哥哥们帮忙看看怎么解决，谢谢了

作者: chenhf8809 发布时间: 2011-06-23

和编码问题没关系。Windows目录名不能包含冒号。你自己要把目录名做下处理，把非法字符（自己搜索下哪些字是非法的）都删掉或者转义掉。

作者: iambic 发布时间: 2011-06-23

其实你自己也可以想下。目录名是不是乱码和能否创建有必然的联系吗？

作者: iambic 发布时间: 2011-06-23

相关阅读更多

欧亿交易所交易所App手机版官网.官网下载地址.cc

时间：2025-12-16
Binance交易所app下载_binance交易所app手机安装包下载

时间：2025-12-16
币安交易所Binance官网_最新官方入口地址

时间：2025-12-16
比特币突破10.7W价格新高，现在还适合比特币投资吗？

时间：2025-12-16
bi安下载官方入口地址_比安下载详细教学(新用户必看安装步骤)

时间：2025-12-16

热门阅读

office 2019专业增强版最新2021版激活秘钥/序列号/激活码推荐附激活工具
阅读：74
如何安装mysql8.0
阅读：31
Word快速设置标题样式步骤详解
阅读：28
20+道必知必会的Vue面试题（附答案解析）
阅读：37
HTML如何制作表单
阅读：22
百词斩可以改天数吗？当然可以，4个步骤轻松修改天数！
阅读：31
ET文件格式和XLS格式文件之间如何转化？
阅读：24
react和vue的区别及优缺点是什么
阅读：121
支付宝人脸识别如何关闭?
阅读：21
腾讯微云怎么修改照片或视频备份路径?
阅读：28

热门下载

更多

奇妙梦幻城堡无限金币版
休闲益智 76.36MB

下载
宝宝巴士儿歌免费完整版
休闲益智 228.38MB

下载
强壮的奶奶
休闲益智 36MB

下载
苹果骑士2无敌版
冒险解谜 61.48MB

下载
最后的幸存者僵尸生存中文版
冒险解谜 152.32MB

下载
海龟蘑菇汤完整正式版
冒险解谜 156.92MB

下载
冒险者的rogue之旅最新版
冒险解谜 298.07MB

下载
冒险者的rogue之旅无尽模式
冒险解谜 298.07MB

下载
冒险者的rogue之旅内置菜单
冒险解谜 336.09MB

下载
四驱传说内置作弊菜单
赛车竞速 456.52MB

下载