+ -
当前位置:首页 → 问答吧 → python的中文编码问题

python的中文编码问题

时间:2011-09-17

来源:互联网

本人新手,刚写了个网页爬虫,但获取到的的中文是乱码,请问如何解决。
[code=Python][/code]
# -*- coding: UTF-8 -*- 

import urllib 



def getWebPageContent(url): 

f = urllib.urlopen(url) 

data = f.read() 

f.close() 


return data 



url = 'http://douban.com' 

content = getWebPageContent(url) 

print content

作者: JESSE_MC   发布时间: 2011-09-17

print content.decode('utf-8')

作者: iambic   发布时间: 2011-09-17

你的python版本多少,
我这里你的代码中文显示正常(python2.7)

或者你换# -*- coding: UTF-8 -*-  

# -*- coding: cp936 -*-试试

作者: CCDDR   发布时间: 2011-09-17

加上:

import sys

type = sys.getfilesystemencoding()
print content.decode('utf-8').encode(type)

作者: fsldn   发布时间: 2011-09-17