+ -
当前位置:首页 → 问答吧 → Python读取网页内容显示问题

Python读取网页内容显示问题

时间:2011-07-31

来源:互联网

我想读取土豆网站的一个页面地址,比如http://www.tudou.com/programs/view/kS03BynGs8Q
但是
Python code
>>> req = urllib2.Request('http://www.tudou.com/programs/view/kS03BynGs8Q')
>>> req.add_header('User-Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:5.0)')
>>> page = urllib2.urlopen(req)
>>> data = page.read()
>>> print data
ヒ
>>> print len(data)
7202


为何打印不出网页html内容呢,而且长度却是7202呢

作者: yexin218   发布时间: 2011-07-31

可以啊,输出不就是一个html文件嘛

作者: Waistcoat22   发布时间: 2011-07-31

print len(data)
输出结果:31854

作者: Waistcoat22   发布时间: 2011-07-31