+ -
当前位置:首页 → 问答吧 → python抓取google的页面信息出错

python抓取google的页面信息出错

时间:2011-06-30

来源:互联网

我的代码:
Python code
url="http://www.google.com.hk/#hl=zh-CN&source=hp&q=site:introcn.com&oq=site:introcn.com&aq=f&aqi=&aql=&gs_sm=e&gs_upl=1354l5480l0l16l12l0l0l0l0l0l0ll0&fp=e3acde8785a5e40&biw=1024&bih=592"
response=uq.urlopen(url)
page2=response.read()
page2=page2.decode("utf-8")
m2=re.findall(r"找到约\s[\d\,]*\s条结果",page2)


总是报decode那一行的错,去掉也不行,换成gbk也不行,
但同样的代码我抓取不百度的就可以,我郁闷了,
请高手解答一下。

作者: yybjroam05   发布时间: 2011-06-30

别抓google,小心被封IP。使用google api访问。

作者: iambic   发布时间: 2011-06-30