+ -
当前位置:首页 → 问答吧 → 连接服务器次数问题 python 新手提问

连接服务器次数问题 python 新手提问

时间:2010-11-04

来源:互联网

 
import os,sys,datetime
import httplib,urllib,re
from sgmllib import SGMLParser
import types
import time
class Html2txt(SGMLParser):
def reset(self):
self.text=''
self.inbody=True
SGMLParser.reset(self)
def handle_data(self,text):
if self.inbody:
self.text+=text
def start_head(self,text):
self.inbody=False
def end_head(self):
self.inbody=True


parser=Html2txt()

for i in range(1,8000):
  parser.feed(urllib.urlopen("http://baike.baidu.com/view/%s.html"%i).read())
  parser.close()
  #print parser.text.strip()
  f=open('百度百科1.txt','w')
  f.write(parser.text.strip())
  for i in ('900','1800','2700',3600',4500','5400','6300','7200'):
   
  time.sleep(40) 
  f.close()
我 设置睡眠了啊 为什么程序运行一段时间后说Http协议错误啊

作者: scrapyshendamrwang   发布时间: 2010-11-04

应该是超时了吧,保留一下cookie看看

作者: majianwei86   发布时间: 2010-11-04