+ -
当前位置:首页 → 问答吧 → HTMLParser出现莫名其妙的错误

HTMLParser出现莫名其妙的错误

时间:2011-08-04

来源:互联网

需要用python对网页进行解析,有HTMLParser可用,于是去http://docs.python.org/library/htmlparser.html
在页面最下面有示例,由于我用的PYTHON3,所以,修改如下:
Python code
class mp(HTMLParser):
    def handle_starttag(self,tag,attrs):
        print("begin of %s,%s"%(tag,self.get_starttag_text()))
    def handle_endtag(self,tag):
        print("End of %s,[%s]"%(tag,self.getpos()))


调用如下:
Python code
mmp=mp(HTMLParser)
cont="<html>ksljfk...这里的内容非常非常长,大约68K...</html>"

可是运行的时候发现,解析器解析到网页中间的时候就停止了,也不报错,这是怎么回事,难道传说中的BUG,网页的规范性也校验过了啊,怪,请高手指教……

作者: winterlight09   发布时间: 2011-08-04

贴个能完整重现问题的例子。

作者: iambic   发布时间: 2011-08-04