+ -
当前位置:首页 → 问答吧 → perl的抓取中文网页结果都是乱码怎么解决?

perl的抓取中文网页结果都是乱码怎么解决?

时间:2010-12-05

来源:互联网

用geturl()抓取网页,结果中文部分全部是乱码。
看了页面源码charset=utf-8,是不是和这个有关系呢?

作者: jiantizi88   发布时间: 2010-12-05

有很多需要你自己检查的。以后遇到类似编码问题也一样。
1. 页面声明的编码正确吗?也就是说,页面本身确实是utf-8编码的吗?
2. 获取页面内容的方式是什么?获取的内容是原始字节序列,还是自动解码过的内容。
3. “乱码”真的是乱码吗?是获取的内容出错,还是你的查看方式不当?

作者: iambic   发布时间: 2010-12-05