为什么访问这个网页获取不到真正的html?
时间:2011-08-23
来源:互联网
我写程序(用VC,CInternetSession)获取某网页的html,发现获取到的html不是该页的真正html。这个页是我做的,放到我购买的空间里,地址是:
http://www.gdutvrlab.net/webcmd/orderpage.htm
当取我上面的orderpage.htm时,得不到他的真正html,而是这行东西:
<frameset><frame src='http://gdutvrlabnet.h216.000pc.net:80/webcmd/orderpage.htm'></frame></frameset>
我的页面被包到框架里了,真正的html当然就取不到了。真正的html应该是这个:
<html>
<head>
<meta http-equiv="Content-Language" content="zh-cn">
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<meta name="GENERATOR" content="Microsoft FrontPage 6.0">
<meta name="ProgId" content="FrontPage.Editor.Document">
<title>New Page 1</title>
</head>
<body>
<p>订单:30104</p>
<p>货物:P280T</p>
<p>件数:15</p>
<p>单价:10.00</p>
<p>总价:150</p>
<p>注:</p>
</body>
</html>
我的程序代码应该是没问题的,如果用它来获取一般网站,如百度www.baidu.com的html,没有问题的。实际上现在不用我的程序,而用IE去访问上面的地址,然后“查看源文件”,也是得到上面的被框架包住的代码。所以代码我就不发上来了。我的程序就是要取页面的真正的html,用来进行数据提取和分析。现在取不到html,我的程序就要失败了。
我也在想是不是网页的服务器有什么问题做了什么设置?可是很奇怪,几天前我在广州用这个程序的时候是好的,能取到真的html,现在办事来到了贵阳,发现就不行了。难道跟地域还有关系?或者跟运营商有关系?我在广州用的是中国电信,在贵阳用的是联通。不过我带了一个电信的无线上网卡来贵阳,用它也不行。
顺便说一句,我购买的空间是“单线”的,就是说主要支持电信网络,联通网通铁通去访问它就会很慢。
哪位大侠知道为什么取不到真正html的原因?
http://www.gdutvrlab.net/webcmd/orderpage.htm
当取我上面的orderpage.htm时,得不到他的真正html,而是这行东西:
<frameset><frame src='http://gdutvrlabnet.h216.000pc.net:80/webcmd/orderpage.htm'></frame></frameset>
我的页面被包到框架里了,真正的html当然就取不到了。真正的html应该是这个:
<html>
<head>
<meta http-equiv="Content-Language" content="zh-cn">
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<meta name="GENERATOR" content="Microsoft FrontPage 6.0">
<meta name="ProgId" content="FrontPage.Editor.Document">
<title>New Page 1</title>
</head>
<body>
<p>订单:30104</p>
<p>货物:P280T</p>
<p>件数:15</p>
<p>单价:10.00</p>
<p>总价:150</p>
<p>注:</p>
</body>
</html>
我的程序代码应该是没问题的,如果用它来获取一般网站,如百度www.baidu.com的html,没有问题的。实际上现在不用我的程序,而用IE去访问上面的地址,然后“查看源文件”,也是得到上面的被框架包住的代码。所以代码我就不发上来了。我的程序就是要取页面的真正的html,用来进行数据提取和分析。现在取不到html,我的程序就要失败了。
我也在想是不是网页的服务器有什么问题做了什么设置?可是很奇怪,几天前我在广州用这个程序的时候是好的,能取到真的html,现在办事来到了贵阳,发现就不行了。难道跟地域还有关系?或者跟运营商有关系?我在广州用的是中国电信,在贵阳用的是联通。不过我带了一个电信的无线上网卡来贵阳,用它也不行。
顺便说一句,我购买的空间是“单线”的,就是说主要支持电信网络,联通网通铁通去访问它就会很慢。
哪位大侠知道为什么取不到真正html的原因?
作者: bababian 发布时间: 2011-08-23
我觉得你应该问问你的空间商。
作者: ddcatlee 发布时间: 2011-08-23
相关阅读 更多
热门阅读
-
office 2019专业增强版最新2021版激活秘钥/序列号/激活码推荐 附激活工具
阅读:74
-
如何安装mysql8.0
阅读:31
-
Word快速设置标题样式步骤详解
阅读:28
-
20+道必知必会的Vue面试题(附答案解析)
阅读:37
-
HTML如何制作表单
阅读:22
-
百词斩可以改天数吗?当然可以,4个步骤轻松修改天数!
阅读:31
-
ET文件格式和XLS格式文件之间如何转化?
阅读:24
-
react和vue的区别及优缺点是什么
阅读:121
-
支付宝人脸识别如何关闭?
阅读:21
-
腾讯微云怎么修改照片或视频备份路径?
阅读:28