+ -
当前位置:首页 → 问答吧 → 为什么访问这个网页获取不到真正的html?

为什么访问这个网页获取不到真正的html?

时间:2011-08-23

来源:互联网

我写程序(用VC,CInternetSession)获取某网页的html,发现获取到的html不是该页的真正html。这个页是我做的,放到我购买的空间里,地址是:
  http://www.gdutvrlab.net/webcmd/orderpage.htm

当取我上面的orderpage.htm时,得不到他的真正html,而是这行东西:
<frameset><frame src='http://gdutvrlabnet.h216.000pc.net:80/webcmd/orderpage.htm'></frame></frameset>

我的页面被包到框架里了,真正的html当然就取不到了。真正的html应该是这个:
<html>
<head>
<meta http-equiv="Content-Language" content="zh-cn">
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<meta name="GENERATOR" content="Microsoft FrontPage 6.0">
<meta name="ProgId" content="FrontPage.Editor.Document">
<title>New Page 1</title>
</head>
<body>
<p>订单:30104</p>
<p>货物:P280T</p>
<p>件数:15</p>
<p>单价:10.00</p>
<p>总价:150</p>
<p>注:</p>  
</body>
</html>

我的程序代码应该是没问题的,如果用它来获取一般网站,如百度www.baidu.com的html,没有问题的。实际上现在不用我的程序,而用IE去访问上面的地址,然后“查看源文件”,也是得到上面的被框架包住的代码。所以代码我就不发上来了。我的程序就是要取页面的真正的html,用来进行数据提取和分析。现在取不到html,我的程序就要失败了。

我也在想是不是网页的服务器有什么问题做了什么设置?可是很奇怪,几天前我在广州用这个程序的时候是好的,能取到真的html,现在办事来到了贵阳,发现就不行了。难道跟地域还有关系?或者跟运营商有关系?我在广州用的是中国电信,在贵阳用的是联通。不过我带了一个电信的无线上网卡来贵阳,用它也不行。

顺便说一句,我购买的空间是“单线”的,就是说主要支持电信网络,联通网通铁通去访问它就会很慢。

哪位大侠知道为什么取不到真正html的原因?

作者: bababian   发布时间: 2011-08-23

我觉得你应该问问你的空间商。

作者: ddcatlee   发布时间: 2011-08-23

热门下载

更多