+ -
当前位置:首页 → 问答吧 → 求模拟登陆得到页面源文件后字符串的提取,谢谢

求模拟登陆得到页面源文件后字符串的提取,谢谢

时间:2011-09-07

来源:互联网

啊啊

作者: maoyu1221   发布时间: 2011-09-07

模拟登陆后获得了页面源文件,要提取其中的数据,等下我把要提取的html发上来,请大家帮帮忙,谢谢

作者: maoyu1221   发布时间: 2011-09-07

<tr bgcolor="#dbdbdb">
<td height="30" align="right" class="black12">
系统注册号:
</td>
<td height="30" align="left">
&nbsp;&nbsp;
111111111
</td>
<td height="30" align="right" class="black12">
企业状态:
</td>
<td height="30" align="left">
&nbsp;&nbsp;

<span style="color:red">已激活</span>
</td>
</tr>
<tr>
<td height="30" align="right" width="14%">
企业名称:
</td>
<td height="30" align="left">
&nbsp;&nbsp;
公司公司公司公司
</td>
<td height="30" align="right" width="15%" class="black12">
注册时间<br>
<span style="color:red">(企业成立时间)</span>
</td>
<td height="30" align="left" width="26%">
&nbsp;&nbsp;
2111-12-20
</td>
</tr>
<tr bgcolor="#dbdbdb">
<td height="30" align="right" class="black12">
是否:
</td>
<td height="30" align="left">
&nbsp;&nbsp;


</td>
<td height="30" align="right" class="black12">
上年度:
</td>
<td height="30" align="left">
&nbsp;&nbsp;

</td>
</tr>
<tr>
<td height="30" align="right" class="black12">
主营产品(服务)
<br />
所属技术领域:
</td>
<td height="30" align="left">
&nbsp;&nbsp;
新技术
</td>
<td height="30" align="right" class="black12">
注册类型:
</td>
<td height="30" align="left">
&nbsp;&nbsp;
无法分类
</td>
</tr>
<tr bgcolor="#dbdbdb">
<td height="30" align="right" class="black12">
法人代码:
</td>
<td height="30" align="left">
&nbsp;&nbsp;
111111111
</td>
<td height="30" align="right" class="black12">
税务登记号:
</td>
<td height="30" align="left">
&nbsp;&nbsp;
22222222222
</td>
</tr>

作者: maoyu1221   发布时间: 2011-09-07

然后我就要提取信息
  如
  系统注册号:111111111
  企业状态:已激活
  企业名称:公司公司公司公司

感觉没有名字,id,不知道怎么对应提取

作者: maoyu1221   发布时间: 2011-09-07

你找一下采集方面的资料

作者: wangsdong   发布时间: 2011-09-07

引用 4 楼 wangsdong 的回复:
你找一下采集方面的资料


能具体点么,谢谢

作者: maoyu1221   发布时间: 2011-09-07