+ -
当前位置:首页 → 问答吧 → 由小偷程序演变过来的简单采集程序(源文件)

由小偷程序演变过来的简单采集程序(源文件)

时间:2008-09-22

来源:互联网

希望对大家学习有所帮助吧

这个程序是采集彩票网站的内容

开始是想慢慢复制的,想想好慢,好麻烦!!不如写一个采集吧

其实采集就是小偷+保存到数据库 没什么难的!!!

大家下源文件研究吧!!!! 希望各位都中个500万哈~

写的不是很完善
附件: 简单的采集程序.rar (12 K) 下载次数:134

作者: 诚信科技   发布时间: 2008-09-22

忘记告诉大家
数据库是ACCESS的!!!

作者: 诚信科技   发布时间: 2008-09-22

谢谢了

作者: whl1295a   发布时间: 2008-09-22

顶你了~

作者: haowubai   发布时间: 2008-09-22

我感觉这个教程讲的非常不错,是我见过的php视频教程里最好的一个

作者: stm2982   发布时间: 2008-09-28

不错!~

作者: 笨男孩   发布时间: 2008-09-29

谢谢楼主,最近正在砍验证码。
过两天在砍正则表达式,收藏先!

作者: symbolamb   发布时间: 2008-09-29

数据库是什么无所谓啦,反正看的是采集原理,我用正则截取的。。。

作者: sjqzone   发布时间: 2008-10-03

<?php
switch($_GET['Action']){
case "go":
$conn = new com("adodb.connection");  //创建COM对象
$filename = realpath("data.mdb");  //文件物理路径
$conn->open("driver=microsoft access driver (*.mdb);dbq=".$filename.""); //连接数据库文件

for($i=$_POST['start'];$i<=$_POST['stop'];$i++){
$n = sprintf('%03d',$i);
$url = "http://www.ccflcp.com/kjgg/b001/2008/2008".$n."b001.htm"; //目标页面
$fcontents = file_get_contents($url);
eregi("快乐星期天(.*)等级", $fcontents, $regs);
eregi("<td colspan=2 class=xl20>(.*)<td class=xl22>00</td>", $regs[1], $regss);
$reg = str_replace("</td>","",$regss[1]);
$reg = str_replace("<td class=xl20>","",$reg);
$reg = str_replace(chr(32).chr(32),chr(32),$reg);
$reg = str_replace(chr(10),"",$reg);
$reg = explode(chr(32),$reg);
$conn->execute("insert into 双色球 (Period,NO_1,NO_2,NO_3,NO_4,NO_5,NO_6,NO_7) values('$n','$reg[0]','$reg[1]','$reg[2]','$reg[3]','$reg[4]','$reg[5]','$reg[6]')");  //执行SQL语句

}
echo "采集完毕!";
break;
default:
?><title>福利彩票-双色球采集系统</title>

<form id="form1" name="form1" method="post" action="?Action=go">
  <label>
  开始期号:
  <input name="start" type="text" id="start" size="5" />
  </label>
  <br />
  结束期号:
  <input name="stop" type="text" id="stop" size="5" />
  <br />
  <input name="go" type="submit" id="go" value="采集" />
</form>
<?php
}
?>
你采集的是连号的,我采集的是从地址列表筛选过来的有点麻烦呀

作者: sjqzone   发布时间: 2008-10-03

PHP+ACCESS好牛.....

作者: aimy   发布时间: 2008-10-07

能不能出个视频教程呢

作者: xtaydwxf   发布时间: 2009-03-28

找得十分辛苦!谢谢

作者: sisterbar   发布时间: 2009-05-24

谢谢楼主

作者: zhangcanbiao   发布时间: 2009-05-31

dddddddddddddddd

作者: zangyin   发布时间: 2009-08-17

收藏先!

作者: fengrui   发布时间: 2009-08-18

  

作者: alex77520   发布时间: 2009-08-19

我靠,这数据库还发上来

作者: waterb   发布时间: 2009-11-07

很好啊

作者: liuriqi   发布时间: 2009-11-09

学习

作者: hs8922589   发布时间: 2009-11-29

学习还不行吗

作者: hs8922589   发布时间: 2009-11-29

晕,好贵,没钱呀

作者: will   发布时间: 2009-12-06

作者: ygxs88   发布时间: 2009-12-07

作者: ygxs88   发布时间: 2009-12-07

采集不是问题,就是要做分词和入库,要给他们做tag才是关键。

作者: liverxing   发布时间: 2009-12-07

忘记告诉大家
数据库是ACCESS的!!!

作者: 杨逍   发布时间: 2009-12-08

神奇的代码,

作者: heluotianzhe   发布时间: 2010-01-02

ccccccccccccccc

作者: kevin.young   发布时间: 2010-01-17

热门下载

更多