你的位置: php爱好者 >> 首页 >> php进阶 >> 浏览文章

PHP读取某站点的链接的函数
日期:02-18 点击: 作者:本站整理 来源:未知 字号选择:
原理:读取某站点的源文件,再利用正则分析其源代码,得到所有链接
<? 
/**********qiushuiwuhen(2002-5-20)***********/ 
if(empty($url))$url "http://www.csdn.net/expert/";//设置url 
$site=substr($url,0,strpos($url,"/",8));//站点 
$base=substr($url,0,strrpos($url,"/")+1);//文件所在目录 

$fp fopen($url"r" );//打开url 
while(!feof($fp))$contents.=fread($fp,1024);// 

$pattern="|href=['"]?([^ '"]+)['" ]|U"
preg_match_all($pattern,$contents$regArrPREG_SET_ORDER);//匹配所有href= 
for($i=0;$i<count($regArr);$i++){//遍历所有匹配 
if(!eregi("://",$regArr[$i][1]))//是否是相对路径,即是否还有:// 
if(substr($regArr[$i][1],0,1)=="/")//是否是站点的根目录 
echo "link".($i+1).":".$site.$regArr[$i][1]."<br/>";//根目录 
else 
echo 
"link".($i+1).":".$base.$regArr[$i][1]."<br/>";//当前目录 
else 
echo 
"link".($i+1).":".$regArr[$i][1]."<br/>";//相对路径 

fclose($fp); 
?> 
php爱好者站 http://www.phpfans.net 文章|教程|下载|源码|论坛.

↑返回顶部  打印本页  关闭窗口↓