数据采集问题:数据在JS中
时间:2010-09-11
来源:互联网
看了张老师的视频后,我试着去新浪一个新闻页想要采集一下,地址:tech.sina.com.cn/top/day_hotnews.shtml
我按照张老师的程序试着写了正则,输出数组发现都为空,查看源代码,才发现源代码中并没有这些信息的链接,
在显示数据的地方,只有一个这样的JS脚本:
<script>
function showContent(data_arr){
var html= '';
data = data_arr['data']
for(var i in data){
html+='<tr>';
html+='<td>'+(parseInt(i)+1)+'</td><td class="ConsTi"><a href="'+data.url+'" target="_blank">'+data.title+'</a></td>';
html+='<td>'+data.top_num+'</td>';
html+='<td>'+data.create_date+'</td>'
html+='<td><a href="'+data.comment_url+'" target="_blank">发表评论</a></td>'
html += '</tr>';
}
html+='</table></div>';
document.write(html);
}
</script>
也就是说,数据都是JS动态显示的,这可难住我了,求救各位大哥哥大姐姐,有什么解决思路,十分感谢
我按照张老师的程序试着写了正则,输出数组发现都为空,查看源代码,才发现源代码中并没有这些信息的链接,
在显示数据的地方,只有一个这样的JS脚本:
<script>
function showContent(data_arr){
var html= '';
data = data_arr['data']
for(var i in data){
html+='<tr>';
html+='<td>'+(parseInt(i)+1)+'</td><td class="ConsTi"><a href="'+data.url+'" target="_blank">'+data.title+'</a></td>';
html+='<td>'+data.top_num+'</td>';
html+='<td>'+data.create_date+'</td>'
html+='<td><a href="'+data.comment_url+'" target="_blank">发表评论</a></td>'
html += '</tr>';
}
html+='</table></div>';
document.write(html);
}
</script>
也就是说,数据都是JS动态显示的,这可难住我了,求救各位大哥哥大姐姐,有什么解决思路,十分感谢
作者: php100sort 发布时间: 2010-09-11
十分抱歉,请版主删掉我的一个帖子,我不知道已经提交了,结果就提交了两个一模一样的帖子
作者: php100sort 发布时间: 2010-09-11
它每个showContent前都有一个
其中的src是一个产生json的php文件,例如里面有一段数据如下:
可以通过使用这个php文件生成的json来获取其中的新闻连接和内容~不妨试试吧~
复制代码
|
其中的src是一个产生json的php文件,例如里面有一段数据如下:
复制代码
|
可以通过使用这个php文件生成的json来获取其中的新闻连接和内容~不妨试试吧~
作者: anjingyu_ws 发布时间: 2010-09-11

作者: kuaiman1 发布时间: 2010-09-11
热门阅读
-
office 2019专业增强版最新2021版激活秘钥/序列号/激活码推荐 附激活工具
阅读:74
-
如何安装mysql8.0
阅读:31
-
Word快速设置标题样式步骤详解
阅读:28
-
20+道必知必会的Vue面试题(附答案解析)
阅读:37
-
HTML如何制作表单
阅读:22
-
百词斩可以改天数吗?当然可以,4个步骤轻松修改天数!
阅读:31
-
ET文件格式和XLS格式文件之间如何转化?
阅读:24
-
react和vue的区别及优缺点是什么
阅读:121
-
支付宝人脸识别如何关闭?
阅读:21
-
腾讯微云怎么修改照片或视频备份路径?
阅读:28