首页手机软件手机游戏单机游戏资讯文章专题下载游戏合集文章合集 php下载 php教程电脑软件

+ -

当前位置：首页 → 问答吧 → Perl Web::Scraper抓取中文网页的问题

Perl Web::Scraper抓取中文网页的问题

时间：2011-02-10

来源：互联网

抓取结果怎么输入？

#!/usr/bin/perl -w
use strict;
use URI;
use Web::Scraper;
use Data::Dump qw(dump);
my $uri = URI->new("http://www.163.com/index.html");
my $fields= scraper {
process '/html/body/div[3]/div[3]/div/ul/li', 'key' => 'HTML';
};
my $result = $fields->scrape($uri);
my %resulthash = dump($result);
print dump($result);

复制代码

直接print $result;输出是
my %resulthash = dump($result);又提示Odd number of elements in hash assignment at

dump后，是一堆编码。。。

如何把结果一一传给标量？输入不是一堆编码？

谢谢了！

作者: gnubuntu 发布时间: 2011-02-10

{
key => "About NetEase\x{3000}-\x{3000}\x{516C}\x{53F8}\x{7B80}\x{4ECB}\x{3000}-\x{3000}\x{8054}\x{7CFB}\x{65B9}\x{6CD5}\x{3000}-\x{3000}\x{62DB}\x{8058}\x{4FE1}\x{606F}\x{3000}-\x{3000}\x{5BA2}\x{6237}\x{670D}\x{52A1}\x{3000}-\x{3000}\x{76F8}\x{5173}\x{6CD5}\x{5F8B}\x{3000}-\x{3000}\x{7F51}\x{7EDC}\x{8425}\x{9500}\x{3000}-\x{3000}\x{7F51}\x{7AD9}\x{5730}\x{56FE}\x{3000}-\x{3000}\x{7528}\x{6237}\x{4F53}\x{9A8C}\x{63D0}\x{5347}\x{8BA1}\x{5212}",
}

作者: gnubuntu 发布时间: 2011-02-10

转译一下就是可视的字符了。

作者: 2gua 发布时间: 2011-02-10

回复 2gua

如何转义？那个key我如何单独取出来？

用xpath我有的页面取不到内容。。。

作者: gnubuntu 发布时间: 2011-02-10

相关阅读更多

樱花漫画官方入口-樱花漫画免费在线阅读入口

时间：2025-12-18
jk漫画禁漫天堂最新入口-jk漫画天堂神秘隐藏网站

时间：2025-12-18
jk漫画app禁漫天堂最新入口-jk漫画禁漫天堂官方入口

时间：2025-12-18
融合宽带是什么意思融合宽带和单宽带区别

时间：2025-12-18
光端机是什么设备光端机的工作原理及作用光端机的分类

时间：2025-12-18

热门阅读

office 2019专业增强版最新2021版激活秘钥/序列号/激活码推荐附激活工具
阅读：74
如何安装mysql8.0
阅读：31
Word快速设置标题样式步骤详解
阅读：28
20+道必知必会的Vue面试题（附答案解析）
阅读：37
HTML如何制作表单
阅读：22
百词斩可以改天数吗？当然可以，4个步骤轻松修改天数！
阅读：31
ET文件格式和XLS格式文件之间如何转化？
阅读：24
react和vue的区别及优缺点是什么
阅读：121
支付宝人脸识别如何关闭?
阅读：21
腾讯微云怎么修改照片或视频备份路径?
阅读：28

热门下载

更多

火柴人霓虹战士无限金币
体育竞技 63.05MB

下载
巴拉啦公主全身变最新版
休闲益智 65.88MB

下载
成语接龙学成语游戏
休闲益智 23.12MB

下载
表情包战争修改器版
休闲益智 68.24MB

下载
绮奇猫迷你假期游戏
休闲益智 146.97MB

下载
宝宝学蔬菜宝宝巴士
休闲益智 75.96MB

下载
巨像文明小游戏
策略塔防 150.7MB

下载
海战棋2内置作弊MOD
策略塔防 172.47MB

下载
恋恋驯龙记
策略塔防 1000.49MB

下载
五芒星战记修改器
策略塔防 189.9MB

下载