+ -
当前位置:首页 → 问答吧 → Perl Web::Scraper抓取中文网页的问题

Perl Web::Scraper抓取中文网页的问题

时间:2011-02-10

来源:互联网

抓取结果怎么输入?
  1. #!/usr/bin/perl -w
  2. use strict;
  3. use URI;
  4. use Web::Scraper;
  5. use Data::Dump qw(dump);

  6. my $uri = URI->new("http://www.163.com/index.html");
  7. my $fields= scraper {
  8.     process '/html/body/div[3]/div[3]/div/ul/li', 'key' => 'HTML';
  9. };

  10. my $result = $fields->scrape($uri);
  11. my %resulthash = dump($result);

  12. print dump($result);
复制代码
直接print $result;输出是
my %resulthash = dump($result);又提示Odd number of elements in hash assignment at

dump后,是一堆编码。。。

如何把结果一一传给标量?输入不是一堆编码?

谢谢了!

作者: gnubuntu   发布时间: 2011-02-10

{
  key => "About NetEase\x{3000}-\x{3000}\x{516C}\x{53F8}\x{7B80}\x{4ECB}\x{3000}-\x{3000}\x{8054}\x{7CFB}\x{65B9}\x{6CD5}\x{3000}-\x{3000}\x{62DB}\x{8058}\x{4FE1}\x{606F}\x{3000}-\x{3000}\x{5BA2}\x{6237}\x{670D}\x{52A1}\x{3000}-\x{3000}\x{76F8}\x{5173}\x{6CD5}\x{5F8B}\x{3000}-\x{3000}\x{7F51}\x{7EDC}\x{8425}\x{9500}\x{3000}-\x{3000}\x{7F51}\x{7AD9}\x{5730}\x{56FE}\x{3000}-\x{3000}\x{7528}\x{6237}\x{4F53}\x{9A8C}\x{63D0}\x{5347}\x{8BA1}\x{5212}",
}

作者: gnubuntu   发布时间: 2011-02-10

转译一下就是可视的字符了。

作者: 2gua   发布时间: 2011-02-10

回复 2gua


如何转义?那个key我如何单独取出来?

用xpath我有的页面取不到内容。。。

作者: gnubuntu   发布时间: 2011-02-10