首页手机软件手机游戏单机游戏资讯文章专题下载游戏合集文章合集 php下载 php教程电脑软件

+ -

当前位置：首页 → 问答吧 → 救命呀，perl求和及过滤难题

救命呀，perl求和及过滤难题

时间：2010-10-08

来源：互联网

各位大虾们，小弟跪求解决方法，因工作需要，需对文本文件中的数据进行累加求和及过滤，文本文件中的内容如下：
列1    列2
aaaa    3
bbbb    2
cccc    9
dddd    4
eeee 1
aaaa 4
aaaa 2
eeee 2
bbbb 2

小弟想要得到结果是：如果《列1》中有重复的数据，则去重，并且累加《列2》中值；如果累计后的《列2》值小于5，就把此列过滤掉。
结果：
列1    列2
aaaa    9
cccc    9

小弟在线等，还请大虾们多多指教~

作者: ontherd 发布时间: 2010-10-08

本帖最后由 longbow0 于 2010-10-08 15:53 编辑

my %data;
while (<FH>) {
my ($key, $val) = split /\s+/;
if (defined $data{$key}) {
$data{$key} += $val;
}
else {
$data{$key} = $val;
}
}
for my $key (sort keys(%data)) {
next if $data{$key} < 5;
print $key, "\t", $data{$key}, "\n";
}

复制代码

作者: longbow0 发布时间: 2010-10-08

本帖最后由珞水的大叔于 2010-10-08 15:35 编辑

试试这个

#!/usr/bin/perl
use strict;
use warnings;
my %result = ();
my $title;
while(<DATA>){
chomp;
if($. == 1){
$title = $_;
next;
}
my ($key,$value) = split /\s+/,$_;
$result{$key} += $value;
}
print $title,"\n";
for(sort keys %result){
print "$_ $result{$_}\n" if $result{$_} >= 5;
}
exit;
__DATA__
列1 列2
aaaa 3
bbbb 2
cccc 9
dddd 4
eeee 1
aaaa 4
aaaa 2
eeee 2
bbbb 2

复制代码

如果不管标题列，那么下面的更有趣：

#!/usr/bin/perl
use strict;
use warnings;
my %result = ();
grep { my ($key,$value) = split /\s+/,$_;$result{$key} += $value } <DATA>;
grep { print "$_ $result{$_}\n" if $result{$_} >= 5 }sort keys %result;
exit;
__DATA__
aaaa 3
bbbb 2
cccc 9
dddd 4
eeee 1
aaaa 4
aaaa 2
eeee 2
bbbb 2

复制代码

作者: 珞水的大叔发布时间: 2010-10-08

回复珞水的大叔

小弟想咨询下：
$result{$key} += $value;
上面这句这么理解，还请您给些文字性描述。

作者: ontherd 发布时间: 2010-10-08

回复 longbow0

非常谢谢您，

作者: ontherd 发布时间: 2010-10-08

本帖最后由珞水的大叔于 2010-10-08 16:02 编辑

回复 ontherd

$result{$key} = $result{$key} + $value;

不会你没有用过hash吧……

作者: 珞水的大叔发布时间: 2010-10-08

回复珞水的大叔

呵呵~~~，说来惭愧。经过你的讲解，现在已经理解了。

小弟，还有个问题想问您下：
在Linux下，我刚才试了您写的perl program来处理500万条数据，CPU就上升到90%左右，难道perl不能处理大批量的数据吗？？？

作者: ontherd 发布时间: 2010-10-08

难道为了处理得快一点，CPU占用率高一点是过错吗？

作者: wxlfh 发布时间: 2010-10-08

回复 ontherd

你不会是吧500万的数据贴到了脚本里面的__DATA__之后了吧……

作者: 珞水的大叔发布时间: 2010-10-08

，主要是在现网服务器上运行，我们有监控，cpu高于80%就报警。

作者: ontherd 发布时间: 2010-10-08

，主要是在现网服务器上运行，我们有监控，cpu高于80%就报警。

作者: ontherd 发布时间: 2010-10-08

，主要是在现网服务器上运行，我们有监控，cpu高于80%就报警。

作者: ontherd 发布时间: 2010-10-08

回复珞水的大叔

我在里面加了一行代码：
if (! open DATA,"<","文本文件.txt"

{
die "cannot open datafile

!";
}

不知道是不是您说的把数据都加到了____DATA____ 里了。

作者: ontherd 发布时间: 2010-10-08

回复 ontherd

哦，不用放到脚本里
至于为什么占用cpu这么多我也没有遇到过……
请达人们help解答一下

作者: 珞水的大叔发布时间: 2010-10-08

相关阅读更多

比特币行情软件哪个最权威？八款比特币投资软件排名推荐

时间：2025-12-15
幣安交易所最新下载地址_附带Binance使用教程(注册、下载)

时间：2025-12-15
欧易okx最新可访问入口如何获取？官网备用链接详细步骤

时间：2025-12-15
ALGO币未来走势预测(2025-2030)：ALGO币潜力如何？是否值得长期持有？

时间：2025-12-15
USDT是什么货币？本文带你了解USDT泰达币

时间：2025-12-15

热门阅读

office 2019专业增强版最新2021版激活秘钥/序列号/激活码推荐附激活工具
阅读：74
如何安装mysql8.0
阅读：31
Word快速设置标题样式步骤详解
阅读：28
20+道必知必会的Vue面试题（附答案解析）
阅读：37
HTML如何制作表单
阅读：22
百词斩可以改天数吗？当然可以，4个步骤轻松修改天数！
阅读：31
ET文件格式和XLS格式文件之间如何转化？
阅读：24
react和vue的区别及优缺点是什么
阅读：121
支付宝人脸识别如何关闭?
阅读：21
腾讯微云怎么修改照片或视频备份路径?
阅读：28

热门下载

更多

跨维度自动售货机无限金币
模拟经营 278.82MB

下载
核日之后无限货币
冒险解谜 266.71MB

下载
地牢狗无限金币钻石版
冒险解谜 144.74MB

下载
奇妙星际宇航员安卓版
休闲益智 92.16MB

下载
奇妙农场体验
休闲益智 157.02MB

下载
奇妙农场体验全解锁版(内置功能菜单)
休闲益智 157.02MB

下载
僵尸人入侵手游
休闲益智 70.8MB

下载
手画摩托车手机版
休闲益智 32.27MB

下载
进击的方块君游戏
休闲益智 43.11MB

下载
我的虚拟世界手机版
休闲益智 82.1MB

下载