+ -
当前位置:首页 → 问答吧 → 用perl实现计算

用perl实现计算

时间:2011-02-20

来源:互联网

本帖最后由 susie_gan 于 2011-02-20 23:02 编辑

我有一个文件,行数达到上万行,格式如下(取文件的一部分说明)
711 4 8
892 3 6
956 2 5
10904 1 5
32210 5 12
38554 4 6
41362 0 1
56119 6 9
71326 2 6
71348 2 5
88300 8 10
90571 3 10
90606 2 6
90809 1 3
96770 7 10
97473 2 8
100847 1 7
100849 1 7
103319 4 7
105064 1 6
...
第一列是从小到大的数字,但是不连续,我想实现的操作是以300000为一个窗口,以10000为步长,如果第1列的数字落在对应范围内,就分别将落在对应范围内的第2列相加,第3列相加,例如上述例子得到的输出结果如下:
0-300000 59 137
10000-310000 50 118
20000-320000 49 113
30000-330000 49 113
40000-340000 40 95
50000-350000 40 94
60000-360000 34 85
70000-370000 34 85
80000-380000 30 74
90000-390000 22 64
100000-400000 7 27
有哪位高手可以帮忙解决下,谢谢啦

作者: susie_gan   发布时间: 2011-02-20

#!"D:\XAMPP\xampp\perl\bin\perl.exe" -w

use strict;

chdir 'D:\LuBaixun\01 Projects\05 SecondDevelopment\01 Perl\99 Study\temp';
open INPUT, '<', 'input.txt'
        or die "cannot open file!";
my @input_col1;
my %input_col2;
my %input_col3;
my $windows_size = 300000;
my $pace = 10000;
my @windows;

while(<INPUT>{
    chomp;
    my ($col1,$col2,$col3) = split / /,$_;
    push @input_col1, $col1;
    $input_col2{$col1} = $col2;
    $input_col3{$col1} = $col3;

}
close INPUT;

my $temp = 0;
while( ($input_col1[-1] - $temp + $pace) > 0 ){
    push @windows, $temp;
    $temp += $pace;
}

foreach my $lower (@windows){
    my $upper = $lower + $windows_size;
    my @cur_window = grep { $_ >= $lower && $_ <= $upper } @input_col1;
    my $sum_col2 = 0;
    my $sum_col3 = 0;
    foreach my $cur_value (@cur_window){
        $sum_col2 += $input_col2{$cur_value};
        $sum_col3 += $input_col3{$cur_value};
    }
    print "$lower - $upper: $sum_col2, $sum_col3\n";
}

作者: Brandon_Loh   发布时间: 2011-02-21