+ -
当前位置:首页 → 问答吧 → 求助:here scripts

求助:here scripts

时间:2008-03-10

来源:互联网

现有一个文本文件:
引用:
0o9i8u7y
0ok9ij
0plmnko9
1
1
1
11
111
1111
11111
111111
123
12321
123321
12345
12345
123456
123456
123456
123www
1qa2ws
1qa2ws3ed
1qaz2wsx
1qaz2wsx3edc
1qwe23
21
24021988
2wsx3edc
31337
31338
321
4321
54321
5tgb6yhn
5tgb6yhn#P
654321
7654321
7yhn
87654321
987654321
a
aa
aa
aaron
aaron
abc123
abcd
abcd
abcd1234
abcd1234
...
怎么样快速统计每个单词的出现次数,并从高到低排序呢?

这里,单词的意思是:每一行的非空字符总和为一个单词。。

作者: yaoms   发布时间: 2008-03-10

词?
sort?

作者: eexpress   发布时间: 2008-03-10

哈哈,有办法了,来自yingfei的
引用:
awk '{arr[$1]+=1 }END{for(i in arr){print arr[i]"\t"i}}' FILE_NAME | sort -rn

作者: yaoms   发布时间: 2008-03-10

再给一个简单点的方法:
sort -rn FILENAME |uniq -c |sort -rn

作者: wenshu   发布时间: 2008-03-10

wenshu 写道:
再给一个简单点的方法:
sort -rn FILENAME |uniq -c |sort -rn


谢谢,真是太好了,越来越简洁

作者: yaoms   发布时间: 2008-03-10

以为没用的事情。今天居然,分析数据,我也要用到了。

作者: eexpress   发布时间: 2008-03-12

呵呵。怎么会没用。。。

作者: yaoms   发布时间: 2008-03-12

如果这个文件有上亿级别的数据,找出前100个最多的,用脚本该怎样做呢?
跪求!!!

作者: lu86391   发布时间: 2011-05-08