+ -
当前位置:首页 → 问答吧 → 大家好,请教大家一个查询内容统计次数的脚本

大家好,请教大家一个查询内容统计次数的脚本

时间:2011-07-22

来源:互联网

本帖最后由 xixizhihua 于 2011-07-22 22:24 编辑

大家好,用perl一段时间了,最近我需要统计一个文件中,某几种文字出现的次数。
比如,.*12tlvt\s
我原来都是先建立一个%lvt的散列,
然后用这个名称作为散列的Key,让value == 1
然后,每次 if (/.*12lvt/)
就把它做为Keys值,把散列%lvt的Keys都foreach一遍
如果遇到相同keys的,就把对应keys的value值 + 1
如果没有遇到相同keys,就把生成一个新的散列key

这样,最后输出来,就是各相关文字出现的次数了。
但是,这样的方法,每次都要搜索一遍散列名字,在查找大型文件的时候效率很低。(我查的一个文件有980M)
不知道大叫有什么新的高招,来有效率的实现这个应用,谢谢啦。

对啦,我同样的应用,也用TCL脚本写了。问题一样,不过TCL中管散列叫数组而已。
如果大家可以用TCL进行有效的解决,也欢迎指点哦。
这两种语言目前偶都用:)

作者: xixizhihua   发布时间: 2011-07-22



QUOTE:
就把它做为Keys值,把散列%lvt的Keys都foreach一遍
如果遇到相同keys的,就把对应keys的value值 + 1
如果没有遇到相同keys,就把生成一个新的散列key



直接 $lvt{$key} ++ 不就行了,管它在不在 %lvt 中。文件很大可以分割下

作者: zhlong8   发布时间: 2011-07-22

对啊,我怎么没想到,谢谢楼上的朋友啦。

作者: xixizhihua   发布时间: 2011-07-22