首页手机软件手机游戏单机游戏资讯文章专题下载游戏合集文章合集 php下载 php教程电脑软件

+ -

当前位置：首页 → 问答吧 → 对文本处理，shell，sed，awk和perl那个性能好呢

对文本处理，shell，sed，awk和perl那个性能好呢

时间：2011-05-17

来源：互联网

目前需要准实时的对文件进行处理，然后入库，因为数据库性能已经不堪重负，因此在入库前对数据进行文件级别的过滤。
整个控制流程采用perl，但是对文件进行过滤是最耗时的工作，因此想问一下大虾门，采用shell，sed，awk和perl哪种对文本处理的性能会强悍一点。
主要的过滤功能如下：
A文件是详单，B文件是维度，A文件根据B文件里面不存在的维度进行过滤。
如：
A文件:
A,DFSFD,FWFDG,DFSFDS
B,FDSFD,FSDFDS,FDSFER
C,FDSDRR,FDSDRG,DFDW
D,DRFSDR,FWRG,FDWRRD
B文件：
A
B
则过滤后，仅剩下：
A,DFSFD,FWFDG,DFSFDS
B,FDSFD,FSDFDS,FDSFER
请提供一下性能最优的核心代码，谢谢！；)

作者: fikong2005 发布时间: 2011-05-17

性能估计差不多，都是最简单的 RE 匹配

作者: zhlong8 发布时间: 2011-05-17

都不是底层的需求，我也认为性能会差不多，重要的是算法

作者: iamlimeng 发布时间: 2011-05-17

谢谢楼上2位，借问可否有比较佳的算法，呵呵。

作者: fikong2005 发布时间: 2011-05-17

你连个能跑的都还没写……
把 b 构建成 /^(?:A|B),/ 这样的 RE 和 A匹配下来过滤。如果真的 b 有那么简单你还可以用 c 来写个函数来扩展 Perl 怎么搞都行，但是最终你还是要测试才能知道哪个最优

作者: zhlong8 发布时间: 2011-05-17

相关阅读更多

4,920枚ETH，价值1,625万美元从Tornado Cash中提取，本周以太坊下跌13%

时间：2025-11-08
BTCC扩展Futures Pro平台，新增智能跟单交易功能

时间：2025-11-08
Block第三季度收入达61.1亿美元，其中比特币相关交易贡献19.7亿美元

时间：2025-11-08
4种值得购买的Meme币——美国国会议员拟立法禁止官员创建或持有加密货币

时间：2025-11-08
Ripple希望支付和稳定币引领XRP发展，而非IPO上市

时间：2025-11-08

热门阅读

office 2019专业增强版最新2021版激活秘钥/序列号/激活码推荐附激活工具
阅读：74
如何安装mysql8.0
阅读：31
Word快速设置标题样式步骤详解
阅读：28
20+道必知必会的Vue面试题（附答案解析）
阅读：37
HTML如何制作表单
阅读：22
百词斩可以改天数吗？当然可以，4个步骤轻松修改天数！
阅读：31
ET文件格式和XLS格式文件之间如何转化？
阅读：24
react和vue的区别及优缺点是什么
阅读：121
支付宝人脸识别如何关闭?
阅读：21
腾讯微云怎么修改照片或视频备份路径?
阅读：28

热门下载

更多

熊出没之疯狂弹射无限金币
休闲益智 20.4MB

下载
趣教
学习教育 56MB

下载
杀戮尖塔mod
音乐节奏 332.85MB

下载
旺店圈
购物比价 39.42MB

下载
梦回战场
飞行射击 346.05MB

下载
暗黑的像素地牢
动作格斗 9.02MB

下载
觅影录屏
游戏工具 70.60MB

下载
礼品在线网
购物比价 17.21MB

下载
抖药
购物比价 54.25MB

下载
水果蔬菜消消乐
休闲益智 183.20MB

下载