首页手机软件手机游戏单机游戏资讯文章专题下载游戏合集文章合集 php下载 php教程电脑软件

+ -

当前位置：首页 → 问答吧 → 关于高效的大表关联查询的问题

关于高效的大表关联查询的问题

时间：2011-07-21

来源：互联网

1、文本文件 a 是一列数字, 50 W 的记录量：

2
5
12
14
17

2、文件 b 有 5列，1200W 的记录量，字段分别是文件 a 的start范围、文件 a 的end范围, col3, col4, col5

1 2 c13 c14 c15
3 3 c23 c24 c25
7 9 c33 c34 c35
13 20 c43 c44 c45

3、需求：a中的元素如果在b中的第一列与第二列之间，就算匹配成功，然后输出后面的3、4、5列到文件 c
例如运行脚本后，c中的内容应该是：

c13 c14 c15
c43 c44 c45
c43 c44 c45

4、由于机器性能内存、cpu所限，自己写的awk处理太慢了，一秒钟才出来一个结果，看大家有没有更高效简洁的办法，谢谢！

作者: xrzs1986 发布时间: 2011-07-21

本帖最后由 106033177 于 2011-07-21 22:11 编辑

回复 xrzs1986
如果a是递增的；b区间是递增的且不重复，可以这样，效率没做测试。

def f():
a=-1
for s in open('e:/b.txt','r'):
ss=s.split()
start,end=int(ss[0]),int(ss[1])
while a < start:
a= yield
a=int(a)
if a >= start and a <= end:
a = yield s
a=int(a)
g=f()
g.next()
for s in open('e:/a.txt','r'):
r= g.send(s)
if r:
print r

复制代码

作者: 106033177 发布时间: 2011-07-21

相关阅读更多

比特币行情软件哪个最权威？八款比特币投资软件排名推荐

时间：2025-12-15
幣安交易所最新下载地址_附带Binance使用教程(注册、下载)

时间：2025-12-15
欧易okx最新可访问入口如何获取？官网备用链接详细步骤

时间：2025-12-15
ALGO币未来走势预测(2025-2030)：ALGO币潜力如何？是否值得长期持有？

时间：2025-12-15
USDT是什么货币？本文带你了解USDT泰达币

时间：2025-12-15

热门阅读

office 2019专业增强版最新2021版激活秘钥/序列号/激活码推荐附激活工具
阅读：74
如何安装mysql8.0
阅读：31
Word快速设置标题样式步骤详解
阅读：28
20+道必知必会的Vue面试题（附答案解析）
阅读：37
HTML如何制作表单
阅读：22
百词斩可以改天数吗？当然可以，4个步骤轻松修改天数！
阅读：31
ET文件格式和XLS格式文件之间如何转化？
阅读：24
react和vue的区别及优缺点是什么
阅读：121
支付宝人脸识别如何关闭?
阅读：21
腾讯微云怎么修改照片或视频备份路径?
阅读：28

热门下载

更多

跨维度自动售货机无限金币
模拟经营 278.82MB

下载
核日之后无限货币
冒险解谜 266.71MB

下载
地牢狗无限金币钻石版
冒险解谜 144.74MB

下载
奇妙星际宇航员安卓版
休闲益智 92.16MB

下载
奇妙农场体验
休闲益智 157.02MB

下载
奇妙农场体验全解锁版(内置功能菜单)
休闲益智 157.02MB

下载
僵尸人入侵手游
休闲益智 70.8MB

下载
手画摩托车手机版
休闲益智 32.27MB

下载
进击的方块君游戏
休闲益智 43.11MB

下载
我的虚拟世界手机版
休闲益智 82.1MB

下载