+ -
当前位置:首页 → 问答吧 → 请教大家:对于海量数据的去重有什么好的建议吗?

请教大家:对于海量数据的去重有什么好的建议吗?

时间:2011-09-02

来源:互联网

目的:将一个表A(百万级)INSERT到另外一个大表B(亿级),根据几个字段判断是否与B表重复,不重复就插入.

merge的方法用过了,但是效率达不到要求.

请教大家:对于上面这种情况的去重有什么好的建议吗?

谢谢!

作者: guojiev   发布时间: 2011-09-02

呵呵,不用insert,只要创建一个视图 create view v_a_b as select * from a union select * from b

作者: 我上面有人   发布时间: 2011-09-02

谢谢!
但是我要将数据保存下来,B表其实是个临时表,每天都会生成!

作者: guojiev   发布时间: 2011-09-02



QUOTE:原帖由 guojiev 于 2011-9-2 15:59 发表
谢谢!
但是我要将数据保存下来,B表其实是个临时表,每天都会生成!

保存 又是临时表什么意思?

作者: pingdanorcale   发布时间: 2011-09-02

A表中要保存所有的非重复的数据,B表是个临时表,每天都会truncate掉后重新生成.
所以不能用一个视图来返回结果.

作者: guojiev   发布时间: 2011-09-02

11g 新特性IGNORE_ROW_ON_DUPKEY_INDEX提示

http://www.oracledatabase12g.com ... 8F%90%E7%A4%BA.html

作者: maclean   发布时间: 2011-09-02

这个新特性真是好东西啊

作者: cescigl   发布时间: 2011-09-02