+ -
当前位置:首页 → 问答吧 → 从一个大数据量表中的一个字段提取并分析邮件地址,插入到另一个大数据量表中,求一个高效率的解决办法

从一个大数据量表中的一个字段提取并分析邮件地址,插入到另一个大数据量表中,求一个高效率的解决办法

时间:2011-07-27

来源:互联网

表A:(id int primary key auto_increment,email_add varchar(20), desc varchar(20))
表B:(id int primary key auto_increment, email_add varchar(20) unique)
目标是从表A中抽取email_add到表B,保证表B是一个唯一的邮件地址表

表A中有多条数据,并且可能有很多相同的email_add,
邮件地址可能为“abc<[email protected]>”,可能为“[email protected]”,两种形式
我的想法是每5分钟抽取表A中的所有email_add,字符串拆分,并直接插入表B,让表B的email_add的unique属性去保证完整性
可是这样的效率肯定慢死了,有没有什么好的办法啊?

PS:这种拆分字符串有没有什么高效的办法啊?在存储过程里做。

作者: yufulou   发布时间: 2011-07-27

没什么好办法,可以在存储过程中做,但显然比较麻烦。MYSQL的正规匹配功能并不理想。 建议还是在外部程序代码中实现,比如C#。

作者: ACMAIN_CHM   发布时间: 2011-07-27