从一个大数据量表中的一个字段提取并分析邮件地址,插入到另一个大数据量表中,求一个高效率的解决办法
时间:2011-07-27
来源:互联网
             表A:(id int primary key auto_increment,email_add varchar(20), desc varchar(20))
表B:(id int primary key auto_increment, email_add varchar(20) unique)
目标是从表A中抽取email_add到表B,保证表B是一个唯一的邮件地址表
表A中有多条数据,并且可能有很多相同的email_add,
邮件地址可能为“abc<[email protected]>”,可能为“[email protected]”,两种形式
我的想法是每5分钟抽取表A中的所有email_add,字符串拆分,并直接插入表B,让表B的email_add的unique属性去保证完整性
可是这样的效率肯定慢死了,有没有什么好的办法啊?
PS:这种拆分字符串有没有什么高效的办法啊?在存储过程里做。
            表B:(id int primary key auto_increment, email_add varchar(20) unique)
目标是从表A中抽取email_add到表B,保证表B是一个唯一的邮件地址表
表A中有多条数据,并且可能有很多相同的email_add,
邮件地址可能为“abc<[email protected]>”,可能为“[email protected]”,两种形式
我的想法是每5分钟抽取表A中的所有email_add,字符串拆分,并直接插入表B,让表B的email_add的unique属性去保证完整性
可是这样的效率肯定慢死了,有没有什么好的办法啊?
PS:这种拆分字符串有没有什么高效的办法啊?在存储过程里做。
作者: yufulou 发布时间: 2011-07-27
             没什么好办法,可以在存储过程中做,但显然比较麻烦。MYSQL的正规匹配功能并不理想。 建议还是在外部程序代码中实现,比如C#。            
            作者: ACMAIN_CHM 发布时间: 2011-07-27
 相关阅读 更多  
      
    热门阅读
-  
 office 2019专业增强版最新2021版激活秘钥/序列号/激活码推荐 附激活工具
          阅读:74
 -  
 如何安装mysql8.0
          阅读:31
 -  
 Word快速设置标题样式步骤详解
          阅读:28
 -  
 20+道必知必会的Vue面试题(附答案解析)
          阅读:37
 -  
 HTML如何制作表单
          阅读:22
 -  
 百词斩可以改天数吗?当然可以,4个步骤轻松修改天数!
          阅读:31
 -  
 ET文件格式和XLS格式文件之间如何转化?
          阅读:24
 -  
 react和vue的区别及优缺点是什么
          阅读:121
 -  
 支付宝人脸识别如何关闭?
          阅读:21
 -  
 腾讯微云怎么修改照片或视频备份路径?
          阅读:28
 















