+ -
当前位置:首页 → 问答吧 → 文件合并的问题

文件合并的问题

时间:2011-04-28

来源:互联网

两个文件,其中有相同的序列,也有不同的序列,现在想把它合并为一个文件,但是不能有重复的序列,请问应该怎样操作,我用了cat file1 file2 |sort|uniq >file3,但是不是想要的结果
file1
>1541270
ATGAAGATGGCGTCGAGTGACGCCAACCCA
>1541271
ATGAAGATGGCGTCGAATGACGCCAACCCA
file2
>1541270
ATGAAGATGGCGTCGAATGACGCCAACCCA
>2615996
ATGAAGATGGCGTCGAATGACGCCAACCCA
用了那个命令之后的结果是
>1541270
>1541271
>2615996
ATGAAGATGGCGTCGAGTGACGCCAACCCA
ATGAAGATGGCGTCGAATGACGCCAACCCA
ATGAAGATGGCGTCGAATGACGCCAACCCA
请高手指教!
需要的结果是
>1541270
ATGAAGATGGCGTCGAGTGACGCCAACCCA
>1541271
ATGAAGATGGCGTCGAATGACGCCAACCCA
>2615996
ATGAAGATGGCGTCGAATGACGCCAACCCA

作者: 超级细菌   发布时间: 2011-04-28

回复 超级细菌

awk -vRS='(\n)?>' '++a[$0]==1'

作者: yinyuemi   发布时间: 2011-04-28

回复 yinyuemi


    请问这是什么意思啊?咋用啊?谢谢

作者: 超级细菌   发布时间: 2011-04-28

回复 超级细菌
  1. perl  -lane  'if(/>/){$a=$_}else{ if(++$b{"$a\n$_"}==1) {print "$a\n$_"};$a=""}' file1 file2
复制代码

作者: yinyuemi   发布时间: 2011-04-28

感谢,好用

作者: 超级细菌   发布时间: 2011-04-28