当前位置：首页 → 问答吧 → 求一perl程序，希望得到实在的程序代码帮助

求一perl程序，希望得到实在的程序代码帮助

时间：2010-09-18

来源：互联网

编程需求：如果>行之间相同的字母组合完全相同，则输出相应的>所在的行。

如：

>gi|123|CAV28776.1| unnamed protein product [Physcomitrella patens]
PYCVRMGLKRKILHASEPQSPVGVL
>gi|34fg|gb|CAV28776.1| unnamed protein product [Physcomitrella patens]
PYCVRMGLKRKILHASEPQSPVGVL

两者存在相同的字符串PYCVRMGLKRKILHASEPQSPVGVL，所以输出结果：

>gi|123|CAV28776.1| unnamed protein product [Physcomitrella patens]
>gi|34fg|gb|CAV28776.1| unnamed protein product [Physcomitrella patens]
字符串相同

有一文件，内容如下

如：
>gi|218328416|gb|CAV28776.1| unnamed protein product [Physcomitrella patens]
MPQIQYSEKYFDDTYEYRHVVLPPDIAKLLPKNRLLSEAEWRGIGVQQSRGWVHYAIHRPEPHIMLFRRP
LNYGQPQQAAAVQQQPTGMKA
>gi|218328416|emb|CAV28776.1| unnamed protein product [Physcomitrella patens]
MPQIQYSEKYFDDTYEYRHVVLPPDIAKLLPKNRLLSEAEWRGIGVQQSRGWVHYAIHRPEPHIMLFRRP
LNYGQPQQAAAVQQQPTGMKA
>gi|51833416|emb|CAV28776.1| unnamed protein product [Physcomitrella patens]
MPQIQYSEKYFDDTYEYRHVVLPPDIAKLLPKNRLLSEAEWRGIGVQQSRGWVHYAIHRPEPHIMLFRRP
LNYGQPQQAAAVQQQPTGMKA
>gi|26190151|emb|CAD21955.1| cyclin D [Physcomitrella patens]
MSPSVDCLASLYCAEDVSGTAWNESEMCGAADRVFESQPAVFMDFPVEDDEAIATLLMKEAQFMPEADYL
ERYQSRKLSLEARLAAIEWILKVHSFYNYSPLTVALAVNYMDRFLSRYYFPEGKEWMLQLLSVACISLAA
KMEESDVPILLDFQVEQEEHIFEAHTIQRMELLVLSTLEWRMSGVTPFSYVDYFFHKLGVSDLLLRALLS
RVSEIILKSIRVTTSLQYLPSVVAAASIICALEEVTTIRTGDLLRTFNELLVNVESVKDCYIDMRQSEIG
PYCVRMGLKRKILHASEPQSPVGVLEAADVSSPSGTVLGFSSRESSPDVTDSPPSTNSQRKRRKLCLHNE
SCLHVESASL

输出结果：
>gi|218328416|gb|CAV28776.1| unnamed protein product [Physcomitrella patens]
>gi|218328416|emb|CAV28776.1| unnamed protein product [Physcomitrella patens]
>gi|51833416|emb|CAV28776.1| unnamed protein product [Physcomitrella patens]
字符串相同

附件是一个需要处理的文件