又有问题了
时间:2011-03-24
来源:互联网
------------------------------------------------------------
------------TCCAGAATGTACAATGGTTATGCAGGTGGTTTTGAAGTGCAGGTGATC
CTCGCGGGGAACGCGTTCA--CCGCCGGAAAAATTATATTTGCAGCAGTCCCACCAAATT
T-----------------TCCAACTGAAGGCTTGAGTCCCAGCC---AGGTCACTATGTT
CCCCCATATAATAGTGGATGTTAGGCAATT-------GGAACCTGTGTT-GATCCC----
-------------------CTTACCTGAT-------GTTAGGAATAATTTCTATCACTAT
AATCAGTCAAATGATTCTACCATTA----------AATTGATAGCAATGCTGTATACACC
ACTTAGGGCTAATAATGCTGGG--------------GATGATGTCTTCACAGTCTCTTGA
>2009
------------------------------------------------------------
------------TCCAGAATGTACAATGGTTATGCAGGTGGTTTTGAAGTGCAGGTGATC
CTCGCGGGGAACGCGTTCA--CCGCCGGAAAAATTATATTTGCAGCAGTCCCACCAAATT
T-----------------TCCAACTGAAGGCTTGAGTCCCAGCC---AGGTCACTATGTT
CCCCCATATAATAGTGGATGTTAGGCAATT-------GGAACCTGTGTT-GATCCC----
-------------------CTTACCTGAT-------GTTAGGAATAATTTCTATCACTAT
AATCAGTCAAATGATTCTACCATTA----------AATTGATAGCAATGCTGTATACACC
ACTTAGGGCTAATAATGCTGGG--------------GATGATGTCTTCACAGTCTCTTGA
以上是我比对完之后的序列,不止这两条。我的目的是去掉中间--------较多的那一段区域,好像是设定一个什么值就可以解决的,请高手指教,谢谢!
比如这两条序列中的最后一行那块GGG--------------GAT
GGG--------------GAT,像这种情况就是--比较多的,也不是说不能含有--标记,只是不能太多,我不知道如何设定这个值。我觉得用匹配的话肯定会比较麻烦。
作者: 超级细菌 发布时间: 2011-03-24
可以得到每行有几个“-”
作者: yinyuemi 发布时间: 2011-03-24
你好,感谢你的回答,但是我还不是很明白,你的代码中的gsub,awk都是什么意思啊?我还没学到这么高深的程度,还有其他的方法吗?
作者: 超级细菌 发布时间: 2011-03-24
你好,我刚在终端运行了一下你说的那个命令,也显示了我每行有多少个--符号,但是这并不能达到我的最终目的啊?谢谢!
作者: 超级细菌 发布时间: 2011-03-24
perl -ane '{@field=split(/-/,$_); if ($#field<num) {print}}'
作者: yinyuemi 发布时间: 2011-03-24
你好,我再补充一下我的问题,就是假如连续出现了比方说20个“-”符号,那么我就要把含有20个“-”符号的这些列全都删掉,因为有的序列在这20个“-”这块区域是碱基,不是说只找到了就可以了,据说,好像只要设定一个什么值就能解决,谢谢!
作者: 超级细菌 发布时间: 2011-03-24
回复 超级细菌
5楼的代码应该可以满足你的要求,把num换成20,试试
如果只删除20个“-”的,把“<” 改成 "!="
作者: yinyuemi 发布时间: 2011-03-24
这个好像不行,结果是,运行完直接把一行全都删掉了,也就是说删掉的东西多了
作者: 超级细菌 发布时间: 2011-03-24
这个……,perl还在学习中,我试试awk能解决不?
作者: yinyuemi 发布时间: 2011-03-24
是这个意思么?
- awk -v FS= -v l=20 '/^>/{print;next}gsub("-","-",$0)==l{gsub("-","",$0)}1'
作者: yinyuemi 发布时间: 2011-03-24
- use Bio::AlignIO;
-
- my $alni = Bio::AlignIO->new(
- -file => aln.fasta, -format => 'fasta',
- );
-
- my $aln = $alni->next_aln;
-
- # Remove all alignment gaps
- $aln->remove_gaps;
-
- my $alno = Bio::AlignIO->new(
- -file => ">out.fasta", -format => 'fasta', # output in fasta format
- );
-
- $alno->write_aln($aln); # 输出去掉 gap 的比对
作者: longbow0 发布时间: 2011-03-24
热门阅读
-
office 2019专业增强版最新2021版激活秘钥/序列号/激活码推荐 附激活工具
阅读:74
-
如何安装mysql8.0
阅读:31
-
Word快速设置标题样式步骤详解
阅读:28
-
20+道必知必会的Vue面试题(附答案解析)
阅读:37
-
HTML如何制作表单
阅读:22
-
百词斩可以改天数吗?当然可以,4个步骤轻松修改天数!
阅读:31
-
ET文件格式和XLS格式文件之间如何转化?
阅读:24
-
react和vue的区别及优缺点是什么
阅读:121
-
支付宝人脸识别如何关闭?
阅读:21
-
腾讯微云怎么修改照片或视频备份路径?
阅读:28