+ -
当前位置:首页 → 问答吧 → 初学者求教

初学者求教

时间:2011-03-22

来源:互联网

本帖最后由 sky_lij 于 2011-03-22 11:32 编辑

从EMBL格式文件中提取有关键词“SIGNAL“(大写) 的信息,按下列格式输出(Tab键隔开):

     CTGF_HUMAN    P29279    SIGNAL    1    26    Potential
     IGF2_HUMAN     P01344    SIGNAL    1    24

依次为ID, AC的第一个,SIGNAL,开始, 结束, 状态(有几种。如Potential, similarity, 或为空等)。
求代码和思路。(最好是perl)

EMBL格式见附件(只是一少部分数据)。

EMBL.rar (13.83 KB)

下载次数:3

2011-03-22 10:55

作者: sky_lij   发布时间: 2011-03-22

回复 sky_lij


    shell:
  1. awk '/^ID/{printf $2"\t"}/^AC/{printf $2"\t"}/^FT   SIGNAL/{print $2"\t"$3"\t"$4}'  file
  2. IGF2_HUMAN      P01344;      SIGNAL        1     24
  3. CTGF_HUMAN      P29279;     SIGNAL        1     26       Potential.
复制代码

作者: yinyuemi   发布时间: 2011-03-22