求助AB的SOE功能如何实现

基因组组装完成后或者是完成叻草图,就不可避免遇到一个问题需要对基因组序列进行注释。注释之前首先得构建基因模型有三种策略:

  • 从头注释(de novo prediction):通过已有的概率模型来预测基因结构,在预测剪切位点和UTR区准确性较低
  • 同源预测(homology-based prediction):有一些基因蛋白在相近物种间的保守型搞所以可以使用已有的高质量近缘物种注释信息通过序列联配的方式确定外显子边界和剪切位点
  • 基于转录组预测(transcriptome-based prediction):通过物种的RNA-seq数据辅助注释,能够较为准确的确定剪切位点和外显子区域

每一种方法都有自己的优缺点,所以最后需要用EvidenceModeler(EVM)和GLEAN工具进行整合合并成完整的基因结构。基于可靠的基因结构後续可才是功能注释,蛋白功能域注释基因本体论注释,通路注释等

那么基因注释重要吗?可以说是非常重要了尤其是高通量测序非常便宜的现在。你可以花不到一万的价格对600M的物种进行100X的普通文库测序然后拼接出草图。但是这个草图的价值还需要你进行注释后才能显现出来有可能你和诺贝尔奖就差一个注释的基因组。

我要回帖

更多关于 实现线与功能 的文章

 

随机推荐