基因组组装完成后或者是完成叻草图,就不可避免遇到一个问题需要对基因组序列进行注释。注释之前首先得构建基因模型有三种策略:
每一种方法都有自己的优缺点,所以最后需要用EvidenceModeler(EVM)和GLEAN工具进行整合合并成完整的基因结构。基于可靠的基因结构後续可才是功能注释,蛋白功能域注释基因本体论注释,通路注释等
那么基因注释重要吗?可以说是非常重要了尤其是高通量测序非常便宜的现在。你可以花不到一万的价格对600M的物种进行100X的普通文库测序然后拼接出草图。但是这个草图的价值还需要你进行注释后才能显现出来有可能你和诺贝尔奖就差一个注释的基因组。