开放读码框阅读框是指的什么?

TransDecoder:预测转录本序列中的开放阅读框(ORF) - 推酷
TransDecoder:预测转录本序列中的开放阅读框(ORF)
TransDecoder identifies candidate coding regions within transcript sequences, such as those generated by de novo RNA-Seq transcript assembly using Trinity, or constructed based on RNA-Seq alignments to the genome using Tophat and Cufflinks.TransDecoder identifies likely coding sequences based on the following criteria:
* a minimum length open reading frame (ORF) is found in a transcript sequence
* a log-likelihood score similar to what is computed by the GeneID software is & 0.
* the above coding score is greatest when the ORF is scored in the 1st reading frame as compared to scores in the other 5 reading frames.
* if a candidate ORF is found fully encapsulated by the coordinates of another candidate ORF, the longer one is reported.
However, a single transcript can report multiple ORFs (allowing for operons, chimeras, etc).
* optional the putative peptide has a match to a Pfam domain above the noise cutoff score.
官方主页:
Github地址:
工具导读:
对一条转录本序列预测ORF有很多不同的策略,比如:
(1)、与NR库比对,选取阅读框,然后使用ESTscan或者 EMBOSS sixpack/transeq 指定阅读框,翻译;
(2)、 如果是微生物的RNA-seq拼装结果,可以直接使用Prodigal等基因预测工具;
(3)、真核RNA-seq de-novo 拼装的转录本,推荐使用TransDecoder;
最新版本的TransDecoder 比先前的版本好用很多,其中操作上比较方便的是把原先一个命令拆分成几个步骤操作,比如:将预测的longest_orfs序列与Pfam序列比对和与其它数据的同源性搜索分离,这样可以使用外部的数据拆分提交程序,可以减少运行时间。
该软件安装比较简单,下载解压然后make
小技巧: TransDecoder 使用了cd-hit-est 对序列进行聚类, 其实这个可以改写成usearch/vsearch 提速,不过一般序列都不多,速度都不是问题,但是, 还是需要 TransDecoder.Predict 中的执行cd-hit-est 这一步将线程调整成多线程模式,别浪费CPU;
已发表评论数()
请填写推刊名
描述不能大于100个字符!
权限设置: 公开
仅自己可见
正文不准确
标题不准确
排版有问题
主题不准确
没有分页内容
图片无法显示
视频无法显示
与原文不一致开放探究型材料题的开放性指什么_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
开放探究型材料题的开放性指什么
上传于||暂无简介
阅读已结束,如果下载本文需要使用0下载券
想免费下载更多文档?
你可能喜欢什么是开放阅读框?生物信息学概念
开放阅读框是基因序列中的一段无终止序列打断的碱基序列,可编码相应的蛋白.就是从起始密码子到终止密码子之间的序列,连续翻译一段多肽链.生物信息学概念的话就是以计算机为工具对生物信息进行储存、检索和分析的科学.研究重点主要体现在基因组学和蛋白质组学两方面,因为要分析生物基因和蛋白数据量很大,加上现在所说的大数据时代,突出了生物信息学的作用.
开放阅读框一般有多长?
这个多长没准吧,有长有短,基因不一样,表达的蛋白大小也不一样,每个基因的ORF也就不一样
为您推荐:
其他类似问题
扫描下载二维码怎样快速找到基因序列的开放阅读框_百度知道
怎样快速找到基因序列的开放阅读框
不过不一定准,可能需要软件来预测,ncbi基本上已经大多数都注释过了。如果是未知序列,到数据库比对就行如果是人或者模式生物的
其他类似问题
为您推荐:
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁什么是开放阅读框_百度知道
什么是开放阅读框
这是因为在没有其它信息的前提下,其DNA序列被解读,对应三种不同的起始位点)开放阅读框(Open Reading Frame, ORF)是基因序列中的一段无终止序列打断的碱基序列,可编码相应的蛋白,符合这些条件的序列有可能对应一个真正的单一的基因产物,DNA序列可能按六种框架阅读和翻译(每条链三种。当一个新基因被识别。ORF的识别是证明一个新的DNA序列为特定的蛋白质编码基因的部分或全部的先决条件。ORF识别包括检测这六个阅读框架并决定哪一个包含以启动子和终止子为界限的DNA序列而其内部不包含启动子或终止子,人们仍旧无法搞清相应的蛋白序列是什么
知道智能回答机器人
我是知道站内的人工智能,可高效智能地为您解答问题。很高兴为您服务。
其他类似问题
为您推荐:
您可能关注的推广
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁

我要回帖

更多关于 开放读码框 的文章

 

随机推荐