蛋白怎么和比较基因组学分析blast比较

实验三蛋白序列比对到基因组_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
实验三蛋白序列比对到基因组
上传于||文档简介
&&生​物​信​息​软​件​简​介
阅读已结束,如果下载本文需要使用1下载券
想免费下载本文?
定制HR最喜欢的简历
你可能喜欢如何用BLAST发现新基因?
互撸娃☆8058
从一个一直蛋白质序列开始,通过tBLASTn工具搜索一个DNA数据库,可以找到相应的匹配,如与DNA编码的已知蛋白质的匹配或者与DNA编码的相关蛋白质的匹配.然后通过BLASTx或BLASTp在蛋白质数据库中搜索DNA或蛋白质序列来“确定”一个新基因.
为您推荐:
其他类似问题
扫描下载二维码小木虫 --- 500万硕博科研人员喜爱的学术科研平台
&&查看话题
有没有谁做过一个基因在基因组中比对的
本人现从网上下载到一物种的基因转录片段文件(附件:Chlvu1_best_transcripts_3.fasta),里面有近一万个转录片段(未注释)。现在我得到几个相近物种已注释的(annotated)CDS基因(比如附件中:Chlamydomonas reinhardtii phosphoenolpyruvate carboxylase mRNA.txt),我想对这些CDS基因在这近一万个片段中比对,找出转录片段中和已知CDS基因同源性较高的片段。请问我该怎么做,用什么软件或工具比较好?
本人新手,以前没做过这么庞大的工作,求指导!
可惜我只是初学者啊,请问你知道具体怎么做吗?是要下载本地BLAST工具和数据库吗?你指的需要一定的电脑操作知识是什么意思?
我今天又发现,下载一个叫BioEdit的软件,可以更方便的做本地BLAST
这玩意我装过,不是特别好使,且如果数据量大时,dos系统要快得多!
DOS确实快一点,不过如果要做批量的话,两种方法都要把基因全部写到一个文件里面再做吗?
不好意思,现在才看到。
是这样的。如果做批量,就把要搜的序列都拷到一个txt文件里。可以用blast parser (/get/Science-CAD/Blast-Parser.shtml)读取结果文件,可以输出或拷贝到excel文件进行筛选等操作。
ps.我也是新手,最近在分析一个转录组,又不会用perl之类的东东,所以慢慢摸索出一些windows下的偷懒方法。欢迎交流。
我用前几楼的方法试过 结果不错 几个目的基因都找出来了
你好 想要将一个已知基因A序列与一个未上传到网上的基因组B比对 该如何操作是好 谢谢 其中A基因的基因组与B基因组的同源性在90%以上 谢谢 在B基因组找到A基因的序列后想设计引物。
研究生必备与500万研究生在线互动!
扫描下载送金币
浏览器进程
登录小木虫
打开微信扫一扫
随时随地聊科研NCBI在线BLAST用法详解
NCBI在线BLAST用法详解
首先进行Blast类型的选择:blastp:将待查询的蛋白质序列及其互补序列一起对蛋白质序列数据库进行查询;blastn:将待查询的核酸序列及其互补序列一起对核酸序列数据库进行查询;blastx:先将待查询的核酸序列按六种可读框架(逐个向前三个碱基和逐个向后三个碱基读码)翻译成蛋白质序列,然后将翻译结果对蛋白质序列数据库进行查询;tblastn:先将核酸序列数据库中的核酸序列按六种可读框架翻译成蛋白质序列,然后将待查询的蛋白质序列及其互补序列对其翻译结果进行查询;tblastx:先将待查询的核酸序列和核酸序列数据库中的核酸序列按六种可读框架翻译成蛋白质序列,然后再将两种翻译结果从蛋白质水平进行查询。基本步骤如下:1,进入在线blast界面,可以选择blast特定的物种(如下)。不同的blast程序上面已经有了介绍。这里以常用的Blast&中nucleotide&blast作为例子。Human&人Mouse&小鼠Rat&大鼠Arabidopsis thaliana&拟南芥Oryza&sativa&&水稻Bos&taurus&&&牛Danio&rerio&&斑马鱼Drosophila&melanogaster&黑腹果蝇Gallus&gallus&乌骨鸡Pan&troglodytes&黑猩猩Microbes&&微生物Apis&mellifera&&&蜜蜂更多物种blast请使用此网址:http://www.ncbi.nlm.nih.gov/genome/browse/选择相应的物种做BLAST即可!2,粘贴fasta格式的序列(可以是多条奥!!)或使用Accession&number(s)、gi(s)(注意仅使用数字,不加上标志符gi)。选择一个要比对的数据库,如果是人和鼠则进行相应的选择,否则选择Others中的nr/nt&。关于数据库的说明请看NCBI在线blast数据库的简要说明。其他选项不是必选的,如Job&Title就是这次比对的名字,随便起一个即可;Organism为物种,可以填入你想比对的物种(分类单元如green&plant等)的名字(拉丁名字,输入几个字母后会出现索引的)。第一个直接填入框中,往后需要点击一下加号后才能继续添加,选择Exclude就是与这些物种以外的物种序列进行比对。另外对于Limit&by&Entrez&Query这一部分也为选填内容,若填写可以进行更为有效的限制,如可以限制分子类型、序列长度等等。具体限制内容如下:protease&NOT&hiv1[organism]这将会将Blast检索限定在proteases,但不包含&HIV&1.[slen]对于核酸这将会将检索的序列的碱基长度限制在1000&to&2000bp,&对于蛋白质,则将残基个数限制在1000&to&2000&。[mlwt]这将检索的蛋白序列的分子重量限制在10&kD&to&100&kD.&src&specimen&voucher[properties]&这将检索范围限制在在来源特征中注有specimen_voucher(物种证明人)的序列中。all[filter]&NOT&enviromnentalsample[filter]&NOT&metagenomes[orgn]&这将会排除宏基因组研究和来自未知环境的样品未知序列。3,blast参数的设置。注意显示的最大的结果数跟E值,E值是比较重要的。筛选的标准。4,注意一下你输入的序列长度。注意一下比对的数据库的说明。5,blast结果的图形显示。没啥好说的(注意标题157Blast&Hits意思为共有157条比对上的序列)。6,blast结果的描述区域。注意分值与E值。分值越大越靠前了,E值越小也是这样。在下面图中可以在左边的复选框中选择,然后点击download可以一起下载这些序列。下载格式一般选择FASTA(complete&sequence)格式较好。7,blast结果的详细比对结果。注意比对到的序列长度。评价一个blast结果的标准主要有三项,E值(Expect),一致性(Identities),缺失或插入(Gaps)。加上长度的话,就有四个标准了。如图中显示,比对到的序列长度为1299,看Identities这一值,才匹配到1264bp,而输入的序列长度也是为1509bp,就说明比对到的序列要长一点。附:E值(Expect):表示随机匹配的可能性,例如,E=1,表示在目前大小的数据库中,完全由机会搜到对象数的平均值为1.E值越大,随机匹配的可能性也越大。E值接近零或为零时,具本上就是完全匹配了。通常来讲,我们认为E值小于10-5 就是比较可性的S值结果。我们可以想象,相同的数据库,E=0.001时如果有1000条都有机会S值比现在这个要高的话,那么不E设置为10-6时可能就会只得到一条结果,就是S值最可靠的那个。但是E值也不是万能的。它在以下几个情况下有局限性:1)当目标序列过小时,E值会偏大,因为无法得到较高的S值。2)当两序列同源性虽然高,但有较大的gap(空隙)时,S值会下降。这个时候gap&scores就非常有用。3)有些序列的非功能区有较低的随机性时,可能会造成两序列较高的同源性。E值总结:E值适合于有一定长度,而且复杂度不能太低的序列。当E值小于10-5时,表明两序列有较高的同源性,而不是因为计算错误。当E值小于10-6时,表时两序列的同源性非常高,几乎没有必要再做确认。一致性(Identities):或相似性。匹配上的碱基数占总序列长的百分数。Score得分值越高说明同源性越好;Expect期望值越小比对结果越好,说明因某些原因而引起的误差越小;Identities是同源性(相似性),例中所示比对的1299个碱基中只有35个不配,其他97%相同;Gaps是指多出或少的碱基或缺失的碱基数;缺失或插入(Gaps):插入或缺失。用'—'来表示。Strand=plus/plus指两条序列方向相同,如果是plus/minus,即意味着一条是5'到3',一条是3'到5',或一条是正向,另一条是反向序列。8.Blast&的三个程序1)MEGABLAST&常被用于鉴定核酸序列。MegaBLAST是一种BLASTN程序,主要是用来在同一物种非常相似的序列(相似度大于等于95%)之间同源性的比较。鉴定某一段核酸序列是否存在于数据库,最好的方法就是选择MEGABLAST。当然,BlastN/MEGABLAST/Discontiguous&MEGABLAST,都可以完成这种事情。但MEGABLAST就是特别设计用于非常相似长序列之间的比对,可用于寻找查询序列的最佳匹配的序列。总之此程序主要用来鉴定一段新的核酸序列,它并不注重比对各个碱基的不同和序列片断的同源性,而只注重被比对序列是否是数据库未收录的,是否为新的提交序列或基因。速度快用于同一物种间的。&2)Discontiguous&MEGABLAST用于查找不同物种的相似的核酸序列,而不是查询相同的序列。DiscontiguousMEGABLAST,用于跨物种核酸序列快速比对。它使用非重叠群字段匹配算法(noncontiguous&word&match)来进行核酸比对。DiscontiguousMegaBLAST比blastx等翻译后比对要快得多,同时它在比较编码区时也具有相当高的敏感度。但是需要指出的是,核酸与核酸之间的比对并不是发现同源蛋白编码区域的最佳方法,直接在蛋白水平用Blastp比对更好。这是因为密码子的简并性。&blastn&比MEGABLAST&更为敏感是因为它使用一个短的默认字长11.所以&blastn从其他物种寻找同源性比MEGABLAST&更好。blastn&字长可以从默认值调整至7来增加检索的敏感性&用相同字长检索在discontiguous&MEGABLAST&的效率和敏感度要高于标准的blastn。需要重点指出的是核酸序列的相似性检索并不是在其他物种中发现同源蛋白编码区的最好的方法。要完成这项任务最好要通过蛋白质水平上的相似性检索。可以采用direct&protein-protein&BLAST和translatedBLAST&searches的方法进行。3)BlastN&运行缓慢,但是允许将字长降低到7个碱基,增加检索的敏感性。9、Filter(较少用)1)Filter&(Low-complexity)&过滤器(Filter):过滤器可以屏蔽查询序列中低成分复杂性(Low&CompositionalComplexity)片断(所谓低成分复杂性片段指四种碱基出现的机会不均等,往往是某几个碱基连续出现如此序列:CGGGGGAAAAAAAAGGGGAAAAAAARAAAAMR)。它只能过虑待比对的序列及其转录产物中的低成分复杂性片断,不能过虑数据库中存在的序列中低成分复杂性片断。用户可以在BLAST和BLAST&2.0的高级检索中选择相应的过滤程序以消除对检索结果的干扰,如不用过滤功能则选择“NONE”。但是在BLAST和BLAST&2.0基本检索中,因为,系统对于不同的BLAST程序设定了默认值,例如对于blastn程序,其默认值为“DUST”,其可以消除统计学上有重要意义但生物学上没意义的区域的对比,使输出结果只呈现在生物学上有意义的区域。而对于blastn以外的其他程序,默认值为“SEG”,所以用户只须选择用不用过虑功能,而不必设定过虑程序。有时在与WISS-PROT和refseq数据库中进行比对时SEG程序未起作用,这也是正常的。.&Furthermore,&in&some&cases,sequences&are&masked&in&their&entirety,&indicating&that&the&statisticalsignificance&of&any&matches&reported&against&the&unfiltered&query&sequenceshould&be&suspect.&This&will&also&lead&to&search&error&when&default&setting&isused.&&filterfoSpecies-specific repeats&filterSpecies-specific repeats&filter for这一选择是忽略某物种的重复序列,点击下拉菜单可以选择物种。Filter&(Mask&for&lookup&table&only)BLAST检索包含两个阶段,&finding&hits&basedupon&a&lookup&table&and&then&extending&them.&This&option&masks&only&forpurposes&of&constructing&the&lookup&table&used&by&BLAST&so&that&no&hits&arefound&based&upon&low-complexity&sequence&or&repeats&(if&repeat&filter&ischecked).&The&BLAST&extensions&are&performed&without&masking&and&so&they&can&beextended&through&low-complexity&sequence.&·&Mask&Lower&CaseWiththis&option&selected&you&can&cut&and&paste&a&FASTA&sequence&in&upper&casecharacters&and&denote&areas&you&would&like&filtered&with&lower&case.&Thisallows&you&to&customize&what&is&filtered&from&the&sequence&during&thecomparison&to&the&BLAST&databases.&
发表评论:
TA的最新馆藏【转载】Blast本地化:使用Blastall进行数据库比对
Query id,Subject id,% identity,alignment length,mismatches,gap
openings,q. start,q. end,s. start,s. end,e-value,bit
Blast,全称Basic Local Alignment
Tool,即"基于局部比对算法的搜索工具",由Altschul等人于1990年发布。Blast能够实现比较两段核酸或者蛋白序列之间的同源性的功能,它能够快速的找到两段序列之间的同源序列并对比对区域进行打分以确定同源性的高低。
Blast的运行方式是先用目标序列建数据库(这种数据库称为database,里面的每一条序列称为subject),然后用待查的序列(称为
query)在database中搜索,每一条query与database中的每一条subject都要进行双序列比对,从而得出全部比对结果。
Blast是一个集成的程序包,通过调用不同的比对模块,blast实现了五种可能的序列比对方式:
blastp:蛋白序列与蛋白库做比对,直接比对蛋白序列的同源性。
blastx:核酸序列对蛋白库的比对,先将核酸序列翻译成蛋白序列(根据相位可以翻译为6种可能的蛋白序列),然后再与蛋白库做比对。
blastn:核酸序列对核酸库的比对,直接比较核酸序列的同源性。
tblastn:蛋白序列对核酸库的比对,将库中的核酸翻译成蛋白序列,然后进行比对。
tblastx:核酸序列对核酸库在蛋白级别的比对,将库和待查序列都翻译成蛋白序列,然后对蛋白序列进行比对。
Blast提供了核酸和蛋白序列之间所有可能的比对方式,同时具有较快的比对速度和较高的比对精度,因此在常规双序列比对分析中应用最为广泛。可以毫不夸张的说,blast是做比较基因组学乃至整个生物信息学研究所必须掌握的一种比对工具。
Blast的运行分为两个步骤:第一,建立目标序列的数据库;第二,做blast比对。
1.运行建库程序formatdb:
建库的过程是建立目标序列的索引文件,所用程序是formatdb。程序允许的输入格式FASTA或者ASN.1格式,通常我们使用FASTA格式的序列作为输入。用于建库的FASTA序列是db.seq,formatdb的基本命令是:
formatdb -i db.seq
[-options]
常用的参数有以下几个:
(T/F):-p参数的意义是选择建库的类型,"T"表示蛋白库,"F"表示核酸库。缺省值为"T"。
(T/F):-o参数的意义是判断是否分析序列名并建立序列名索引。"T"表示建立序列名索引,"F"表示不建立序列名索引。缺省值为"F"。
程序输出:
如果建立的是核酸库,输出为db.seq.nhr、db.seq.nin、db.seq.nsq,如果选择了参数"-o
T",还会同时输出db.seq.nsd、db.seq.nsi、db.seq.nni、db.seq.nnd。
蛋白库和核酸库的输出类似,相应的输出文件为:db.seq.phr、db.seq.pin、db.seq.psq和db.seq.psd、db.seq.psi、db.seq.pni、db.seq.pnd。
除了这些结果,程序还会输出LOG文件(默认为formatdb.log),里面记录了运行时间、版本号、序列数量等信息。
几点需要注意的问题:
1、建库以后,做blast比对的输入文件就是建库所得的文件db.seq.n**或者db.seq.p**,而不是原始的FASTA序列。也就是说,建库以后,原始的序列文件是可以删除的。
2、如果命令行中选择了"-o
T",并且目标序列中含有gi号重复的的序列名时,程序会停止建库并报错。例如,下列序列文件中出现了重复的序列名:
&gi||gb|DQ| Oryza
sativa (japonica cultivar-group) glutathione S-transferase 2 mRNA,
complete cds
ATGGCGGAGGCGGCGGGGGCGGCGGTGGCGCCGGCGAAGCTGGGTCTGTACTCGTACTGGCGGAGCTCGT
GCTCGCACCGCGTCCGCATCGCCCTCAACCTCAAAGGATTGGAGTACGAGTACAAGGCGGTGAACCTGCT
CAAGGGGGAGCACTCTGATCCAGAATTCATGAAGGTTAATCCTATGAAGTTCGTCCCGGCATTGGTCGAT
CAAGCAGCACTCCCAGACAGACAACCAGATGCCCCTTCCTCTACCTAG
&gi||gb|DQ| Oryza
sativa (japonica cultivar-group) glutathione S-transferase 2 mRNA,
complete cds
ATGGCGGAGGCGGCGGGGGCGGCGGTGGCGCCGGCGAAGCTGGGTCTGTACTCGTACTGGCGGAGCTCGT
GCTCGCACCGCGTCCGCATCGCCCTCAACCTCAAAGGATTGGAGTACGAGTACAAGGCGGTGAACCTGCT
CAAGGGGGAGCACTCTGATCCAGAATTCATGAAGGTTAATCCTATGAAGTTCGTCCCGGCATTGGTCGAT
运行时就会报如下错误:
[formatdb] ERROR: Failed to create
Possibly a gi included more than once
in the database.
3、如果输入序列不符合FASTA格式或者ASN.1格式,程序会自动退出,并报错:
[formatdb] ERROR: Could not open
4、核酸序列可以用于建核酸库和蛋白库,但是蛋白序列不能用于建核酸库。
其他参数简介:
-l:"-l 文件名"用来改变LOG文件的命名
文件名"可以自定义生成的库文件命名
-a:输入文件为ASN.1格式
2.运行比对程序blastall:
Blast的主程序是blastall。程序的输入文件是query序列(-i 参数)和库文件(-d
参数),比对类型的选择(-p 参数)和输出文件(-o 参数)由用户指定。其中“-p”参数有5种取值:
-p blastp:蛋白序列与蛋白库做比对。
-p blastx:核酸序列对蛋白库的比对。
-p blastn:核酸序列对核酸库的比对。
-p tblastn:蛋白序列对核酸库的比对。
tblastx:核酸序列对核酸库在蛋白级别的比对。
这些元素就构成了blast的基本运行命令(以blastn为例):
blastall -i query.fasta -d
database_prefix -o blast.out -p blastn
其中如果"-o"参数缺省,则结果输出方式为屏幕输出。
Blast的结果包含的信息很丰富。每一个query的比对结果从"BLASTN"开始,记录了版本和作者信息,"Query=
"之后记录了query名和序列长度。如果两条序列没有找到相关性信息,那么在"Searching.done"下方显示"***** No
hits found
******";反之,则在"Searching.done"下方记录了该query序列和库中每一条subject序列的比对概况列表,包括比对得分(Score)和期望值(E
value)。期望值是一个大于0的正实数,代表两条序列不相关的可能性。期望值是在整体上综合评定两条序列的相似性的参数,期望值数值越小,序列相似性就越高,反之期望值数值越大,相似性越低。比对的输出结果会按照期望值从低到高的顺序来排列。
Query序列和每一条subject序列比对结果的详细信息以"&"开始。需要注意的是同一个query和同一个subject可能会有多个比对结果,每一个具体的结果从"Score
="开始,记录了比对得分、期望值、相似度百分比(identities)、比对的空位和两条序列的比对方向,之后是比对条形图,显示了比对区域内每个碱基的比对情况。列出两条序列的所有比对结果后,罗列比对的参数设置和统计信息,至此两条序列间的比对结果输出完毕。
对于蛋白相关的比对,需要在blastall的运行目录下放置取代矩阵,并在运行时指定此替代矩阵,程序才能正常运行,否则blastall会报错退出。一般来讲,蛋白比对时最常用的取代矩阵是BLOSUM62矩阵。
===================
Blast本地化:使用Blastall进行数据库比对
用blastall进行序列比对
blastall是最常用的blast程序之一,其功能非常强大,其下面有非常多的参数,但是一般使用的参数如:-p、-i、-d、-o、-e等几个。
-p: 执行的程序名称
-d: 搜索的数据库名称
-i : 要查询的序列文件名(Query File)
-e:(数学)期望值(Expectation value),E值是个统计阈值,缺省值10,
意指比对结果中由于随机偶然性产生的匹配结果不大于10,E值越小结果越可靠。
-o :查询结果输出文件名
-m: 比对结果显示格式选项,缺省值为0 ,即pairwise格式。另外还可以根据不同的需要选择1~6等不同的格式。
-I :在描述行中显示gi号[T/F],缺省值F
-v :单行描述(one-line
description)的最大数目,缺省值500
-b :显示的比对结果的最大数目,缺省值250
-F :对于要查询的序列做低复杂度区域(low complexity regions,
LCR)的过滤[T/F],缺省值T。对blastn用的是DUST程序,其他比对用的是SEG程序。
所谓“低复杂度区域”是指某些或一些残基过多表现,短周期重复等。对于高等哺乳动物的基因组序列,可以先用RepeatMask程序遮蔽重复元件。在输出结果中,对LCR区的序列核酸用“N”代替,蛋白质序列用“X”代替。
-a:运行BLAST程序所使用的处理器的数目,缺省值1
-S:在数据库中搜索时所使用的核酸链(strand),只对blastn、blastx和tblastx有效;1表示top,2表示bottom,3表示both;缺省值3
-T: 产生HTML格式的输出[T/F],缺省值F
-n: 使用MegaBlast搜索[T/F],缺省值F
-G: 打开一个gap的罚分(0表示使用缺省设置值),默认0
-E: 扩展一个gap的罚分(0表示使用缺省设置值),默认0
-q: 一个核酸碱基的错配(mismatch)的罚分(只对blastn有效),缺省值-3
-r : 一个核酸碱基的正确匹配(match)的奖分(只对blastn有效),缺省值1
-M: 所使用的打分矩阵,缺省值BLOSUM62
基本参数、比对优化参数、结果输出参数、控制输入参数
表:blastall命令的参数说明
使用的程序
字符[String]
blastnblastpblastx
使用的数据库
文件名[File In]
搜索用的序列
文件名[File In]
数字[Real]
控制比对结果的样式
0到11的整数[Integer]
0 = pairwise,1 = query-anchored
showing identities,2 = query-anchored no identities,
3 = flat query-anchored, show identities,
4 = flat query-anchored, no identities,
5 = query-anchored no identities and blunt ends,
6 = flat query-anchored, no identities and blunt ends,
7 = XML Blast output,
8 = tabular,
9 tabular with comment lines
10 ASN, text
11 ASN, binary
比对结果存放的文件名
文件名[File Out]
过滤询问序列
DUST with blastn, SEG with others
打开gap得分
延伸gap得分
X dropoff value for gapped alignment
blastn 30, megablast 20, tblastx 0,
all others 15
显示gi号Show GI’s in deflines
核酸错配罚分
blastn only
核酸匹配得分
blastn only
Number of database sequences to show
one-line descriptions for (V)
Number of database sequence to show
alignments for (B)
Threshold for extending hits
blastp 11, blastn 0, blastx 12,
tblastn 13, tblastx 13, megablast 0
Perform gapped alignment
not available with tblastx
指定询问序列使用的遗传密码
指定数据使用的遗传密码
for tblast[nx] only
使用CPU的数目
SeqAlign file
[File Out]
Believe the query defline
比对使用的矩阵
blastn 11, megablast 28, all others
数据库的有效长度Effective length of the
use zero for the real size
Number of best hits from a region to
off by default, if used a value of 100
is recommended
0 for multiple hit, 1 for single
does not apply to blastn
Effective length of the search
use zero for the real size
Query strands to search against
for blast[nx], and tblastx, 3 is both,
1 is top, 2 is bottom
将结果保存为HTML格式
通过gi号列表,限制搜索范围
Use lower case filtering of FASTA
X dropoff value for ungapped
extensions in bits
0.0 invokes default behavior blastn
20, megablast 10, all others 7
X dropoff value for final gapped
alignment in bits
blastn/megablast 50, tblastx 0, all
PSI-TBLASTN checkpoint file
MegaBlast search
Location on query sequenc
Multiple Hits window size
default if zero (blastn/megablast 0,
all others 40)
Frame shift penalty
OOF algorithm for blastx
Length of the largest intron allowed
in a translated nucleotide sequence when linking multiple distinct
alignments
0 invo a negative
value disables linking.
Number of concatenated queries
for blastn and tblastn
Force use of the legacy BLAST en
Use composition-based statistics for
D or d: default (equivalent to
0 or F or f: no composition-based
statistics&&&&&
1 or T or t: Composition-based statistics as in NAR 29:,
2: Composition-based score adjustment as in Bioinformatics
21:902-911,
&&&&&2005,
conditioned on sequence properties
3: Composition-based score adjustment as in Bioinformatics
21:902-911,
2005, unconditionally
For programs other than tblastn, must either be absent or be D, F
Compute locally optimal Smith-Waterman
alignments
This option is
available for gapped tblastn.
使用说明与示例
程序使用说明
用核酸序列搜索核酸数据库
用蛋白质(氨基酸)序列搜索蛋白质数据库
寻找较高分值的匹配,对较远关系的不太适用
用核酸双链序列理论上的六种框架的所有翻译结果搜索蛋白质数据库,用于新的序列和ESTs的分析
转译搜索序列
用搜索的蛋白质和数据库中核酸的
用于寻找数据库中没有标注的编码区
&&比对命令示例
blastall-p blastn-i U00096.ffn -d ecoli-o U00096_Vs_ecoli_blastn.out -F F
blastall-p blastp-i U00096.faa -d nr -o U00096_Vs_NR_blastp.htm -e 0.01 -b 1 -v 1 -T T
blastall-p blastx-i U00096.ffn -d nr -o U00096_Vs_NR_blastx.htm -e 1e-5 -b 1 -v 1
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

我要回帖

更多关于 比较基因组杂交 的文章

 

随机推荐