怎样用usearch进行otu聚类是什么

  分析模块输入每个样品经過Trimmomatic剪切和过滤、FLASH拼接后的FASTA序列文件,运行得到OTU Table文件和OTU代表序列文件

Units)是在系统发生学或群体遗传学研究中,为了便于进行分析人为给某一个分类单元(品系,属种、分组等)设置的同一标志。要了解一个样本测序结果中的菌种、菌属等数目信息就需要对序列进行归類操作(cluster)。通过归类操作将序列按照彼此的相似性分归为许多小组,一个小组就是一个OTU可根据不同的相似度水平,对所有序列进行OTU劃分通常在97%的相似水平下的OTU进行生物信息统计分析。

  分析模块封装了Usearch软件具体分析步骤如下所示:

?   Usearch -derep_prefix命令:对优化序列提取非重複序列,便于降低分析中间过程冗余计算量

-cluster_otus命令:按照97%相似性对非重复序列(不含单序列)进行OTU聚类是什么,在聚类是什么过程中去除嵌合体得到OTU代表序列文件。

-usearch_global命令:将所有优化序列mapOTU代表序列选出与OTU代表序列相似性在97%以上的序列,生成OTU

  注:根据需要在分析模块参数设置界面,动态增加或减少输入文件并设置对应序列文件的样品名称。

  相关文献如下所示:

我要回帖

更多关于 聚类 的文章

 

随机推荐