请教,David或KEGG 如何对一组基因做kegg pathway分析析

pathway和go功能分析及显著性判断_学习岛pathway和go功能分析及显著性判断发表时间: 0:31:24GO分析
根据挑选出的差异基因,计算这些差异基因同GO 分类中某(几)个特定的分支的超几何分布关系,GO分析会对每个有差异基因存在的GO 返回一个p-value,小的p值表示差异基因在该GO中出现了富集。GO分析对实验结果有提示的作用,通过差异基因的GO分析,可以找到富集差异基因的GO分类条目,寻找不同样品的差异基因可能和哪些基因功能的改变有关。分析根据挑选出的差异基因,计算这些差异基因同Pathway 的超几何分布关系,Pathway分析会对每个有差异基因存在的pathway返回一个p-value,小的p值表示差异基因在该pathway中出现了富集。Pathway分析对实验结果有提示的作用,通过差异基因的Pathway分析,可以找到富集差异基因的Pathway条目,寻找不同样品的差异基因可能和哪些细胞通路的改变有关。与GO分析不同,pathway分析的结果更显得间接,这是因为,pathway是蛋白质之间的相互作用,pathway 的变化可以由参与这条pathway途径的蛋白的表达量或者蛋白的活性改变而引起。而通过芯片结果得到的是编码这些蛋白质的mRNA表达量的变化。从mRNA到蛋白表达还要经过microRNA调控,翻译调控,翻译后修饰(如糖基化,磷酸化),蛋白运输等一系列的调控过程,mRNA表达量和蛋白表达量之间往往不具有线性关系,因此mRNA的改变不一定意味着蛋白表达量的改变。同时也应注意到,在某些pathway中,如EGF/EGFR通路,细胞可以在维持蛋白量不变的情况下,通过蛋白磷酸化程度的改变(调节蛋白的活性)来调节这条通路。所以芯片数据pathway分析的结果需要有后期蛋白质功能实验的支持。如Western blot/ELISA,IHC(免疫组化),over expression(过表达),RNAi(RNA 干扰),knockout(基因敲除),trans gene(转基因)等。基因网络分析目的:根据文献,数据库和已知的pathway寻找基因编码的蛋白之间的相互关系(不超过1000 个基因)。通路和显著性判断MAS系统整合了来源于KEGG、BioCarta和GenMAPP三个公共Pathway数据库的信息,可分析差异基因所在Pathway,以及某个Pathway中基因富集度的显著性水平。通过统计分析,选择合适的计算方法计算通路显著性p-value。在实际的分析中,我们也关注的是以某个p-value阈值筛选后得到的pathway的假发现率,即Fasle Discovery Rate(FDR),以q-value衡量。Pathway功能分析及显著性判断& 对差异表达基因进行Pathway功能分析,并计算Pvalue进行显著性判断,Pvalue越小,表明该pathway变化越显著,并可对每条Pathway通路图进行展示,同时在相应的位置标注差异表达基因根据每两个基因共出现在同一pathway中的次数统计,绘制基因共相关点线图,进而得到不同pathway上基因的关联情况。&& && & & & &基因功能分类及Pathway分析&&GO功能富集分析是判断某个具体的GO term是否富集,也就是在这个term上面映射到的基因数量是否得到一个标准,样本的GO功能分析是基于各自样本得到的差异基因来进行的,通过GO功能富集分析可以了解该样本行使的主要的生物学功能。Pathway功能富集分析同样对实验结果有提示的作用,样本的Pathway功能富集分析同样也是基于该样本的差异基因来进行的,通过Pathway分析可以了解该样本较显著性的代谢通路。多组数据的pathway统计结果聚类分析便于揭示和比较不同处理对样品信号通路的影响。GO功能及富集度分析GO(Gene ontology)注释收集了来源于和NCBI(Geneontology)数据库的信息。GO对基因在Molecular Function、Biological Process和Cellular Component三个角度分别进行分类,列出在GO分析的显著性水平,同时绘制与输入蛋白相关的GOterm的丰度统计饼图、p-value聚类热图、GO-蛋白网络图以及GO中蛋白富集度p-value在GOterm树的关系图等等(见下图)。Gene Ontology可分为分子功能(Molecular Function),生物过程(biological process)和细胞组成(cellular component)三个部分。蛋白质或者基因可以通过ID对应或者序列注释的方法找到与之对应的GO号,而GO号可对于到Term,即功能类别或者细胞定位。功能富集分析: 功能富集需要有一个参考数据集,通过该项分析可以找出在统计上显著富集的GOTerm。该功能或者定位有可能与研究的目前有关。GO功能分类是在某一功能层次上统计蛋白或者基因的数目或组成,往往是在GO的第二层次。此外也有研究都挑选一些Term,而后统计直接对应到该Term的基因或蛋白数。结果一般以柱状图或者饼图表示。相关阅读【统计学】tf检验和统计学意义(p值或sig值)显著性差异转,一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。通过把所得到的统计检定值,与统计学家建立了一些p的含义(标准差,差异显著性),结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,p值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值是将观察结果认为有效即具有总体“显著性”的关系和这种关系中的陷阱,这篇文章继续列举一系列问题,这些问题有助于人们评价并判断某篇论文是否正确合理地使用统计学方法。这个题目是由两篇文章组成的,第一篇已在上期发表。有没有把相关和回归区别开?相关系数(r值)的计算和解释是否正确显著性差异与样本量的关系,小研的老板应该如何来判断满意度的变化到底是抽样误差造成的还是真的有所提升呢?显著性差异是统计学上对数据差异性的评价。这种差异可能因参与比对的数据是来自不同对象的,也可能来自于对象发生了根本性改变。统计学中通常用Z值5组别比较具有显著性差异(p005),171用8。另外,I8还可引起肿瘤组织内中性粒细胞浸润而L具有潜在的抗肿瘤作用。本文结果显示,结核性胸水和恶性胸水中I8含量显著高于漏出液,说明胸膜组织在受到结L核菌或肿瘤细胞侵袭时,产生免5163人阅读
基因芯片分析(4)
基因列表的分析一般都会涉及GO和KEGG分析,Bioconductor提供了很多这方面的R工具包。
选择工作目录,读入上一次分析和保存的数据:
results.sig &- read.csv(&results.lim.7d.csv&, header=TRUE, as.is=TRUE)
head(results.sig)
logFC AveExpr
P.Value adj.P.Val
## 1 254818_at
41.38 7.304e-10 1.169e-05 11.538
## 2 254805_at
30.81 6.095e-09 4.878e-05 10.431
## 3 245998_at
25.44 2.411e-08 9.545e-05
## 4 265119_at
24.07 3.588e-08 9.545e-05
## 5 256114_at
23.92 3.745e-08 9.545e-05
## 6 265722_at -2.913
9.276 -23.91 3.760e-08 9.545e-05
colnames(results.sig)[1] &- &probe_id& ;
genes.sig &- results.sig[, 1]
1 获取AGI、GO和KEGG注释
library(ath1121501.db)
ls(&package:ath1121501.db&)
[1] &ath1121501&
&ath1121501ACCNUM&
[3] &ath1121501ARACYC&
&ath1121501ARACYCENZYME&
[5] &ath1121501CHR&
&ath1121501CHRLENGTHS&
[7] &ath1121501CHRLOC&
&ath1121501CHRLOCEND&
[9] &ath1121501.db&
&ath1121501_dbconn&
## [11] &ath1121501_dbfile&
&ath1121501_dbInfo&
## [13] &ath1121501_dbschema&
&ath1121501ENZYME&
## [15] &ath1121501ENZYME2PROBE& &ath1121501GENENAME&
## [17] &ath1121501GO&
&athALLPROBES&
## [19] &athPROBE&
&ath1121501MAPCOUNTS&
## [21] &ath1121501ORGANISM&
&ath1121501ORGPKG&
## [23] &ath1121501PATH&
&ath1121501PATH2PROBE&
## [25] &ath1121501PMID&
&ath1121501PMID2PROBE&
## [27] &ath1121501SYMBOL&
ath1121501GO为拟南芥基因的GO数据库,ath1121501PATH为KEGG pathway数据库。但不是每一个基因(probeset)都有GO或KEGG注释,哪些基因有注释可以用mappedkeys函数获得:
length(mappedkeys(ath1121501PATH))
## [1] 3018
length(mappedkeys(ath1121501GO))
## [1] 20299
head(mappedkeys(ath1121501PATH))
## [1] &261579_at& &261569_at& &261583_at& &261574_at& &261043_at& &261044_at&
有PATH注释的probesets只有3018个,而有GO注释的有2万多个。
通过ath1121501XXXX获得的数据是AnnotationDbi软件包定义的ProbeAnnDbBimap类型数据,它们可以用as.list转成列表形式。列表内每一个基因的注释内容也是列表形式:
all.path &- ath1121501PATH[mappedkeys(ath1121501PATH)]
class(all.path)
## [1] &ProbeAnnDbBimap&
## attr(,&package&)
## [1] &AnnotationDbi&
as.list(all.path)[1]
## $`261579_at`
## [1] &00190&
转换成列表类型的ProbeAnnDbBimap数据仍然是列表,但PATH和ACCNUM数据是二级列表(列表下只有一级列表),而GO数据是三级列表(列表下还有两级的列表)。所以得先编写get.GO函数,它把as.list产生的GO三级列表转成二级结构,和AGI和KEGG的列表类似,方便后面的统一处理:
get.GO &- function(the.keys, goList){
results &- NULL
for (i in 1:length(the.keys)){
n &- length(goList[[i]])
info &- NULL
for(j in 1:n){info &- c(info, goList[[i]][[j]]$GOID)}
info &- list(info)
names(info) &- the.keys[i]
results &- c(results, info)
使用这个函数和下列代码就可以获得AGI、GO和KEGG注释:
library(plyr)
results.anno &- results.sig[,1:2]
for(i in 1:3){
anno &- switch(i, ath1121501ACCNUM, ath1121501GO, ath1121501PATH)
anno.label &- switch(i, &AGI&, &GO&, &PATH&)
mapped.probes &- mappedkeys(anno)
mapped.present &- intersect(genes.sig, mapped.probes)
mapped.anno &- as.list(anno[mapped.present])
if(anno.label==&GO&) mapped.anno &- get.GO(mapped.present, mapped.anno)
mapped.anno &- llply(mapped.anno, unique)
mapped.anno &- ldply(mapped.anno, paste, collapse=&; &)
colnames(mapped.anno) &- c(&probe_id&, anno.label)
results.anno &- merge(results.anno, mapped.anno, by.x = &probe_id&, all = TRUE)
上面代码有两点要注意:
switch()函数使用。switch()是非常神奇的条件转向开关函数,它的参数(列表)可以是各种类型,变量、表达式、函数等都可以使用。列表到数据框类型数据的转换,我们使用了plyr软件包的llply和ldply函数。plyr是很著名的软件包,用于数据糅合。这不属于本节的讨论范围,先不介绍,请自行学习使用。
由于探针id是唯一的,上面的代码用它作为关键字糅合数据。得到的结果是数据框:
str(results.anno)
## 'data.frame': 740 obs. of
5 variables:
$ probe_id: chr
&245015_at& &245042_at& &245088_at& &245196_at& ...
1.37 -1.13 -1.62 -1.71 1.44 ...
&ATCG00490& &AT2G26540& &AT2G39850& &AT1G67750& ...
&GO:0006091; GO:0006354; GO:0009737; GO:0015977; GO:0015979; GO:0018119; GO:0046686; GO:0016020; GO:0005618; GO:0009507; GO:0009&| __truncated__ &GO:0006779; GO:0006780; GO:0033014; GO:0009507; GO:0004852& &GO:0008152; GO:0006508; GO:0043086; GO:0005576; GO:0009505; GO:0004252; GO:0042802& &GO:0008150; GO:0005576; GO:0030570& ...
NA NA NA &00040& ...
这样每一个探针都得到了对应的AGI、GO和KEGG途径注释(如果有)。其他类型数据如Pubmed ID可以使用类似方法获得,但编程之前得先了解它们的数据结构,最直接的方法就是使用head,summary和str等函数查看。
得到的结果用write.csv或其他存盘函数保存。
2 GO和KEGG富集分析
Bioconductor中有不少软件包可以进行GO和KEGG统计分析和作图,如GOstats和KEGGgraph,但我不建议使用它们。
对于这类分析,我推荐使用另外一个不是R软件包的网络分析软件:Cytoscape。它是免费的开源软件,由多所大学和几个公司联合开发和维护,已经逐渐成为网络分析的标准工具,软件网址为:
R软件包RCytoscape可以把R的分析结果推送到Cytoscape,充分利用R的统计功能和Cytoscape的可视化能力。但是RCytoscape不一定能跟上Cytoscape的软件更新步伐,所以最好还是把R分析的结果保存成文件,再用Cytoscape直接分析。
事实上,如果使用Cytoscape进行GO和KEGG富集或网络分析,我们只需要获得AGI列表,而不需要获得GO和KEGG注释。
3 Session Info
sessionInfo()
## R version 3.1.0 ()
## Platform: x86_64-pc-linux-gnu (64-bit)
## locale:
[1] LC_CTYPE=zh_CN.UTF-8
LC_NUMERIC=C
[3] LC_TIME=zh_CN.UTF-8
LC_COLLATE=zh_CN.UTF-8
[5] LC_MONETARY=zh_CN.UTF-8
LC_MESSAGES=zh_CN.UTF-8
[7] LC_PAPER=zh_CN.UTF-8
[9] LC_ADDRESS=C
LC_TELEPHONE=C
## [11] LC_MEASUREMENT=zh_CN.UTF-8 LC_IDENTIFICATION=C
## attached base packages:
## [1] parallel
grDevices utils
## [8] methods
## other attached packages:
[1] plyr_1.8.1
ath1121501.db_2.14.0
org.At.tair.db_2.14.0
[4] RSQLite_0.11.4
AnnotationDbi_1.27.3
[7] GenomeInfoDb_1.1.2
Biobase_2.25.0
BiocGenerics_0.11.0
## [10] zblog_0.1.0
## loaded via a namespace (and not attached):
## [1] evaluate_0.5.3
formatR_0.10
IRanges_1.99.2
## [5] Rcpp_0.11.1
S4Vectors_0.0.2 stats4_3.1.0
stringr_0.6.2
## [9] tools_3.1.0
参考知识库
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:133667次
积分:2136
积分:2136
排名:第14110名
原创:78篇
评论:26条关注今日:12 | 主题:103377
微信扫一扫
扫一扫,下载丁香园 App
即送15丁当
请教,David或KEGG 如何对一组基因做pathway分析
页码直达:
这个帖子发布于4年零44天前,其中的信息可能已发生改变或有所发展。
问题已解决悬赏丁当:5
弱问,已知一组基因的名字,如何做pathway分析?(1)如何才能得到如下图所示的类似结果(操作步骤是什么,用David或者KEGG 如何分析一组基因)?(2)如何分析结果?怎样从pathway分析结果可以知道这组基因是 相似/相关/相同 功能的?注:我的数据是 the yeast amino acid (AA) starvation dataset. Saccharomyces cerevisiae response to stress by AA starvation is measured at time points 0.5 h, 1 h, 2 h, 4 h, and 6 h。 比如有一组基因如下,如何做pathway分析?YLR348CYJL034WYBR072WYJR073CYOR389WYDR077WYNL043CYLR158CYLR160CDavid,KEGG
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
emanlee edited on
收起全部有料回复
丁香园准中级站友
可以参考David在nature protocols上的文章。见Huang DW, Sherman BT, Lempicki RA. Systematic and integrative analysis of large gene lists using DAVID Bioinformatics Resources. Nature Protoc. ):44-57.
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
我还真用过,呵呵 不过是自己摸索的 不一定对!我试试分析你的看看啊
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
楼主 你的基因名称可以换成NCBI识别那种吗?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
我想可以用以下这个转换为NCBI的ID:或者,查 gene_association.sgd ,其中可能有这种ID(我没有具体去做)。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
如何分析一组基因分布到那个pathway呢?用KEGG?但是如何将这组基因导入KEGG呢?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园准中级站友
可以参考David在nature protocols上的文章。见Huang DW, Sherman BT, Lempicki RA. Systematic and integrative analysis of large gene lists using DAVID Bioinformatics Resources. Nature Protoc. ):44-57.
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
plsdd 如何分析一组基因分布到那个pathway呢?用KEGG?但是如何将这组基因导入KEGG呢?KEGG提供文件上传功能的
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
晓娣 我还真用过,呵呵 不过是自己摸索的 不一定对!我试试分析你的看看啊 你好,我现在也想对一些基因做信号通路分析,看到你回复的帖子,想请教你具体的操作方法,期待你的回复,不胜感激!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
同求助,顶。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
请问,在DAVID里获取什么信息?如何把所获取的信息用于KEGG分析?不胜感激,多谢解答。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
同求助,顶!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
使用Start analysis下的upload,分四步导入基因1、paste a list
比如楼主的YLR348CYJL034WYBR072WYJR073CYOR389WYDR077WYNL043CYLR158CYLR160CStep 2: Select Identifier知道的是什么类型的identity就选择该选项,不确定就选择no sureStep 3: List Type选择 基因列表或者backgroundstep4
提交基因列表,就是subumit list如果没有确定基因代码,就会出现一下图表You are either not sure which identifier type your list contains, or less than 80% of your list has mapped to your chosen identifier type. Please use the Gene Conversion Tool to determine the identifier type. Option 1: Convert the gene list to
DAVID (Default)
AFFYMETRIX_3PRIME_IVT_ID
AFFYMETRIX_EXON_GENE_ID
AFFYMETRIX_SNP_ID
AGILENT_CHIP_ID
AGILENT_ID
AGILENT_OLIGO_ID
ENSEMBL_GENE_ID
ENSEMBL_TRANSCRIPT_ID
ENTREZ_GENE_ID
FLYBASE_GENE_ID
FLYBASE_TRANSCRIPT_ID
GENBANK_ACCESSION
GENOMIC_GI_ACCESSION
GENPEPT_ACCESSION
ILLUMINA_ID
OFFICIAL_GENE_SYMBOL
PROTEIN_GI_ACCESSION
REFSEQ_GENOMIC
REFSEQ_MRNA
REFSEQ_PROTEIN
REFSEQ_RNA
UCSC_GENE_ID
UNIPROT_ACCESSION
UNIPROT_ID
UNIREF100_ID
WORMBASE_GENE_ID
WORMPEP_ID
Option 2: --&选择submit conversion list,就会出现转换为DAVID可以识别的identityGene Accession Conversion ToolHelpGene Accession Conversion Statistics Conversion SummaryID CountIn DAVID DBConversion9YesSuccessful0YesNone0NoNone0AmbiguousPendingTotal Unique User IDs: 9Summary of Ambiguous Gene IDsID CountPossible SourceConvert AllAll Possible Sources For Ambiguous IDsAmbiguous IDPossiblityConvert FromToSpeciesDavid Gene NameYOR389WSaccharomyces cerevisiaePutative uncharacterized protein YPL278C; Uncharacterized protein YOR389WYJL034WSaccharomyces cerevisiae78 kDa glucose-regulated protein homologYLR348CSaccharomyces cerevisiaeMitochondrial dicarboxylate transporterYLR158CSaccharomyces cerevisiaeL-asparaginase 2YNL043CSaccharomyces cerevisiaePutative uncharacterized protein YNL043CYLR160CSaccharomyces cerevisiaeL-asparaginase 2YBR072WSaccharomyces cerevisiaeHeat shock protein 26YJR073CSaccharomyces cerevisiaeMethylene-fatty-acyl-phospholipid synthaseYDR077WSaccharomyces cerevisiaeCell wall protein SED1
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
保持基因列表,重新upload就可以出现一系列的功能分析,包括go分析 pathway等
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
请问楼主,现在你的问题已经解决了吗?作为新入手DAVID软件的我,也遇到这个问题的,可否回答我一下。第一:不确定基因代码是什么意思?(楼上所说的)第二:identifier type必须选择吗?第三:我把你上面的基因输进去后出现楼上所说的情况,然后自己转换的结果如下。。转换以后该怎么办?我把转换后的ID,也就是下图中最后一栏粘贴到txt中,然后重新在进行第一次的步骤,结果还是同前,怎么办?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
lghyz2004 保持基因列表,重新upload就可以出现一系列的功能分析,包括go分析 pathway等前辈,可以百忙中回答一下我的问题否?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
出走的淡水鱼 请问楼主,现在你的问题已经解决了吗?作为新入手DAVID软件的我,也遇到这个问题的,可否回答我一下。第一:不确定基因代码是什么意思?(楼上所说的)第二:identifier type必须选择吗?第三:我把你上面的基因输进去后出现楼上所说的情况,然后自己转换的结果如下。。转换以后该怎么办?我把转换后的ID,也就是下图中最后一栏粘贴到txt中,然后重新在进行第一次的步骤,结果还是同前,怎么办?我知道用kobas可以分析,用的是基因ID,第二列,基因ID试试。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
出走的淡水鱼 请问楼主,现在你的问题已经解决了吗?作为新入手DAVID软件的我,也遇到这个问题的,可否回答我一下。第一:不确定基因代码是什么意思?(楼上所说的)第二:identifier type必须选择吗?第三:我把你上面的基因输进去后出现楼上所说的情况,然后自己转换的结果如下。。转换以后该怎么办?我把转换后的ID,也就是下图中最后一栏粘贴到txt中,然后重新在进行第一次的步骤,结果还是同前,怎么办?1.不确定基因代码可能指的是不确定是哪个数据库的基因ID或者是探针编号,我试过了是ensembl数据库的,你平时多留意看看NCBI或者ensembl应该有印象。。实在不行一个个选项试也能出来的~2.就是基因编号或者代码的意思,选对了数据库就可以了3.据我的经验来看应该是基因数量太少了做不了富集我试了下结果是这样的,点chart进去没有基因富集,就我的经验来看应该是基因数太少了,放个几十上百基因进去肯定就有啦~
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
收藏。。。。。。。。。。。。。。。。。。。。。。。。。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园查看: 4847|回复: 5
积分437&威望437 &包包1012 &
积分437&威望437 &包包1012 &
芯片数据的生物学分析是大家都感到头疼的问题,对着大量差异表达的基因无从下手,不知这些基因的功能,不知参与了哪些pathway,DAVID可在这些方面可以提供许多有价值的信息。我现在在学习生物学软件David,想利用它来对miRNA预测到的多个靶基因进行一个功能分类,为下一步实验做准备。但是一个人孤军奋战,实在是收效甚微,现在发个帖子,寻战友一起学习。- t* I. \7 m: H
主页:8 H8 e# ~+ i5 Z
不知道哪位对于这个熟悉那?
欢迎参与讨论
总评分:&威望 + 2&
包包 + 10&
积分1199&威望1199 &包包4174 &
积分1199&威望1199 &包包4174 &
以前利用David做过表达谱的分析,但只是简单的分析,包括差异基因的GO和KEGG分析,然后就是ID convert。具体还有什么其他的功能没有学会啊。
欢迎参与讨论
总评分:&威望 + 2&
包包 + 10&
生活要简单一点,生命会长一点!
积分416&威望416 &包包1859 &
积分416&威望416 &包包1859 &
标记一下、、
积分416&威望416 &包包1859 &
积分416&威望416 &包包1859 &
挺好的web tool 但是现在似乎不能出漂亮的图了尤其GO BPchart。。。
欢迎参与讨论
总评分:&威望 + 2&
包包 + 10&
积分25&威望25 &包包155 &
积分25&威望25 &包包155 &
积分493&威望493 &包包338 &
积分493&威望493 &包包338 &
用过DAVID 但我聚类出来的不是特集中 不知道是样本有问题还是怎么样6 u% D/ V8 T5 ?
桑不起啊 很少的基因在一条通路上
欢迎参与讨论
总评分:&威望 + 2&
包包 + 10&
Powered by小木虫 --- 500万硕博科研人员喜爱的学术科研平台
&&查看话题
怎么做基于KEGG的生物通路富集分析?
我现在在做miRNA靶基因预测,看了几篇文章,都是先在几个预测网站上预测,然后找共同的做一个基于KEGG的生物通路富集,但是他们给出的网址都是genomenet的,我也没有找到那个网站的说明或手册之类的,不知道怎么分析。请问有哪位大虫知道吗?感激不尽!最近老板就要结果了
谢谢,不过貌似也没有说怎么由基因找通路啊
这个只是皮毛介绍一下KEGG,具体操作还要自己摸索的,用文字不好描述,我还是会一点的,就是先将基因的序列下载下来,上传到KEGG,KEGG会将基因的信号通路网址信息发到你邮箱里,你就可以看到你的目的基因在那些信号通路里有,我有篇这方面的文章发在蚕业科学上,不过刚接受
我现在试了一下,貌似可以了,是直接把基因列表上传到 search pathway 里面,然后就有相关通路了,没有说要邮箱,不知道对不对。还有就是对于这个富集结果怎么样计算P值来看它的显著性呢?
对于计算显著性的问题有好几种 你说的是t检验 这个网上资料好多的 也有相关软件比如SPSS 楼主自己学习一下吧:D
好的,多谢帮助,有问题了还要向你请教:hand:
请问里面那些通路有没有办法导出来啊?
这个,“通过ftp下载人类hsa04010相关的所有数据”,具体怎么做啊,下载所需的ftp 的网址在哪找得到?
想看看关于 KEGG的Object Identifier&&的内容,请楼主赐教
研究生必备与500万研究生在线互动!
扫描下载送金币
浏览器进程
打开微信扫一扫
随时随地聊科研

我要回帖

更多关于 kegg pathway富集 的文章

 

随机推荐