如何在kegg数据库网站中DIY标记感兴趣基因

&KEGG, 简称京都基因组百科全书,包含了许多的数据库,对于研究基因功能来说,KEGG orthology 数据库是最基本的一个数据库;
KEGG Orthology 简称KO, 对于每个功能已知的基因,会把和其同源的基因所有基因都归为一类,就是每一个KO, 并赋予一个K number, 用该基因的功能作为这个KO的功能;
基于同源基因具有相似功能的假设,把每个基因的功能进行了扩充,对于某个物种中功能研究的很清楚的基因,在不同的物种间搜寻该基因的同源基因,将这些同源基因定义为一个orthology, 用该基因的功能作为该orthology 的功能;这样就将对于不同物种基因功能的研究都利用起来,提供了一个全面的研究基因功能的数据库
举一个例子,对于 K00161 这个K number 来说,对应的同源基因的列表可以从KEGG的官网查询得到
打开这个链接 http://www.genome.jp/kegg/ko.html , 在查询的文本框中输入K number, 如下图所示:
点击Orthology table 按钮,跳转到下面的链接
http://www.kegg.jp/kegg-bin/view_ortholog_table?orthology=K00161
在该链接中,可以看到这个KO下对应的所有同源基因
&从下拉列表中,可以查询对应分类的同源基因,如之显示动物中的同源基因;
对于已知的基因,可以直接在数据库中检索得到对应的功能,那么对于新发现的基因,如何利用KO数据库来研究其功能呢?
根据同源基因的定义,序列相似度在80%以上的就定义为同源基因,同样的,对于功能未知的基因,只需要根据序列比对查找对应的功能已知的同源基因就可以了
但是现在没法免费下载得到KEGG Gene对应的序列了,好在KEGG官网提供了一个在线的工具,BlastKOALA
这个工具基于blast 比对,将输入的基因序列和KEGG Gene 数据库中的序列去比对,查找最佳匹配的一个gene, 将该基因对应的K number 赋予查询的基因
地址如下:http://www.kegg.jp/blastkoala/
首先在文本框中输入带查询的基因的序列
&第二步设置对应的物种信息,减少查询的物种范围
第三步根据选择用于检索的基因集数据库
最后输入邮箱地址,提交任务就可以了
首先会给你的邮箱发一封邮件,你必须点击这个邮件中的链接才能开始工作,当结束后,会再发一封邮件给你;
KO 数据库只是研究基因功能的一个基础数据库,KEGG中还包含其他的基于基因功能构建的数据库,如Pathway, Brite, Module& 数据库等,只有对KO数据库有一个清晰的认识,才能够去理解这些数据库。
阅读(...) 评论()|/|/|/|/|/|
//|//|//|//|//|
[原创]KEGG数据库使用攻略之我见
从...获得的知识和帮助简直太多了,也希望我的一点点积累能够回报广大...ers!KEGG网址 >下载MAPK通路的xml格式的数据,并保存为xml文件,hsa04010.xml2、使用VisANT软件(http://visant.bu.edu/)进行分析,步骤如下:(1)打开后,点击左边按钮Clear,清除以前的文件(2)点File―open:打开hsa04010.xml文件,这时出现MAPK调控网络。(3)点File―Export as Tab-Delimited File―All:之后将在网页上出现如下格式的数据:K04463&&K04464&&1&&MK02308&&K04426&&1&&MK04371&&K04376&&1&&MK04375&&K04379&&1&&M将此数据copy下来,命名为KO2KOppi这里的K0……编号意思是:KO(KEGG Orthology) ID(4)打开表:hsa04010.orth,将其中的分号;全部替换为Tab符号,将全部的逗号替换为Tab符号,之后用xls打开。除去所有没有KO编号对应的行,我们得到了KO编号对gene name的表,命名为KO2GENE。(5)通过表KO2KOppi与表KO2GENE对应后,可以得到gene2gene的互作数据。(6)使用这个gene2gene互作的这个表可以确定要研究的互作数据是不是在MAPK通路中。新上传了附件是以上所需要的所有数据及软件,因一次不能全传上visant见楼下,java虚拟机除外,请对此方法认同的战友投上一票
hsa04010.rar (71.07k)benefit a lot!!! Thanks!请问VisANT软件这个软件怎么装啊我的电脑上怎么装不上去啊谢谢yueyueniao530 wrote:请问VisANT软件这个软件怎么装啊我的电脑上怎么装不上去啊谢谢这个我直接下来就能用, 不用安装,不过你电脑必须首先安装了java虚拟机,如果没有可以发信向我要。goodluck!mawencai2001我却是没有JAVA虚拟机 能否给我发一个 谢谢邮箱是zp_谢谢啊到这里下>微软提供的小巧些yueyueniao530 wrote:mawencai2001我却是没有JAVA虚拟机 能否给我发一个 谢谢邮箱是zp_谢谢啊不好意思啊
我用126邮箱发不过去,加我qq
4)打开表:hsa04010.orth,将其中的分号;全部替换为Tab符号,将全部的逗号替换为Tab符号,之后用xls打开。除去所有没有KO编号对应的行,我们得到了KO编号对gene name的表,命名为KO2GENE。请问hsa04010.orth,是怎么得到的?(3)中“KO2KOppi”文件保存时的扩展名是什么?非常感谢楼主贴出此教程!yuandong wrote:4)打开表:hsa04010.orth,将其中的分号;全部替换为Tab符号,将全部的逗号替换为Tab符号,之后用xls打开。除去所有没有KO编号对应的行,我们得到了KO编号对gene name的表,命名为KO2GENE。请问hsa04010.orth,是怎么得到的?(3)中“KO2KOppi”文件保存时的扩展名是什么?非常感谢楼主贴出此教程!hsa04010.orth是在第一步中,通过ftp下载人类hsa04010相关的所有数据。找到hsa04010.gene这个文件,其中包含的就是geneid,gene name,gene的描述,通过这个表就能确定哪个基因是在这个通路中了。下载了所有的hsa04010数据得到的。中“KO2KOppi”文件保存时的扩展名是什么?保存为txt文件就可以,为了之后导入到sql中进行批量处理。感谢对我方法的认同。附上Visant软件
visant.rar (274.32k)
您的位置: &&you have been blocked做过转录组项目的小伙伴肯定都知道KEGG数据库,一条条的通路、五颜六色的图片有木有很好看,但是你真的了解KEGG数据库吗?今天小R就带大家一览KEGG数据库的风采。1.KEGG数据库简介KEGG由日本京都大学生物信息学中心的Kanehisa实验室于1995年建立。是国际最常用的生物信息数据库之一,以“理解生物系统的高级功能和实用程序资源库”著称。&KEGG数据库是一个有助于了解高级功能和生物学系统的工具。实际上,KEGG通过对生物学过程进行计算机化处理,构建模块并绘制图表,从而对基因的功能进行系统化的分析。KEGG也是将基因组中的一系列基因用一个细胞内的分子相互作用网络连接起来的过程,如一个通路或是一个复合物,通过他们来展现更高一级的生物学功能。目的是从基因组和分子水平上了解高一级层次的功能和与之作用的生物信息资源。KEGG数据库中还包含疾病和药物信息等。2.KEGG数据库分类KEGG数据库是一个综合数据库,大致分为系统信息、基因组信息、化学信息和健康信息四大类,共包含了17个主要的数据库。在网页上主要用颜色区分数据库分类。&KEGG PATHWAY数据库中收集了有关新陈代谢、基因组信息过程、环境信息过程的手工及计算机绘制通路图。GENES数据库中收集了所有基因组上基因的信息。LIGAND数据库包含酶分子和化学化合物结构的信息。表1.KEGG数据库分类表3.KEGG数据库标识符KEGG是一个高度整合的数据库。实际上,KEGG数据库可以看做是利用计算机对生物系统进行模拟,生物学的对象以及他们在分子、细胞和生物体水平上的关系都被计算成一个独立的数据库记录。每个数据记录都成为KEGG对象。除了基因和酶使用标准的命名(基因命名使用locus_tags、酶使用EC命名)外,每种数据对象都有一个标识符。KEGG对象命名原则为一个5位数的号码加一个大写字母作为前缀。例如,C00047代表懒氨酸,K04527代表胰岛素受体,hsa05210代表结肠癌通路。表2.KEGG数据库标识符表4.KEGG通路数据库KEGG通路数据库中包含新陈代谢、遗传信息加工、环境信息加工、细胞过程、生物体系统、人类疾病和药物开发七种通络。其中新陈代谢通路是手工画出来的,其余几大分类都是通过计算机进行绘制的。近几年KEGG通路得到了一个十分显著的扩展,已经增加了50多条新通路,大部分是关于信号转导、分子过程和人类疾病的通路。然而传统的KEGG代谢通路图仍然使用的是KGML(KEGG XML)版本。现在的用户交互方面新增了俩个特点,第一个特点是提供了一个全面的通路图,下面的SVG图片中结合了120个已知的通路图。每个节点都代表一个化合物,每一条线都代表连接俩个化合物之间的一系列反应。新的KEGG代谢通路图使用户可以浏览和比较全部的代谢系统。KGML用户也可以通过更简单的操作找到新增的KEGG代谢通路图。另一个特点就是KEGG MODULE,一个收集了通路modules和其他功能的全新数据库。通路modules是一个更小的亚通路,人工定义了这些连续的反应步骤,操纵子或是其他的调控单元等。图1.KEGG代谢通路总览5.KEGG的有趣功能KEGG MapperKEGG Mapper,一个用于KEGG pathway、Brite和module绘图的工具。可用于集合和解释大量的数据。一个完整的KEGG&mapping过程类似于一个基因组包含的基因参与了organism-specific&versions的pathway,想看在转录组水平这些上调或下调表达的基因参与哪些pathways。Mapping的过程可以看做是将待分析数据和KEGG数据库中的已知的数据进行一系列的操作。KEGG Mapper为用户提供了一个KEGG绘图的界面,当前的KEGG Mapper功能有七个工具组成(见表3)。表3.KEGG Mapper 工具其中3个基本的工具(Search Pathway,Search Brite和Search Module)用于从已知的数据集中查询数据。高级的工具包括和适用于查询这些数据的组成及它们的属性,例如,基因是上调表达还是下调表达或是这个基因与哪个疾病有关。可以利用和工具对通路的某个过程进行着色。工具可着色的方式有两种,一种是对其进行标色或是在通路图上增加一个三维的柱子。以图为例,图为基因参与癌症相关通路,在通路图上对其上调或者下调表达的基因增加了三维柱子。图通路图基因组比较与结合在中可获得的生物体和环境样本数据,现在可以利用和数据库把这些不同的数据绘制在同一张图片中。用户可以在页面中找到这个功能。例如可以利用这个功能比较不同生物体的代谢能力,可以检查宿主和共生体、宿主和病原菌以及宿主和微生物之前的相互联系。图3.比较人的基因组和大肠杆菌基因组的代谢通路(人的代谢通路标绿色,大肠杆菌的代谢通路标粉色,共有的代谢通路标蓝色)参考文献[1] Minoru Kanehisa, Susumu Goto, Yoko Sato,&et al.&KEGG for integration and interpretation of large-scale molecular data sets[J].&Nucleic Acids Research,2011,10.[2] Minoru Kanehisa, Susumu Goto, Masahiro Hattori, et al.&From genomics to chemical genomics: new developments in KEGG[J].&Nucleic Acids Research,2006.[3] Minoru Kanehisa, Michihiro Araki, Susumu Goto, et al.&KEGG for linking genomes to life and the environment[J] Nucleic Acids Research,2008.长按识别指纹加关注为您的科研保驾护航百迈客基因科技(BMK_product)
 文章为作者独立观点,不代表大不六文章网立场
BMK_product基于高通量测序技术和生物信息技术,开展以科研外包服务、分子诊断服务和分子育种服务为主体的业务方向热门文章最新文章BMK_product基于高通量测序技术和生物信息技术,开展以科研外包服务、分子诊断服务和分子育种服务为主体的业务方向&&&&违法和不良信息举报电话:183-
举报邮箱:Copyright(C)2017 大不六文章网

我要回帖

更多关于 kegg数据库本地化 的文章

 

随机推荐