需求一个蛋白质的氨基酸序列数据集群。

数据分析服务_生物吧_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:79,601贴子:
数据分析服务收藏
1. 蛋白质组学 基于质谱的蛋白质鉴定软件开发很多的研究工作表明,当前基于质谱数据的蛋白质鉴定软件,如Sequest和Mascot,仍然存在非常高的假阳性率,这样的结果对于后续分析工作的准确性会产生非常大的影响。我们设计了一种新的统计学打分函数,在使用质核比信息的同时,还充分利用了谱峰强度的信息,并在此基础上开发出了一种基于这种打分策略的蛋白质鉴定软件。2)差异表达蛋白注释以及生物学功能分析通过常规的质谱鉴定方法可以得到在不同的生理条件下或者在不同的细胞器中的差异蛋白质组分。我们可以对其进行包括基因本体论注释(Gene Ontology)、生物学通路注释(KEGG pathway)、蛋白质网络分析、翻译后修饰在内的多种功能分析方法,帮助科研人员从中挖掘出有价值的生物学信息,有效提高其发表科研论文的效率。
3)识别与重大疾病相关的生物标记物(biomarker)实现疾病的早期诊断分子诊断就是应用分子生物学方法检测患者体内遗传物质的结构或表达水平的变化而做出诊断的技术,蛋白质就是一种重要的诊断材料。识别有效的生物标记物是分子诊断是否有效的一个重要环节。生物标志物就是一系列的生物学指标,通常在血液,尿液或组织样本中检测到,它们可以用来对某个疾病进行风险预期评估。另外,生物标志物除了用于临床前研究或临床诊断,还在某些疾病的早期治疗中起到重要的作用。高通量的质谱技术为疾病的早期诊断提供了可能,但是对于包含了上万个谱峰的质谱数据而言,通过机器学习方法从中识别出与疾病相关的生物标记物,构建准确的预测模型就显得极其重要。在算法方面,我们主要着重于特征选择算法的使用和预测模型的设计。特征选择方法针对预处理后的谱峰进行筛选,剔除相关性差或冗余的指标,提取出与疾病相关性非常好,具有疾病预警能力的指标**(即疾病相关的生物标记物)用于后面的预测模型的设计。预测模型的设计就是利用训练样本对分类器进行优化,通过验证和完善,最后应用到新样本的分类上,即判断测试样本所患疾病类型以及评估患病风险。4)定制蛋白质结构预测方案蛋白质结构预测的方法很多,但主要可以分为同源模建法、折叠识别法以及从头预测法三个大类。对于一条待预测序列,要想得到一个预测相对较为准确的三维结构,则需要根据序列自身的一些特性,选择适当的方法。我们会根据客户的问题特异性,提供一套完备的结构预测方案,并给出预测结构的置信度。同时结合具体的研究问题,还能够进行生物学功能与蛋白质结构关联的分析。
5)蛋白质设计经过漫长的进化过程,自然界筛选出了大量的蛋白质,但这些天然蛋白质只有在自然条件下才能发挥最佳功能。我们既可以预测特定氨基酸序列的结构和功能,同时也可以反其道而行之,根据特定的生物功能,设计蛋白质的氨基酸序列和结构。创造或者改造出有应用价值的蛋白质分子。 2. 第二代测序数据分析
服务内容 1)全基因组重测序。包括对测序结果的数据进行统计分析,将序列片段定位到基因组上,SNP位点的检测。 2)表观遗传学分析。主要侧重于甲基化方面的研究,包括基因组整体水平的甲基化检测以及特异位点的甲基化检测。 3)转录组分析。RNA-seq数据的注释,内含子区域表达的分析,基因间区域表达的分析以及文库间差异表达基因的比较。 3、生物芯片数据分析
1)生物芯片探针设计。生物芯片探针设计的目的在于:经过计算方法优化后的探针能够在检测到更多的生物分子的同时,保证 有较高的检测可靠性,即同时兼顾覆盖率和准确率两个方面,对于高通量的检测这一点更是至关重要的。我们将根据客户对于芯 片的使用需求,采取有针对性的探针设计策略。 2)分析基因或者样本之间的相互关系,从而推测未知基因的功能或者发现未知的肿瘤类型,使用的统计方法主要是聚类分析 (无监督学习) 3)基因芯片可用于监测基因在不同组织样本中的表达差异,如在正常细胞和肿瘤细胞中,那么以某些在不同样本中表达差异显 著的基因作为标记物,通过支持向量机,贝叶斯网络等机器学习算法(有监督学习)就可以建立有效的疾病诊断模型。在建立模 型之前,我们需要进行基因筛选,选取那些在待检测的样本中表达差异显著的基因。目前常用的基因筛选方法有t检验、回归模
型、非参数t检验、Wilcoxon秩和检验等统计学方法。
4)构建基因调控网络。个体的生长发育、细胞或者组织的生理功能发挥,往往是一个或几个功能基因共同作用的结果。基因表 达谱芯片可同时检测成千上万个基因的表达,从而使得人们有可能对细胞或组织在某一特定时间或者空间下所有基因的表达进行 检测,我们可以根据这种数据来重构细胞在某个时空阶段的调控网络。在基因本体论(Gene Ontology),KEGG生物学通路,疾 病相关和肿瘤相关等多个层面上对基因进行注释和统计学分析。 4、生物大分子结构与功能分析
1)定制蛋白质结构预测方案 蛋白质结构预测的方法很多,但主要可以分为同源模建法、折叠识别法以及从头预测法三个大类。对于一条待预测序列, 要想得到一个预测相对较为准确的三维结构,则需要根据序列自身的一些特性,选择适当的方法。我们会根据客户的问题 特异性,提供一套完备的结构预测方案,并给出预测结构的置信度。同时结合具体的研究问题,还能够进行生物学功能与 蛋白质结构关联的分析。 2)蛋白质设计 经过漫长的进化过程,自然界筛选出了大量的蛋白质,但这些天然蛋白质只有在自然条件下才能发挥最佳功能。我们既可 以预测特定氨基酸序列的结构和功能,同时也可以反其道而行之,根据特定的生物功能,设计蛋白质的氨基酸序列和结 构。创造或者改造出有应用价值的蛋白质分子。
3)计算机辅助药物设计 传统的药物设计主要通过筛选大量的天然化合物、已知底物的类似物等方式来确定前导化合物,研发周期长、花费高,同 时效果也并不是十分理想。计算机辅助的药物设计可以充分利用目标蛋白质的三维结构,有针对性地进行虚拟筛选,有效 地缩短了药物研发周期,并降低了消费成本。 以上都是最常见和数据分析,还有可以补充的吗?
第二代测序里面还有蛋白质-核酸互作的ChIP-Seq呢,另外除了基因组重测序以外还有基因组的从头测序也算另外转录组分析里面除了区域间的,还有利用SAGE及其变种技术的标签基因表达然后第二代测序还有做miRNA的研究。另外二代测序在SNP分析领域还可以进行分子单体型构建和比对
登录百度帐号我的游戏推荐游戏
后查看最近玩过的游戏
为兴趣而生,贴吧更懂你。或求助:癌细胞糖蛋白的提取? - 生物科学 - 小木虫 - 学术 科研 第一站
&& 查看话题
求助:癌细胞糖蛋白的提取?
求助癌细胞糖蛋白如何提取?如何提取不同细胞器的糖蛋白?有没有相关的参考文献求链接。谢谢!
我建议楼主在设计分离提纯目的蛋白质的实验流程时,先把目的蛋白质自身的理化性质弄清楚,然后根据目的蛋白质的理化性质来分离提纯蛋白质,分析蛋白质的理化性质的方法,至少蛋白质的pI和相对分子量应该知道吧,不然有什么依据来作分离提纯哪?
下文分为三个部分:
一、蛋白质分离提纯前的准备工作(包括生物信息学工作和基因表达工作)
1.确定蛋白质的具体来源。
(1)确定要分离的蛋白质的细胞来源和组织来源。先培养细胞和分离细胞和组织成分。分离细胞用流式细胞仪很容易,尤其是把肿瘤细胞从非肿瘤细胞和肿瘤细胞的群体中中分离出来,参考:
MMB 263-Flow Cytometry Protocols 2E(with contents)
http://emuch.net/bbs/viewthread.php?tid=7637366&&。
(2)确定目的蛋白质的亚细胞定位。不知道亚细胞定位,可以从数据库自己查一下,或者用生物分子功能的预测软件加以预测。
参考:D. J. Rigden Edits, From Protein Structure to Function with Bioinformatics(2009)
http://emuch.net/bbs/viewthread.php?tid=6382178
如果是真核细胞,则一般应该确定蛋白质在细胞中的哪个细胞器或者细胞空间富集,然后在粗分离时现在粉碎细胞后,分离相关的细胞器(细胞裂解液中留下需要的有型的各种细胞器),或者细胞介质(细胞裂解液中去掉有型的各种细胞器),一般粉碎细胞后可以用离心的方法加以实现。
2.确定蛋白质的pI。首先要使用生物信息学方法,比如用DNAStar中的Protean,打开或者重建一个蛋白质的氨基酸序列文件,然后选择analysis-----&Titration Curve,分析其滴定曲线与等电点,显示出的曲线图为:横坐标为蛋白质的净电荷数,纵坐标为pH,会自动标出pI值。
3.确定目的蛋白质的亲水性和疏水性的大概的氨基酸残基的分布区域(这个操作不是必须的)。目的蛋白质的亲水性和疏水性的大概的氨基酸残基的分布区域预测,即预测蛋白质的序列中的可能存在的典型的亲水性区域和疏水性区域的氨基酸残基,有助于分析蛋白质序列的抗原表位。可以用BioEdit,启动BioEdit,选择File---&Open,再点击New Alignment,再选择Sequence ----&New Sequence,在窗口出现的地方选择序列的类型为protein,然后贴上蛋白质序列,然后扫一下序列,选择Sequence------&Protein ----&Kyte & Doolittle Mean Hydrophobicity Profile,在出现的窗口中点击Run Plot,会得到横坐标为氨基酸位点,总坐标为 Mean Hydrophobicity Profile 的坐标曲线图。另外,利用DNAstar的Protean也可以得到Hydrophobicity Profile,打开或者重建一个蛋白质的氨基酸序列文件,选择analysis-----&Show Available Methods,显示出More Methods,其中有Hydropathy-Kyte-Doolittle,其下面有:Hydrophobicity Plot,Hydrophobic Regions,Hydrophilicity Plot,Hydrophilic Regions 四种分类和相应的图标,根据操作界面的提示展开Hydropathy后会得到一个Hydrophobicity Plot,Hydrophobic Regions,Hydrophilicity Plot,Hydrophilic Regions 四种分类和相应的图标构成直线图,上面会显示出各个氨基酸的疏水和亲水性。
4.确定目的蛋白质的相对分子量。最简单的方法用质谱直接测定目的蛋白质的相对分子量。如果根本没有目的蛋白质,那么就用110X目的蛋白质的氨基酸残基总数。也可以用110X目的蛋白质的氨基酸残基总数后,再用SDS PAGE总可以测定出来目的蛋白质的较为精确的分子量,如果几条带比较接近,分别回收后测序即可确定哪一条带是目的蛋白质,实际上一般只需要对N末端测定大概15个左右的氨基酸残基就能确定了,当然,这步的前提是要大致提取出来目的蛋白质。用软件可以精确地计算出蛋白质的分子量,可以用ANTHEPROT,启动后进入antheprot Editor 窗口,把待测定的蛋白质的氨基酸序列文件拷贝进去即可,菜单上有很多的选项,根据需要,点击按键,比如Methods ,选择分子量,滴定曲线等,会得到相对分子量,PI等信息。这一步是必须的。
5.预测目的蛋白质的可能的空间三维形态。直接预测三级结构即可,这步对于分离提纯这一步不是必须的。
6.预测目的蛋白质的可能的相互作用的蛋白质。这一步也不是必须的,因为你可以直接制备单克隆抗体。
7.如果上游的基因表达部分的蛋白质的表达量是在太小,首先是要加大目的蛋白质的表达量,不然下游再如何努力也没有用。如果楼主一点要在很低浓度的目的蛋白质环境中提取和富集目的蛋白质,那么最好的一种方法是Protein equaliser technology,一种组合化学实验技术,原理上也亲和层析差不多,当然效率要高的多。
预测蛋白质的可能的空间三维形态和预测蛋白质的可能的相互作用的蛋白质的生物信息学方法请见:
确定蛋白质—多肽相互作用结合位点的实验设计:凌波丽个人总结之二
http://emuch.net/bbs/viewthread.php?tid=6739957&fpage=1&target=blank
上面附有参考文献预测三级结构的相关网站。
8.如果根本就没有办法获得目的蛋白质,而且这样的蛋白质还是全新的,也就是根本分离不到目的蛋白质,就别想拿到抗原,连WB也做不成,更别说亲合层析。那么怎么办?
一种方法通过生物信息学方法预测蛋白质的可能的相互作用的蛋白质,找出其受体或者与其有亲和性的蛋白质,作为亲和层析的配体,这就是有病!还可以通过表位的生物信息学预测,查找与其表位类似的其他蛋白质,用后者制备出多克隆抗原,作为亲合介质,然后对目的蛋白质进行亲和层析,这就是更加有病!最简单的办法没有亲和片段,自己接上去一段就是,就用His6标签,而且His6标签得基因与目的蛋白质的基因之间构建凝血酶位点,因为便于后期切除标签,用镍柱亲和层析,这在什么情况下都可以用。
二、蛋白质的分离提纯的一般顺序(这部分借鉴了我的一位朋友的工作笔记,并得到其许可使用和进行编辑修改)。
蛋白质的分离提纯由于不同的蛋白质的彼此差异较大,就普遍而言可能没有特定的分离纯化的固定顺序,不过仍然有一些可以参考的大致的分离纯化流程。因为我的实验工作是与重组蛋白质相关,所以就在这里讨论重组蛋白分离纯化的可作参考的大致的分离纯化流程。一般来说,重组蛋白质的分离纯化比天然蛋白质要容易一些。
一般蛋白质的分离纯化的一般顺序是:粉碎细胞或提取含有提取分泌到细胞外的表达产物的培养基、沉淀、过滤、初步浓缩(比如超滤)、中间纯化操作、最后采用高分辨率的纯化方法进行分离纯化、产物鉴定和保存。
第一步,粗分离。粉碎细胞或提取含有提取分泌到细胞外的表达产物的培养基、沉淀、过滤、初步浓缩(比如超滤)一般也叫粗分离。与天然蛋白质的分离纯化相比,重组蛋白质的分离纯化可以不用先去确定足量表达目的蛋白质的组织与细胞,并且先对这些组织和细胞进行分离和富集,另外由于大肠杆菌表达系统的广泛使用,重组蛋白质往往在大肠杆菌细胞中形成包涵体,如果不用分泌表达的话,这样粉碎了大肠杆菌细胞后只要过滤就可以获得固体的包涵体颗粒。即使要使用酵母细胞、动物细胞和植物细胞表达重组蛋白也往往需要先在大肠杆菌细胞等原核细胞中进行试表达。
如果不形成包涵体时,使蛋白质发生沉淀可使用、丙酮、硫酸铵、聚乙烯亚酰胺等化学试剂或者调节溶液的pH值至目的蛋白质的等电点获得沉淀并经过过滤而取出,然后在对沉淀物进行溶解,如果是耐高温的目的蛋白质可以通过加热使得其他蛋白质变性后沉淀,然后提取和保留上清液,上清液里即含有目的蛋白质。聚乙二醇对于浓缩非包涵体蛋白质是一种有效的试验方法,而且聚乙二醇很少使得蛋白质变性,真的变性了之后加入水溶解浓缩的蛋白质样品液,然后用适当孔径的超滤离心管除去聚乙二醇即可。
包涵体经过离心、沉淀、过滤获得后,也必须使得包涵体溶解,否则后面的分离提纯工作就无法进行了。
不易溶解于水的蛋白质可使用去垢剂或表面活性剂增溶 以便达到蛋白质溶解于水的目的,但是不要使用超声波把浑浊的蛋白质溶液“绞”成清亮状态,因为超声波的能量足以打断共价键,使得肽链断裂。不幸的是:一些实验操作者对于超声波发生器似乎有过于强烈的实验需求,可能是因为操作省事,反正强度适当且时间足够,开动超声波发生器肯定是能把浑浊的蛋白质溶液“绞”成清亮状态,超声波连带有肽聚糖细胞壁的大肠杆菌细胞都能粉碎,何况溶液中的蛋白质。简而言之,利用蛋白质的溶解度和抗热性与抗蛋白酶解等特殊性质分离出蛋白质一般是在第一步的粗分离阶段,而不在中间纯化和精细分离这两个步骤进行,粗分离过程也利用蛋白质的密度、分子量大小和形状的特性,蛋白质的后三种性质在后面的中间纯化和精细分离同样会利用到。利用蛋白质的溶解度与抗蛋白酶解等特殊性质有时候在蛋白质产物的质量检测阶段也可能用到。粗分离阶段已经能够去掉相当多的DNA、多糖、脂类、热源、病毒等非蛋白质的杂质成分,但是以后的分离纯化蛋白质的技术环节仍然必须考虑到去除非蛋白质的杂质成分。
第二步,中间纯化。中间纯化阶段一般是利用蛋白质的分子量、形状、电荷性质、等电点、疏水性、密度、与配体的结合能力、与金属的结合能力、与有机小分子(比如某些、染料分子)的结合能力等特性进行蛋白质产物的分离提纯。中间纯化的实验操作普遍地包括各种层析方法,比如离子交换层析、疏水层析、亲和层析、金属螯合层析、等电点聚焦、凝胶过滤层析等,也包括离心、透析、超滤等其他操作穿插其间,不过一般没有电泳,特别是在大规模分离提纯蛋白质时。SDS PAGE电泳一般不能用于分离提纯蛋白质,只能用于检测蛋白质,因为SDS PAGE电泳时,样品会100度水浴变性,而后加上足量的SDS,SDS变性蛋白质可能在除去SDS后使得蛋白质复性,但是热变性的蛋白质,在目前的条件下很难复性,除非后面是用质谱或者串联质谱进行检测,或者是进行WB检测,否则SDS PAGE电泳回收的目的蛋白质已经没有什么用处了。
各种层析方法,比如离子交换层析、疏水层析、亲和层析、等电点聚焦、凝胶过滤层析、金属螯合层析等在中间分离纯化阶段没有完全固定的顺序,虽然一般处理比较大量的样品时,离子交换层析、疏水层析一般先使用,但是有时在凝胶层析之后也可能会用到离子交换层析、疏水层析,比较普遍的情况而言,亲和层析、金属螯合层析不会首先在中间分离阶段的初始时期及使用。至少在我的工作经验,电泳从来没有用于过中间分离阶段,电泳是用于蛋白质的纯度检验阶段,当然不是唯一检测纯度的手段。中间纯化步骤比较多的是首先使用离子交换层析和疏水层析,而后根据具体情况,可使用等电点聚焦、凝胶过滤层析等其他的层析方法,离心、透析、超滤等其他操作根据需要而穿插其间。再往后可以用亲和层析和金属螯合层析,不要把亲和层析和金属螯合层析一开始就在中间纯化阶段使用,因为样品溶液中的杂质太多,会干扰受体-配体的专一性结合。
第三步是精细分离纯化。精细分离纯化一般是用凝胶过滤层析和HPLC,这样可以依靠蛋白质的分子量的差别得到比较纯的目的蛋白质产物,而且能够去盐和有机小分子(尤其是在亲和层析和金属螯合层析阶段积累的盐或有机小分子),HPLC过早使用效果不好,杂质过多可能会堵住柱内的填充介质。亲和层析和金属螯合层析一般而言,也不适合作为分离提纯蛋白质工作的最后一步(具体理由会面会讨论)。这三步结束时,一般目的蛋白质样品的浓度会有所降低,而且会有非缓冲溶液的其他的洗脱液,所以有必要用透析、超滤去除小分子和适当浓缩,以利用产物检测和保存。
第四步,产物鉴定。一方面需要检测目的蛋白质的纯度。蛋白质产物的纯度一般可以用SDS-PAGE、蛋白质的溶解度是否均一、HPLC、质谱、生物功能、肽谱分析等检测技术。实际上用红外傅里叶光谱、紫外光谱和圆二色光谱联合检测蛋白质的纯度更容易,而且不会损失样品,即用被检测蛋白质和标准品的有关光谱参数加以对比。另一方面要检测目的蛋白质中的热源、DNA、病毒等非蛋白质成分,特别是对于药用和食用蛋白质,可以用FTIR,MS,被检测的非目的蛋白质的杂质的生物活性检测等。第五步,产物保存。一般而言,如果不是冷敏性的蛋白质可使用冻干机制备为蛋白质干粉状制剂,然后放入0-4摄氏度的冰箱可长期保存,也可将蛋白质放入Eppendorf管,加入适量甘油和缓冲溶液(调节好浓度)后封口并贴上标签,再放入零下70摄氏度冰箱保存。对于冷敏性的蛋白质或者不知低温下是否稳定的蛋白质不能使用低温冻干处理,将蛋白质放入Eppendorf管,加入适量甘油和缓冲溶液(调节好浓度)后封口贴上标签,再放入零下70摄氏度冰箱保存,并且要分批小包装,避免反复冻融。(二、蛋白质的分离提纯的一般顺序部分借鉴了我的一位朋友的工作笔记,并得到其许可使用和进行编辑修改,再往下又是我自己写的了)
三、我对于楼主的目的蛋白质的分离纯化的实验设计的意见
楼主的目的蛋白质只要存在于细胞中,粗分离阶段粉碎细胞后,进行蛋白质的沉淀、超滤、离心处理后,然后只要知道了等电点,用离子交换层析或者疏水层析先处理以便缩小样品体积,根据蛋白质的亲水和疏水状况而定。之后,在知道相对分子量的情况下,用分子筛层析。再往后金属螯合层析或者抗体-抗原亲和层析,至此怎么着都能收获到一些目的蛋白质。最后还可以用HPLC,虽然HPLC不用于制备。楼主的蛋白质既然是癌细胞的糖蛋白质,那么再洗分离时可以使用凝集素亲和层析。另外在粗分离时首先分离癌细胞的你需要的细胞器。 生物信息学参考书:
1.DNA和蛋白质序列数据分析工具(第二版)PDF
http://emuch.net/bbs/viewthread.php?tid=6358121&fpage=1&target=blank
下载后即可阅读。
2.DNA和蛋白质序列数据分析工具_(第三版)
http://emuch.net/bbs/viewthread.php?tid=7614763&fpage=1&target=blank
下载后好像无法解压,楼主试试看吧,至少“DNA和蛋白质序列数据分析工具(第二版)”肯定能够用。
“DNA和蛋白质序列数据分析工具(第二版)”都是讲的生物信息学数据库和生物信息学软件的具体应用,很容易看懂并且自己上手操作,不过没有讲述各种算法的原理。
如果要更深入学习生物信息学,建议学习:
1.Pierre Baldi etal.,Bioinformatics------the Machine Learning Approach,MIT press,2001,千万不要看该书的翻译版本,翻译版烂的难以想象,翻译版就连条件概率的公式的含义都不知道怎么解释!
2. 2.M.Zvelebil ,J.O.Baum 著(2008),李亦学、郝沛 主译,理解生物信息学,科学出版社,2012,这本书的英文原版,我还没有见过,此书内容丰富,解析详细,但是让人非常不爽的是全书所有的数据库和软件下载处均未在正文中给出具体网址,而是每章末的参考文献中给出带有具体网址的SCI文献。
3.李霞、李亦学 主编,生物信息学学习指导与习题集,人民卫生出版社,2011,现在大陆唯一的一本生物信息学习题解答,包括上机题目中不少也有文字版本的具体解答。
4.M.Michael Gromiha,Protein Bioinformatics:From Sequence to Function,Elsevier,2001.
其他的参考文献请自行搜索。 : Originally posted by 凌波丽 at
生物信息学参考书:
1.DNA和蛋白质序列数据分析工具(第二版)PDF
http://emuch.net/bbs/viewthread.php?tid=6358121&fpage=1&target=blank
下载后即可阅读。
2.DNA和蛋白质序列数据分析工具_(第三版)
... 万分感谢!我慢慢研究下.其实我是想要一些:人的癌细胞细胞器分离以及糖蛋白提取的相关文献。
var cpro_id = 'u1216994';
欢迎监督和反馈:本帖内容由
提供,小木虫为个人免费站点,仅提供交流平台,不对该内容负责。欢迎协助我们监督管理,共同维护互联网健康,如果您对该内容有异议,请立即发邮件到
联系通知管理员,也可以通过QQ周知,我们的QQ号为:8835100
我们保证在1个工作日内给予处理和答复,谢谢您的监督。
小木虫,学术科研第一站,为中国学术科研研究提供免费动力
欢迎监督,发现不妥请立即
E-mail: & QQ:8835100第四章
核酸和蛋白质序列为基础的数据库检索
Needleman-WunschSmith-WatermanSIMFASTALALIGN
/PAMBLOSUMPAM250BLOSUM62BLOSUM90BLOSUM30BLOSUM90BLOSUM30
GenbankSWISS-PROTBLASTFASTA
InternetNCBIBLAST(Basic Local Alignment Search Tool)DNABLASTBLASTBLASTNBLASTPTBLASTN6BLASTX6Altschul S.F.1997PSI-BLASTPosition-Specific
Iterated BLASTPSI-BLASTBLASTBLAST
DNADNADNABLASTX6DNATBLASTNGenBankEMBLDDBJ DNADNADNA
BLASTKarlin-AltschulPoisson
BLASTFASTANCBIWebBLASTBLAST
BLASTFASTAFASTA“&”80IUB/IUPAC“-”“U”“*”(“N”“X”)ACGTURGA()YTC()KGT()MAC()SGC()WAT()BGTCDGATHACTVGCANAGCT20BAspAsnUZGluGlnX“*”
BLASTFASTA
WORDLENGTH()
BLAST(scanning)(word,)(AA)(WAT)(high-scoring segment pairs, HSP)BLASTHSP(scanning)BLASTW(WORDLENGTH)BLASTWBLAST11BLASTN1111()11
BLAST2.0(low compositional complexity)(Alu)N(NNNNNN)N(IUB-code)FilterONA
(EXPECT)1010(E)(10)
EMBL(ID)GenBank(accession number)()PCRBLAST
FASTAFASTAFASTAEFASTA
FASTA Smith-WatermanBlitzBLITZemail EBIMPsrch 4ScanPS蛋白质数据库介绍_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
11页1下载券25页免费15页2下载券2页4下载券5页2下载券 8页免费5页3下载券27页免费62页2下载券29页7下载券
喜欢此文档的还喜欢8页免费15页2下载券61页1下载券83页1下载券5页2下载券
蛋白质数据库介绍|介​绍​目​前​国​际​上​的​蛋​白​质​数​据​库​的​网​址​、​内​容​等​信​息
把文档贴到Blog、BBS或个人站等:
普通尺寸(450*500pix)
较大尺寸(630*500pix)
你可能喜欢

我要回帖

更多关于 数据集群 的文章

 

随机推荐