如何通过生物信息学手段确定如何下载基因组序列中编码序列,非编码序列

中科院生物信息学复习题_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
中科院生物信息学复习题
上传于||暂无简介
阅读已结束,如果下载本文需要使用1下载券
想免费下载本文?
下载文档到电脑,查找使用更方便
还剩6页未读,继续阅读
你可能喜欢随笔分类 - [25] 生物信息学
计算生物信息学,计算生物学,生物统计学,生物数学,分子生物学,遗传学,医学遗传学
摘要: 使用tophat和cufflinks计算RNA-seq数据的表达水平时,当一个基因在一个样本中有多个表达水平时需要合并它们的表达水平。 This code is a solution to collapsing duplicate FPKMs for a gene. CollapseFPKM Col
emanlee 阅读(17) |
摘要: 在SAM输出的结果中每一行都包括十二项通过Tab分隔,从左到右分别是: 1 序列的名字(Read的名字) 2 概括出一个合适的标记,各个数字分别代表 1 序列是一对序列中的一个 2 比对结果是一个pair-end比对的末端 4 没有找到位点 8 这个序列是pair中的一个但是没有找到位点 16 在这
emanlee 阅读(74) |
摘要: Cole Trapnellsaid:there are three strategies:1) merge bams and assemble in a single run of Cufflinks2) assemble each bam and cuffcompare them to get a...
emanlee 阅读(141) |
摘要: Lift genome positionsGenome positions are best represented inBED format. UCSC provides tools to convert BED file from one genome assembly to another.B...
emanlee 阅读(122) |
摘要: library(GenomicAlignments)
emanlee 阅读(45) |
摘要: samtools flagstat /SRA111111/SRR111222/accepted_hits.bam + 0 in total (QC-passed reads + QC-failed reads) (1)0 + 0 duplicates + 0 mapp...
emanlee 阅读(164) |
摘要: mycount=`cat SRR108114_new_1.fastq | wc -l` echo 'Number of clean reads, SRR108114_new_1.fastq: '$((mycount/4)) && SRR108114.stat mycount=`cat SRR1081...
emanlee 阅读(107) |
摘要: Systematic LncRNA ClassificationFrom: /Services/Services_main.asp?ID=307Analyzing the genomic context of LncRNAs can help pred...
emanlee 阅读(111) |
摘要: -------------------------------Long noncoding RNAs are rarely translated in two human cell lines.(蛋白,多肽)Bánfai B, Jia H, Khatun J, Wood E, Risk B, Gun...
emanlee 阅读(364) |
摘要: 长链非编码RNA(lncRNA)转自:.cn/s/blog_909dabkz.html长链非编码RNA(lncRNA)是一类转录本长度超过200nt的RNA分子,它们并不编码蛋白,而是以RNA的形式在多种层面上(表观遗传调控、转录调控以及转录后...
emanlee 阅读(243) |
摘要: 转自:.cn/s/blog_pab7.html权威发布:长链非编码RNA命名规则对于人类基因命名标准的制定而言,雨果基因命名委员会(HGNC)是唯一官方授权的机构。HGNC的数据库中有38000个基因名称,其中大部分是编码蛋白基因;但H...
emanlee 阅读(702) |
摘要: GBrowse配置相关资料(形状、颜色、配置、gff3)http://gmod.org/wiki/Glyphs_and_Glyph_Optionshttp://gmod.org/wiki/GBrowse_Configuration/Glyphshttp://gmod.org/wiki/GBrowse...
emanlee 阅读(55) |
摘要: [1] bedtools (/arq5x/bedtools2)here is also bedtools (/arq5x/bedtools2) getfasta. It uses Erik's code under the ho...
emanlee 阅读(178) |
摘要: Use a regular expression for filtering sequences by id from a FASTA file, e.g. just certain chromosomes from a genome. There are other toolsas part of...
emanlee 阅读(84) |
摘要: bgzip – Block compression/decompression utilitytabix – Generic indexer for TAB-delimited genome position filesSAMtoolsandBCFtoolsare distributed as in...
emanlee 阅读(382) |
摘要: VCF文件示例(VCFv4.2)##fileformat=VCFv4.2##fileDate=##source=myImputationProgramV3.1##reference=file:///seq/references/1000GenomesPilot-NCBI36.fast...
emanlee 阅读(3016) |
摘要: R, BioconductorfilterVcf: Extract Variants of Interest from a Large VCF File (Paul Shannon)We demonstrate three methods: filtering by genomic region, ...
emanlee 阅读(174) |
摘要: The C++ executable module examplesThis page provides usage examples for the executable module. Extended documentation for all of the options can be fo...
emanlee 阅读(1744) |
摘要: 如果是Linux系统,随意打开一个终端;如果用的是Windows系统,那么打开命令提示符。输入以下命令:perldoc Bio::SeqIO以上命令的作用是查看Bio::SeqIO模块的文档是否存在,如果存在,则会有相应的文档输出,则安装了Bio::SeqIO模块;如果没有,说明Perl找不到该模块...
emanlee 阅读(141) |
摘要: samtools的说明文档:http://samtools.sourceforge.net/samtools.shtml samtools是一个用于操作sam和bam文件的工具合集。包含有许多命令。以下是常用命令的介绍 1. view view命令的主要功能是:将sam文件转换成bam文件;然后对b
emanlee 阅读(3248) |
摘要: bwa的安装流程安装本软体总共需要完成以下两个软体的安装工作:1) BWA2) Samtools1.BWA的安装a.下载BWA (download from BWA Source Forge )http://bio-bwa.sourceforge.net/bwa.shtmlb.安装BWA$ tar ...
emanlee 阅读(1204) |
摘要: 0.以下在系统CentOS 6.3 x86_64上操作1.试图运行程序,提示&libc.so.6: version `GLIBC_2.14' not found&,原因是系统的glibc版本太低,软件编译时使用了较高版本的glibc引起的:[ghui@StuOSbin]$pwd/var/VMdisk...
emanlee 阅读(13562) |
摘要: 错误:./mafsInRegion: error while loading shared libraries: libmysqlclient.so.15: cannot open shared object file: No such file or directory解决方法:1.下载 libm...
emanlee 阅读(3067) |
摘要: 命令行:~/sratoolkit/sratoolkit.2.3.2/bin/fastq-dump --split-spot --gzip xxxx.sra报错信息:fastq-dump.2.3.2 err: name not found while resolving tree within vir...
emanlee 阅读(558) |
摘要: tophat输出结果junction.bedBED formatBED format provides a flexible way to define the data lines that are displayed in an annotation track. BED lines have ...
emanlee 阅读(1322) |
摘要: sra是NCBI 推出的存储高通量数据的格式,而平常我们工作用得多是fastq格式。如果需要把sra 转成fastq,从 http://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?cmd=show&f=software&m=software&s=softwar...
emanlee 阅读(3331) |
摘要: 接前一篇: 用R和BioConductor进行基因芯片数据分析(五):芯片间归一化 经过一系列的预处理,包括缺失值填充,中位数计算以及归一化,我们的数据终于可以用啦。 下面我们就来分析一下new population和old population的个体是否有差异表达基因。 判断一个基因是否差异表达有许多方法,最早使用的就是看log ratio的绝对值是否大于2,这种方法早已废弃。 下一个想...
emanlee 阅读(4072) |
摘要: 接前一篇:用R和BioConductor进行基因芯片数据分析(四):芯片内归一化 上次进行了芯片内的归一化,但是我们的数据来自于10张芯片,为了让这10张芯片之间有可比性,需要进行芯片间归一化。 具体原理就不介绍了。 这里用到Bioconductor的一个package,叫做limma,以及其中的函数normalizeBetweenArrays() 由于normalizeBetweenAr...
emanlee 阅读(2601) |
摘要: 接前一篇: 用R和BioConductor进行基因芯片数据分析(三):计算median 归一化是从normalization翻译过来的。归一化的目的是使各次/组测量或各种实验条件下的测量可以相互比较,消除测量间的非实验差异。非实验差异可能来源于样品制备,点样,杂交过程,杂交信号处理等。 归一化的方法有很多,对于寡聚核苷酸芯片(单通道,以Affymetrix为代表)和cDNA芯片(双通道,红绿染...
emanlee 阅读(3856) |
摘要: 接前一篇: /emanlee/archive//2803144.html 我们已经知道要分析的数据对每个基因有3个重复测定值,经过缺失值填充后,每个基因都有3个可用值。 这一步很简单,就是取这3个值的中位数,即median。 方法很多,在excel中可以用median函数; 在R中以下代码进行操作: get_media...
emanlee 阅读(1788) |
摘要: 以下分析用到的数据可以在这里(/u/308058/blog/raw_data_3_replicates.txt )下载,这个数据来自关于基因对蝴蝶迁移性的研究,样本是20个蝴蝶个体,其中10个是当地固有个体(old),另外10个是新迁入的个体(new),old和new个体两两随机配对,分别用不同颜色染料(波长分别为555和647nm)标记后,在同一张基因芯片上杂交;此外,每个基因在每张芯片上都重复点样3次,因此此数据是有3个replicates及10张芯片的双通道芯片。数据是样点的信号强度值,没有经过标准化处理的。拿到数据你会看到许多”NA”,这
emanlee 阅读(3011) |
摘要: R是开源的统计计算和作图语言,与S语言很相似。R的语法与其他语言很相似,功能很强大,可以到这里看看截图。主页是 http://www.r-project.org/ 可以点击这里下载R,这里有很权威的英文教程。本站提供几本中文教程(pdf)的打包下载,更多的随便搜索一下就可以找到。 BioConductor是建立在R语言环境上的生物芯片数据和基因组数据分析软件包,主页是 http://www...
emanlee 阅读(3500) |
摘要: bioconductor 包的安装安装R,并启动R。 & source(&http://bioconductor.org/biocLite.R&) & biocLite() Using R version 2.10.0 (R-devel), biocinstall version ...
emanlee 阅读(3435) |
摘要: GenePix Pro 3.0 是由 Axon Instruments() 公司所开发之快速且具高质量的 DNA 微数组扫瞄工具,它也提供微数组数据的获取和分析软件。 GenePix 4000 系列扫瞄器利用同步双雷射(dual-laser)扫瞄系统及时产生比例影像(ratio image),此比例影像是标准的 24 位红、绿、蓝色合成影像,它们的内定值分别为 635、5...
emanlee 阅读(421) |
摘要: SMD Schema SpecificationsColumn NameData TypeLengthNull?DescriptionREPORTER_COUNTNUMBER20YESLOG_REPORTER_COUNTNUMBER20,5YESSEQ_GENE_COUNTNUMBER20YESSEQ_COVERAGENUMBER35,25YESLOG_SEQ_RPKM_VALUENUMBER35,25YESPROBE_CATEGORYNUMBER3YESSEQ_RPKM_VALUENUMBER35,25YESCH1DL_MEANNUMBER20YESCH2DL_MEANNUMBER20YES
emanlee 阅读(242) |
摘要: Tags in a [Term] stanza The OBO Flat File Format Specification, version 1.0Required tagsid The unique id of the current term. This can be any string. This tag must always be the first tag in any term description Example: id: CAR:0000001 name The term name. Any term may only have one name defined. If
emanlee 阅读(392) |
摘要: This diagram would be interpreted as follows: A is a B B is part of C we can infer that A is part of C The is a relation The is a relation in GO is very simple: if we say A is a B...
emanlee 阅读(125) |
摘要: ABS:Annotated regulatory binding sites from orthologous promoters:http://genome.imim.es/datasets/abs2005/abs.html ACTIVITY:Functional DNA/RNA site activity:http://wwwmgs.bionet.nsc.ru/mgs/systems/a...
emanlee 阅读(2694) |
摘要: Similar to other algorithm, K-mean clustering has many weaknesses: 1 When the numbers of data are not so many, initial grouping will determine the cluster significantly. 当数据数量不是足够大时,初始化分组很大程度上决定...
emanlee 阅读(2184) |
摘要: 来自哈尔滨医科大学生物信息科学与技术学院李霞教授课题组在《Nucleic Acids Research》杂志在线发表题为“MiRNA–miRNA synergistic network: construction via co-regulating functional modules and disease miRNA topological features”的文章,该文章提出了基于共调...
emanlee 阅读(632) |
摘要: 动物所piRNA的高精度预测算法研究获得突破 第二代测序技术又称作深度测序技术,应用到RNA上统称作RNA-seq或RNA测序,它已成为基因表达和转录组分析的重要手段。第二代转录组测序数据中含有大量不编码蛋白质的ncRNA序列,因为它们像宇宙中的暗物质一样难以识别和有重要功能,也被称为“基因组暗物质”。由于数据量巨大,保守性差,又有噪音干扰,这些“暗物质”的识别成为表观遗传学和调控网络研究的瓶...
emanlee 阅读(129) |
摘要: 德国多个研究机构的研究人员绘制了来自病人血液的miRNA表达谱,其中包括自体免疫疾病、癌症、心血管疾病以及慢性炎症患者。该研究成果发表在9月4日的《自然—方法学》(Nature Methods)在线版上。 在一项多中心研究中,研究人员对患病个体的454个血液样本进行芯片分析,确定了863个microRNA的表达谱,并利用实时定量PCR验证了此miRNA组(miRNome)。他们检测了所有疾病的...
emanlee 阅读(143) |
摘要: RNAfold是预测序列二级结构的软件。 本地版下载地址: http://www.tbi.univie.ac.at/~ivo/RNA/windoze/ 在上面网址中还有其他预测结构的软件可供下载。现在主要介绍一下本地下载版的使用方法: 1.不能够双击应用程序,若双击RNAfold.exe应用,只能手动输入序列,而且只能一条一条输入,极其麻烦。 2.应该在Dos...
emanlee 阅读(3565) |
摘要: megablast 采用贪婪式算法,速度较一般blast快,多用于数据量大且序列相似性较高的情况。megablast 参数说明./megablast --helpmegablast 2.2.11 arguments: -d Database [String] default = nr -i Query File [File In] -e Expectation value [Real] default = 10.0 -m alignment view options: 0 = pairwise, 1 = query-anchored showing i...
emanlee 阅读(1673) |
摘要: formatdb is an outdated software tool in molecular bioinformatics to format protein or nucleotide databases for BLAST. It has been replaced by the tool makeblastdb and the NCBI &strongly encourage[s]& users to stop using formatdb.The formatdb.exe program is part of the BLAST release, which
emanlee 阅读(4855) |
摘要: What is Bowtie 2? Bowtie 2 is an ultrafast and memory-efficient tool for aligning sequencing reads to long reference sequences. It is particularly good at aligning reads of about 50 up to 100s or 1,0...
emanlee 阅读(230) |
摘要: 解读报告前需要掌握的概念 alignments 代表比对上的两个序列 hits 表示两个序列比对上的片段 Score 比对得分,如果序列匹配上得分,不一样,减分,分值越高,两个序列相似性越高 E Value 值越小,越可信,相对的一个统计值。 Length 输入序列的长度 Identities 一致性,就是两个序列有多少是一样的 Query 代表输入序列...
emanlee 阅读(782) |
摘要: 安装Randfold 软件下载:http://bioinformatics.psb.ugent.be/supplementary_data/erbon/nov2003/ 安装:tar zxvf randfold.tar.gz cd randfold-2.0 make cp randfold /usr/local/bin ...
emanlee 阅读(482) |
摘要: 1 什么是肿瘤
肿瘤由于机体组织遗传性改变而产生的具有相对自主性增生能力的细胞群,又称新生物。肿瘤组织由癌细胞及间质构成,癌细胞是由正常细胞转化来的异常增生细胞,肿瘤可发生在人体的许多器官和组织。 2 肿瘤如何分类
根据肿瘤对人体危害的大小及其生长特性而分为良性肿瘤和恶性肿瘤两类。
良性肿瘤生长缓慢,呈膨胀性生长,表面常有完整包膜,除局部症状外较少全身症状,不向周围组织浸润也不向全身转移,...
emanlee 阅读(765) |
摘要: 肿瘤的生长可以分为两个时期,即无血管期和有血管期。无血管期的肿瘤细胞主要靠弥散的方式来吸收营养和氧气,瘤体生长缓慢,通常长到1毫米大时,仅仅依靠弥散吸收营养和氧气就难以维持瘤体的生长需要了。此时,肿瘤细胞就会分泌出一些化学物质,激活血管内皮细胞生长因子,促使肿瘤血管新生,一旦肿瘤血管出现,肿瘤吸收营养和氧气的方式就由弥散式转为灌注式,营养和氧气大量供给,肿瘤生长进入快速增殖期。
肿瘤血管生成 h...
emanlee 阅读(119) |
摘要: 生物信息学与生物计算:http://bioinformatics.weizmann.ac.il/ 这是生物信息学和生物计算学的网站,由Weizmann科学研究所,生物服务部和Crown人类基因组学中心支持。研究领域主要涵盖序列分析,蛋白质组学和基因组学等。该网站提供了数据库,电子论坛,教育,新闻,软件,招聘启事等。该网站还提供了相关链接,包括欧洲分子生物学以色列国家网点,以色列国家基因组基础设施实...
emanlee 阅读(5234) |
摘要: 为了查找某个研究领域的相关信息,生物学家往往要花费大量的时间,更糟糕的是,不同的生物学数据库可能会使用不同的术语,好比是一些方言一样,这让信息查找更加麻烦,尤其是使得机器查找无章可循。Gene Ontology就是为了解决这种问题而发起的一个项目。 Gene Ontology中最基本的概念是term。GO里面的每一个entry都有一个唯一的数字标记,形如GO:nnnnnnn,还有一个term名,比如&cell&, &fibroblast growth factor receptor binding&,或者&signal transduction
emanlee 阅读(4496) |
摘要: http://blog.csdn.net/casularm/article/details/2793747
emanlee 阅读(408) |
摘要: rasmol软件简介及详细使用说明: 目前在结构生物学领域有许多图形显示的程序,每个都有自己不同的特点。可能很多人知道rasmol,除了图形界面中的一些功能外,该程序的命令行方式有着很强大的功能。下面将介绍一些常用的使用方法。 Rasmol(http://www.openrasmol.org/)程序有多种版本,有unix, windows, Mac等。另外还有一个windows和linux版本ht...
emanlee 阅读(2662) |
摘要: In genetics, complementary DNA (cDNA) is DNA synthesized['sinθisaiz] from a mature mRNA template in a reaction catalyzed['kæt?laiz] by the enzyme reverse transcriptase and the enzyme DNA polymerase. c...
emanlee 阅读(107) |
摘要: 以前上课学的C/C++/Java/C#/汇编 。自学的perl/python/matlab/R/等等。其实用什么语言搞科研主要看老板,我最初老板和组里其他人都用perl,我也学perl。这样方便大家交换程序。现在的老板用python,我就开始学python了。其实觉得bioinformatics的本科都会教c或者java,会了c/java其中任何一个,再学perl或者python或者matlab就都是非常容易的。现在这个领域里用的最多的我觉得是python,正在慢慢取代perl。matlab因为不免费,流行不广不如python,perl,java。但是我觉得确实最方便最适合搞计算方面研究的(如
emanlee 阅读(2504) |
摘要: 小干扰RNA(Small interfering RNA;siRNA)有时称为短干扰RNA(short interfering RNA)或沉默RNA(silencing RNA),是一个长20到25个核苷酸的双股RNA,在生物学上有许多不同的用途。目前已知siRNA主要参与RNA干扰(RNAi)现象,以带有专一性的方式调节基因的表达。此外,也参与一些与RNAi相关的反应途径,例如抗病毒机制或是染色...
emanlee 阅读(157) |
摘要: Antisense RNA与靶核酸(如mRNA或有义DNA)链互补的RNA分子,可抑制靶核酸的功能。反义RNA,根据反义RNA的作用机制可将其分为3类:Ⅰ类反义RNA直接作用于靶mRNA的S D序列和(或)部分编码区,直接抑制翻译,或与靶mRNA结合形成双链RNA,从而易被RNA酶Ⅲ 降解;Ⅱ类反义RNA与mRNA的非编码区结合,引起mRNA构象变化,抑制翻译;Ⅲ类反义RNA则直接抑制靶mRNA的转录。调节水平反义RNA靶RNA分类功能来源转录后水平micF RNAompF mRNA1AOmpF合成染色体 oop RNAcⅡmRNA1B溶菌-溶源噬菌体 sar RNAantmRNA1A溶菌-溶
emanlee 阅读(1238) |
摘要: kb=千碱基 kilobase nt=核苷酸 nucleotide bp=碱基对 base pair
emanlee 阅读(2380) |
摘要: 定义 聚合酶链式反应,其英文Polymease Chain Reaction(PCR)是体外酶促合成特异DNA片段的一种方法,由高温变性、低温退火及适温延伸等几步反应组成一个周期,循环进行,使目的DNA得以迅速扩增,具有特异性强、灵敏度高、操作简便、省时等特点。它不仅可用于基因分离、克隆和核酸序列分析等基础研究,还可用于疾病的诊断或任何有DNA,RNA的地方.聚合酶链式反应又称无细胞分子克隆或特异性DNA序列体外引物定向酶促扩增技术。工作原理 类似于DNA的天然复制过程,其特异性依赖于与靶序列两端互补的寡核苷酸引物。PCR由变性--退火(复性)--延伸三个基本反应步骤构成:①模板DNA的变性:
emanlee 阅读(263) |
摘要: 定义:某一物种的染色体图谱(也就是我们所知的连锁图谱),显示所知的基因和/或遗传标记的相对位置,而不是在每条染色体上特殊的物理位置。 如果同一条染色体上的两个基因相对距离越长,那么他们减数分裂发生重组的概率将越大,共同遗传的概率也就越小。因此可以根据他们后代性状的分离可以判断他们的交换率,也就可以判断他们在遗传图谱上的相对距离。通过遗传重组所得到的基因在具体染色体上线性排列图称为遗传连锁图。它是通过计算连锁的遗传标志之间的重组频率,确定他们的相对距离,一般用厘摩(cM,即每次减数分裂的重组频率为1%)来表示。绘制遗传连锁图的方法有很多,但是在DNA多态性技术未开发时,鉴定的连锁图很少,随着DN
emanlee 阅读(218) |
摘要: DNA微阵列(DNA Microarray)也叫寡核苷酸阵列(Oligonucleitide array),是人类基因组计划(Human Geneome Project,HGP)的逐步实施和分子生物学的迅猛发展及运用的产物,它是生物学家受到计算机芯片制造和广为应用的启迪,融微电子学、生命科学、计算机科学和光电化学为一体,在原来核酸杂交(Northern、Southern)的基础上发展起来的一项新技术,它是第三次革命(基因组革命)中的主要技术之一,是生物芯片中的一种。该技术的原理是在固体表面上集成已知序列的基因探针,被测生物细胞或组织中大量标记的核酸序列与上述探针阵列进行杂交,通过检测相应位置杂
emanlee 阅读(1236) |
摘要: 微阵列数据广泛而成功地应用于生物医学的癌症分类研究.一个典型的微阵列数据集包含大量(通常成千上万 ,甚至数十万)的基因、 相对少量(往往不足一百)的样本.在这成千上万的基因中 ,仅仅一少部分基因对癌症分类有贡献.因而,对于癌症分类来说,最重要的一个问题就是识别出对癌症分类最有贡献的基因.这一识别过程称为基因选择.基因选择在统计模式识别、 机器学习和数据挖掘领域已得到广泛研究.基因微阵列数据通常包含大量与肿瘤分类无关的数据,会严重降低肿瘤诊断的准确率;基因微阵列数据还存在小样本、高维度的问题,也增加了肿瘤诊断的难度,所以必须对其进行基因选择。
emanlee 阅读(150) |
摘要: LOD值 LOD score 定义:确定两个基因座是否在染色体上距离很近,因此可能一起遗传的统计学评估。三个或更多的LOD评价通常显示了两个基因座的位置很紧密。 详解:遗传学上通常用或然率的常用对数作为标准的衡量方法,该值的对数值称为Lod值或对数优势比:根据两个非此即彼的假设,计算数据的整体或然性,以确定两个基因座或是按一定的重组率而相互连锁的可能性或是互不连锁的可能性;这两种可能性之比,是基因座实际上为连锁的可能性;这个比率的10作底的对数就是对数优势比。为了确定两对基因之间是否存在连锁,一般要求或然比大于1000:1,即Lod&3;而要否定连锁存在,则要求或然小于100:1,即Lo
emanlee 阅读(1574) |
摘要: 什么是SSLP和ISSR?简单序列长度多态性(simple sequence length polymorphism,SSLP)是据串联重复排列微卫星基序两侧的单一序列设计引物,对微卫星序列(microsatellite DNA或simple sequence repeats,SSR)进行扩增,由微卫星基序重复数目的变异而产生多态性。由于基因组中某一特定的微卫星的侧翼序列通常都是保守性较强的单一序列,因而可以将微卫星侧翼的DNA片段克隆、测序,然后根据微卫星的侧翼序列就可以人工合成引物进行PCR扩增,从而将单个微卫星位点扩增出来。由于单个微卫星位点重复单元在数量上的变异,个体的扩增产物在长度上
emanlee 阅读(186) |
摘要: ROC曲线的意义 ROC曲线指受试者工作特征曲线(receiver operating characteristic curve), 是反映敏感性和特异性连续变量的综合指标,是用构图法揭示敏感性和特异性的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列敏感性和特异性,再以敏感性为纵坐标、(1-特异性)为横坐标绘制成曲线,曲线下面积越大,诊断准确性越高。在ROC曲线上,最靠近坐标图左上方的点为敏感性和特异性均较高的临界值. SPSS统计软件包的10.0版本有ROC曲线的统计功能。ROC曲线真阳性率为纵坐标,假阳性率为横坐标,在座标上由无数个临界值求出的无数对真阳性率和假阳性率作
emanlee 阅读(1203) |
摘要: Acceptor splice site --- The boundary between the 3’ end of an intron and the 5’ end of the following exon. Also called 3’ splice site.剪接受体位点:内含子3′末端与下一个外显子5′端之间的交界处。又称3′剪接位点。Acrocentric --- A type of chromosome with the centromere near one end. The human acrocentric chromosomes (13, 14, 15, 21, and
emanlee 阅读(206) |
摘要: Relative risk --- A comparison of the risk for a disease or trait in individuals who share a particular factor (such as genotype, an environmental exposure, or a drug) versus the risk among individuals who lack the factor. Affected Unaffected TotalFactor present a b a+bFactor absent c d c+dTotal a+c
emanlee 阅读(130) |
摘要: Spectral karyotyping (SKY) --- A procedure that uses the fluorescence in situ hybridization (FISH) technique to stain each of the 24 human chromosomes distinctively.图谱核型分析(SKY):用荧光原位杂交(FISH)技术,对 24条人类染色体进行各自染色。Splicing --- The splicing out of introns and splicing together of exons in the generation
emanlee 阅读(113) |
摘要: Pharmacodynamics --- The effects of a drug or its metabolites on physiological function and metabolic pathways.药效学:药物或其代谢物在生理功能和代谢途径中的作用Pharmacogenetics --- The area of biochemical genetics concerned with the impact of genetic variation on drug response and metabolism.药物遗传学:主要研究遗传因素对物种内不同个体的药物吸收、分布、
emanlee 阅读(221) |
摘要: Microarray --- Miniaturized wafer (“chip”) made of glass, plastic, or silicon onto which a large number of different nucleic acids have been individually spotted. See also CGH, expression profile.微阵列:点阵分布有大量核苷酸的微小芯片。参见CGH,表达谱。Microdeletion --- A chromosomal deletion that is too small to be seen unde
emanlee 阅读(169) |
摘要: Immunoglobulin gene superfamily --- A family of evolutionarily related genes composed of human leukocyte antigen (HLA) class I and class II genes, immunoglobulin genes, T-cell receptor genes, and other genes encoding cell surface molecules.免疫球蛋白基因超级家族:进化上同源的基因家族,包括HLA I类和II类基因、免疫球蛋白基因、T细胞受体基因以及其它编码细
emanlee 阅读(239) |
摘要: Gene flow --- Gradual diffusion of genes from one population to another across a barrier. The barrier may be physical or cultural and may be breached by migration or mixing.基因流:由于合子或配子的散布,基因从某一群体扩散到其它群体,从而引起等位基因频率改变的现象。Gene map --- The characteristic arrangement of the genes on the chromosomes. 基因图:
emanlee 阅读(211) |
摘要: Deformation syndrome --- A recognizable pattern of dysmorphic features caused by extrinsic factors that affect the fetus in utero.变形综合征:子宫中因外部因素影响胎儿而导致的一种畸形。Degeneracy of the code --- The genetic code is described as degenerate because most of the 20 amino acids are specified by more than 1 of the 6
emanlee 阅读(169) |
摘要: CG (or CpG) island --- Any region of the genome containing an unusually high concentration of the dinucleotide sequence 5’-CG-3’. Often associated with promoters of genes, in particular housekeeping genes.CG(或CpG)岛:含双核苷酸序列5’-CG-3’较多的区域。通常与基因(尤其是持家基因)的启动子有关。CGH --- See comparative genome hybridizatio
emanlee 阅读(310) |
摘要: 1、数学:高数(上册,下册)、线代、概率论、随机过程,离散数学;2、生物:普通生物学、生物化学、分子生物学、细胞生物学、遗传学、基因组学、蛋白组学等;3、计算机:计算机基础、C语言、C++、JAVA、Perl、数据结构、数据库、数据挖掘、计算机算法、软件工程。这是最基本的,根据方向还有其他很多要学习的。
emanlee 阅读(387) |

我要回帖

更多关于 ncbi基因组序列 的文章

 

随机推荐